DataCleaner artırmak ve verilerin kalitesini ölçmek isteyen kuruluşlar ve işletmeler için bir açık kaynak ve tamamen ücretsiz bir çözümdür.
DataCleaner ile kullanıcılar, profil karşılaştırmak, iş kurallarına aykırı verileri doğrulamak ve zamanla bu ölçümlerin ilerlemesini izlemek mümkün olacak.
özellikleri arasında, çoğaltır, müşteri veri kalitesi yanı sıra süper hızlı ETLightweight (Extract-Transform-Load) algılamak ve birleştirme, veri izleme, veri profilleme ve DQ analizi, veri temizleme ve zenginleştirme sayabiliriz.
hem de onunla çalışmak için ne gibi DataCleaner fonksiyonları ve yetenekleri hakkında daha fazla bilgi edinmek için, http://eobjects.dk/docs
What başvurun yeni Bu sürümde:
- gelişmeler ve yeni özellikler:
- mümkün oluşturmak ve DataCleaner masaüstü arayüzü üzerinden tabloları bırakmak için yaptık. Not teriminin bu, masanın & quot; Burada aslında sadece ilişkisel veritabanı tabloları daha kapsar. Ayrıca CouchDB ve ElasticSearch MS Excel yavaş değişen Tablolar, MongoDB derlemeleri, Belge türlerini içerir ve böylece ... Temelde gibi CSV yavaş değişen olarak tek tablo yavaş değişen hariç yazma işlemleri, destekleyen tüm veri deposu türleri, bu işlevi destekleyen! işlevselliği aracılığıyla maruz:
- & quot; tablo oluştur & quot; Uygulamanın sol tarafındaki ağaç şemalar sağ tıklama menüsü ile sağladı.
- & quot; tablo oluştur & quot; masa, Masa arama ve Güncelleme tabloya Ekleme gibi bileşenler tablo seçimi girişler üzerinden de sağladı.
- & quot; Bırak masa & quot; Uygulamanın sol tarafındaki ağaç tabloları sağ tıklama menüsü ile sağladı.
- Biz Salesforce.com web hizmeti Endpoint URL belirterek (isteğe bağlı) yeteneği ekledik. Bu, kendi özel bitiş noktaları yanı Salesforce.com sanal alan ortamlarına bağlanmak için DataCleaner kullanmanıza olanak sağlar.
- ElasticSearch destek özel eşlemelerini izin yanı sıra arama ve indeksleme için şimdi de ElasticSearch veri deposu tanımları yeniden kullanmak, geliştirilmiştir.
- kayıtları ve yinelenen algılama fonksiyonu potansiyel çiftleri seçimi örnekleme eğitim oturumu sırasında alınan kararlar daha fazla temsilcisi olduğundan daha hızlı yapılandırmaya giden, geliştirilmiştir.
- Yinelenen algılama modeli dosya formatı geçmiş eğitim kararları kaydetmek için ayrı bir 'referans' dosyası için gereğini ortadan kaldırmıştır hangi güncellendi. Eski formatta ile uyumluluk muhafaza, ancak yeni biçimini kullanarak bir kullanıcı deneyimi için birçok faydalar ekler edilmiştir.
- Bugfixes:
- Bir iş parçacığı açlık sorunu DataCleaner monitörde giderilmiştir. Bu konuda etkisi büyük oldu, ama sadece nadir ve çok özel durumlarda oldu. Özel dinleyici bir hata atmak DataCleaner monitörde itiraz etmesi halinde, bu asla kadar serbest ve sunucu üzerinde Kuvars-zamanlama havuzundan bir iş parçacığı alarak varlık bir kaynak neden olur. Bu birçok kez olur, sunucu sonunda o havuzda parçacığı tükendi olabilir.
- sonuç ekranında dikey menü şimdi sonuçlar bileşenlerin etiketleri görüntüleme düzgün bir iş yapıyor. Bu daha kolay olan menü öğesi puanları nasıl sonuç öğesine tanımak için yapar.
sürüm 3.5.5 yeni Nedir:
- 'Eşanlamlı arama' dönüşüm artık bir seçeneği vardır girdi her belirteci bakmak için. Uzun bir metin alanının değerleri içinde eş değiştirilmesini yapıyoruz yararlıdır.
- Bu için monitörün web servisi aracılığıyla DataCleaner işlerin yürütülmesine Engelleme bazen blokaj ipliğinin yol açtığı bir hata ile başarısız olabilir. Bu sorun giderildi.
- bir gelişme yolu işleri yapıldı ve bileşenlerin sırası yürütülmesinden sonra temizlenir / kapalı.
- DataCleaner bir JNLP / Java Web Start sürümü, belirli koşullar altında değil Start başlatıcısı tarafından tanınması için belirli JAR dosyaları, neden Java çalışma zamanı bir hata ortaya çıkmıştır. Bu sorun, bu JAR dosyaları küçük değişiklikler yaparak sabit olmuştur.
- belgelerinde birkaç ölü bağlantıları tespit edildi.
Hangi sürümü 3.5.4 yeni
- dönüşümlerin çıkış sütunları gizlemek artık mümkün . Gizleme tüm işlem akışını etkiler, ama sadece kullanıcı arayüzünden bunları gizlemek ve diğer bileşenleri ile etkileşim sırasında böylece potansiyel, deneyimi daha temiz hale olmayacaktır.
- Yeni bir web hizmeti belirli bir iş yürütme durumunu yoklamak için bir yol sağlar izleme web uygulamasına ilave edilmiştir.
- hata herhangi bir kayıt işlendikten ne zaman belli analiz türleri için başarısız HTML raporu neden tespit edildi.
- Ve diğer 6 küçük hata adressed edilmiştir.
sürüm 3.5.1 yeni Nedir:
- Yakalama kayıtları değiştirildi:
- Yeni bir filtre daha önce işlenen olmamıştır kayıtların artan işlem, örneğin etkinleştirmek eklendi profilleme veya kopyalama için yalnızca kayıtları değiştirilmiş. Yeni filtreleri adı Yakalama Değişim veri yakalama kavramına atıfta bulunarak, kayıtları değişti olduğunu.
- işlerin sıraya alınmış yürütme:
- DataCleaner monitör şimdi, aynı işin yürütülmesine sıraya. Bu yanlışlıkla iş ne bağlı sorunların her türlü yol açabilir aynı anda aynı işi çalıştırmak yok olmasını sağlar.
- Küçük onarımları:
- Çeşitli onarımları gerçekleştirilmiştir.
birden çok kez tetiklenir
sürüm 3.5 yeni Nedir:
- Çeşitli sihirbazlar artık veri depolarıyla kayıt için kullanılabilir; CSV dosyaları, veritabanı bağlantı girişi için sunucuya dosya yükleme, Salesforce.com kimlik bilgilerinin güdümlü kayıt ve daha fazlası. dahil
- iş kurma sihirbazları ayrıca çeşitli gelişmiş özellikleri ile genişletilmiş edilmiştir; değer dağılımının seçimi ve desen Hızlı analiz sihirbazında alanları bulma, EasyDQ dayalı müşteri temizlik işleri ve (daha aşağıda okuyun) Pentaho Veri Entegrasyonu işler ateş için yeni bir iş sihirbazı oluşturmak için tamamen yeni bir sihirbaz.
- Şimdi ad-hoc web kullanıcı arayüzünde doğrudan herhangi bir veri deposuna sorgulayabilirsiniz. Bu kolay iş veya veri işleme yönetilen diğer yaklaşımları kurma olmadan veri içine hızlı ya da düzensiz bilgiler almak için yapar.
- iş veya DataStores oluşturulduktan sonra, kullanıcı yeni inşa nesne ile harekete geçmeye yönlendirilir. kayıtlı sonra Örneğin, çok hızlı bir şekilde inşa oluyor hemen sonra bir işi çalıştırmak veya bir veri deposuna sorgulayabilir.
- iş dosyaları XML içeriğini el-düzenlemek istiyorsanız artık doğrudan özellikle kullanışlı olan depo, işleri yükleyebilirsiniz Yöneticiler.
- teknik cruft bir sürü şimdi basit diyaloglar gösteren lehine gizlidir. Örneğin, bir iş tetiklendiği zaman büyük bir yükleme göstergesi gösterilir ve bittiğinde sonuç gösterilir. Daha önce yine ek ayrıntılar için bir bağlantıyı tıklayarak üzerine orada görüntülenebilir oldu gelişmiş günlüğü ekranı.
Hangi sürümü 3.1.2 yeni
- izleme bir web hizmeti ekledik metrik değerler bir (listesi) almak için başvuru. Bu veri (kalite) izlemek ve üçüncü parti uygulamalar sonuçları ortaya çıkarmak için bir yol olarak, önemli bir altyapı bileşeni olarak izleme daha kullanışlı hale getirir.
- 'Tablo arama' bileşeni yapılandırılabilir özellik olarak semantik katılmak ekleyerek geliştirilmiştir. Eğer JOIN veya bir INNER JOIN bir LEFT gibi anlamsal olarak çalışmak arama isterseniz ince ayar yapabilirsiniz semantik katılmak kullanma.
- .
- Performans iyileştirmeleri bu sürümde belirli bir odak noktası olmuştur. İyileştirmeler daha önce kapalı değildi belli köşe durumlarda bir akarsu işleme yaklaşımı kullanmak için DataCleaner motoru yapılmıştır.
EasyDQ bileşenleri daha fazla yapılandırma seçenekleri ve daha zengin bir tekilleştirme sonucu arayüzü ekleyerek, yükseltilmiş
Hangi sürümü 3.1.1 yeni
- tarih ve saat ile ilgili analiz seçenekleri genişletildi , hafta numaraları, ay ve yıl için dağıtım analizörleri ekledi. tarih ve saat ile ilgili tüm analiz şimdi adlandırılan bir alt menü içinde gruplandırılmış, Tarih ve saat & quot; altında & quot; Analiz & quot;.
- İsteğe bağlı & quot; istatistik & quot tanımlayıcı; seçenek sayısı analizörü ve Tarih / saat analizörü eklenmiştir. Bu seçenek, Medyan, Çarpıklık, yüzdelik ve Basıklık olarak bu analiz sonuçlarına ek metrikleri ekler. kendi bellek izi mevcut metrikleri biraz daha büyük olduğundan Bu ölçümler isteğe bağlıdır.
- izleme web uygulaması zaman çizelgesi listelerinde çizgiler artık onları küçük noktalar var. Bu onları (tek veya hatta) birkaç gözlemlerle grafikler için özellikle yararlıdır -. Gözlem noktaları tam olarak nerede işaret
- yürütmesini ad-hoc sorguları da önemli ölçüde iyileştirilmiştir sorgu ayrıştırıcı. Şimdi sorgular DISTINCT hükümler, * -wildcards, alt sorgular içeren ve hata toleranslı metin vaka sorunlar karşısında bulunmaktadır olabilir.
- İki yeni transformatörler UUIDs üretmek ve damgaları üretmek için eklenmiştir.
nedir sürüm 3.1 Yeni:
- Metrik formüller - Veri Kalitesi APG açıklamaktadırlar:
- çok daha fazlası inşa DataCleaner izleme web uygulamasında Veri Kalitesi APG ayrıntılı artık mümkün. Kullanıcı arayüzü, bir tablo gibi formül tarzında karmaşık formüller oluşturmanıza olanak verir; DataCleaner işleri tarafından toplanan değişkenleri kullanarak.
- Metrik formüller sürece bir matematiksel denklemi ile ifade edilebilir, ölçümler, sabitler ve operasyonların herhangi bir sayıda birleştirebilirsiniz.
- - toplam kayıt sayısının yüzde yinelenen kayıtların hızını ölçmek. Veya birden fazla dize desen bir dizi uygun ürün kodları miktarını ölçmek.
- Ad-hoc sorgulama - herhangi bir veri deposuna ait:
- ! Sorgular düz SQL ifade edilebilir ve keşif ve veri profilleme deneyimi içine uzatmak için gerçekten yararlı bir sorgu mekanizması sağlayarak, veri tabanları yanı sıra dosyaların, NoSQL veritabanları ve daha uygulanacaktır.
- sorgu seçenek YÖNETİCİ rolü ile kullanıcılara izleme için bir web hizmeti aracılığıyla da mevcuttur. Sorgu HTTP parametresi veya POST vücudun olarak verilmiştir ve sonuç XHTML tablo olarak verilmiştir.
- Değer eşleştirici - yeni bir analiz seçeneği:
- Çoğu kez değerlere izin ve belirli bir alanda beklenen gereken bir firma fikrim yok. DataCleaner her zaman size varsayımları iddia yardımcı olacağını Değer Dağıtım analizi seçeneği var oldu. Değer eşleştirici - DataCleaner 3.1 olsa da, daha kesin bir teklif var. Bu analiz seçeneği beklenen değerler kümesi belirtmek ve sonra özellikle doğrulamak ve beklenmeyen değerler tanımlamak için, analiz gibi bir değer dağılımını gerçekleştirmek için olanak sağlar.
- Kopyalama, silme ve iş yönetimi:
- DataCleaner monitör uygulamasında iş ve sonuçların yönetimi büyük ölçüde iyileştirilmiştir. Artık monitörün Planlama sayfasında bir iş tıklatın ve yeniden adlandırma, kopyalama, silme ve daha fazlası gibi işlemler için kullanılabilir yönetim seçenekleri bulabilirsiniz. Her operasyon gibi analiz sonuçlarına, programları ve daha fazlası gibi monitörde diğer eserler, için bağlantılar saygılıdır. Bu izleme depo yönetimi çok daha kolay ve olgun hale gelmiştir demektir.
- veri kalitesi geçmişini yönet:
- Bazen aslında tarihsel veriler ile izleme yapmak istiyorum durumlarla karşı karşıya demektir! Bu tarihi dökümlerini veya göstermek ve hikaye anlatmak isteyen veritabanları, yedeklerini olduğunu olabilir. Şimdi bu tarihi verilerin analizini yapmak DataCleaner monitöre yükleyin ve yeni bir web hizmetini kullanarak, söz konusu analiz sonucu tarihi bir veri ayarlayabilirsiniz. Bu zaman çizelgeleri düzgün ama zaman içinde daha sonraki bir noktada belki topladık sonuçları ile, amaçlanan tarihini kullanarak sonuçları arsa anlamına gelir.
- Kümelenmiş zamanlayıcı desteği (EE yalnızca):
- DataCleaner monitörün zamanlayıcı, dışa edilmiştir. DataCleaner Enterprise Edition (EE), biz makinelerin bir küme genelinde infaz denge yüklemek ve dağıtmak için yeteneği sağlayan, kümelenmiş scheduler sağlar.
- Tek oturum açma (SSO) CAS kullanılarak (EE yalnızca):
- . Şimdi DataCleaner BT altyapısı, aynı zamanda güvenlik-bilge ayrılmaz bir parçası olabilir.
- ... Ve daha bir çok:
- Yukarıda sadece bir özetidir. Otuzdan fazla sorunlar bu sürümde çözüldü. Biz forumları ve toplumdan gelen çok sayıda talep çözmüş ve biz değişim için bir araç olarak bu orta kullanmak için herkesi teşvik ediyoruz. Biz DataCleaner gelişimi ağır toplumda akarsu etkisinde yapmak çok mutluyuz.
Örneğin
artık herhangi bir veri deposuna ad-hoc sorguları gerçekleştirebilirsiniz DataCleaner 3.1 ile
basit düzenleme aracılığı ile ikame edilmiş olabilir, böylece
şimdi monitör uygulaması için tek oturum açma seçeneği sunar DataCleaner Enterprise Edition (EE)
Hangi sürümü 3.0.3 yeni
- ekler izleme depo işleri yeniden adlandırma için bir servis .
- UI etkileşimli bir sığınakta Web hizmeti olarak bu erişebileceğiniz veya.
- Web hizmeti izleme deposunda bir analiz sonucu tarihi tarihini değiştirmek için eklendi.
- Web uygulama eski JSF kapları ile uyumlu hale getirilmiştir.
- Web uygulamasında yapılandırma önbelleğe alma büyük ölçüde daha hızlı sayfa yükleme ve iş başlatma kez lider, düzeldi.
sürüm 3.0.2 yeni Nedir:
- izleme web uygulamasında bir iş tetiklemesi, Panel yürütme son durumunu elde etmek için her saniye otomatik yenilenir.
- Dosya tabanlı DataStores artık doğru izleme web uygulaması çözümlenir.
- & quot; anahtar / değer haritası & quot seçin; transformatör şimdi & quot gibi iç içe select ifadeleri destekler; Address.Street & quot; veya & quot; OrderLines [0] .product.name & quot;.
- tablo arama mekanizması JDBC veritabanlarına karşı çalışırken hazırlanmış deyimleri kullanarak, performans için optimize edilmiştir.
- Yöneticiler artık & quot doğrudan dosya tabanlı veri depolarıyla indirebilirsiniz; sayfa.
- özel durum işleme hata iletileri daha hassas ve sezgisel hale biraz geliştirilmiştir.
Mutlak yolları (örneğin CSV veya Excel tabloları gibi)
DataStores & quot;
izleme web uygulamasında
Hangi sürümü 3.0.1 yeni
- Bu sürümde temel güncelleyiniz geri yükleme hakkında oldu sütun ve belirli enumerable sınıflandırmalar haritalama. Yeni Bütünlük analizörü, örneğin, biz kaydedilmiş bir işi yeniden sonra, haritalama her zaman doğru olmadığını gördük.
- Ayrıca, birkaç iç gelişmeler daha kolay Spring Framework kullanarak ortamlarda DataCleaner monitör web uygulaması dağıtmak için yapım, yapılmıştır.
- Son fakat en az değil, masaüstü uygulamasında görselleştirme ayarları otomatik olarak iş bir göz alarak geliştirilmiştir görüntülendi ve tıklanılması güzel göstermek için gerekli detayların ekran boyutuna ve miktarına dayalı eserler sergilenmektedir.
sürüm 3.0 yeni Nedir:
- zaman çizelgesinin Ekran ve veri kalitesi metrik eğilimleri
- yönetme ve iş sonuçları, zaman çizelgeleri vb içeren için merkezi depo.
- Planlama ve denetim
- DataCleaner dönüşümleri çağırmak için web hizmetleri sağlanması
- Güvenlik ve multi-kira
- Uyarılar ve veri kalite ölçütleri tahmini konfor bölgelerin dışına bildirimleri.
- sadece eksik alanlar var kayıtların belirlenmesi için çok yararlı olan yeni Bütünlük analizörü vardır.
- Şimdi güzel görünümlü HTML size yöneticisi vermek, ya da XML ayrıştırıcı göndermek olabilir! Raporları için DataCleaner sonuçlarını aktarabilir
- Yeni izleme ortamı da yakından masaüstü uygulaması ile entegre edilmiştir. Böylece, masaüstü uygulaması şimdi izlemek depo işleri ve sonuçları yayınlamak ve zaten depoda içerik için interaktif bir editör olarak kullanılmak üzere yeteneğine sahiptir.
- Yeni tarih odaklı dönüşümler artık mevcut: Bir tarih maskesi kullanarak bir tarih biçimlendirmek için izin verir tarih aralıkları dayalı veri setlerini alt kümesi sağlar tarih aralığı filtre, ve biçim tarih, .
- (ExtensionSwap aracılığıyla daha önce yalnızca kullanılabilir) Regex Ayrıştırıcı şimdi DataCleaner dahil edilmiştir. Bu ayrıştırmak ve düzenli ifadeler kullanarak zengin metin alanlarını standardize etmek çok rahat yapar.
- mevcut yeni bir metin vaka trafo var. Bu dönüşüm ile kolayca Büyük / küçük harf ve cümle ve kelimelerin doğru harf arasında dönüştürebilirsiniz.
- İki yeni arama / değiştirme dönüşümler eklendi. Düz arama / değiştirme ve Regex arama / değiştirme
- masaüstü uygulamasının kullanıcı deneyimi geliştirilmiştir. Biz renkleri daha parlak ve daha net bakmak yapılmış ve yazı işleme geliştirilmiş, çeşitli uygulama içi yardım mesajları ekledik.
DataCleaner işlerin
sürüm 2.5.2 yeni Nedir:
- Apache CouchDB desteği:
- NoSQL veritabanı Apache CouchDB için destek ekledik. DataCleaner hem analiz ve CouchDB örnekleri yazma, okuma destekler.
- Güncelleme tablo yazar:
- DataCleaner içine ETLightweight tarzı özelliklerini getirmek için önceki çabaları ardından, bir tablodaki kayıtları güncelleştiren bir yazar ekledik. Belirli koşullara göre kayıtlar eklemek veya güncellemek, örneğin kullanabilirsiniz.
- tablo yazar haline Ekle gibi, yeni DataCleaner Güncelleme tablo yazar SQL tabanlı veritabanları ile sınırlı değil, yazmayı destekler herhangi bir veri deposu türü (şu anda ilişkisel veritabanları, CSV dosyalarını, Excel tabloları, MongoDB veri tabanları ve MongoDB veritabanları), ancak semantik SQL geleneksel UPDATE TABLO deyimi ile aynıdır.
- bilgi sonucu dosyalarında kayıtlı Matkap-to-detay:
- Bazı kullanıcılar matkap-to-detay bilgileri kayıp olduğunu yaşadı. DataCleaner 2.5.2 biz şimdi de tarihi veri olaylarını araştıran zaman çok daha değerli senin DQ arşivleri yaparak, bu bilgileri devam etmektedir.
- Geliştirilmiş EasyDQ hata işleme:
- EasyDQ bileşenleri hata işleme açısından geliştirilmiştir. Bir anlık bir ağ sorun oluştuğunda ya da başka benzer bir sorun başarısız birkaç kaydı neden olursa, EasyDQ bileşenleri artık incelikle en önemlisi kurtarmak ve edecek -. toplu iş bile hatalar rağmen geçerli olacaktır
- NoSQL yavaş değişen Tablo haritalama:
- tablo tabanlı, ama biz onlarla çalışmaya iki yaklaşım sağlayan daha dinamik bir yapıya sahiptir değildir: varsayılan, DataCleaner bir tablo yapısı autodetect izin vermektir, ve el belirlemenize izin veren gelişmiş senin istenilen tablo yapısı. Daha önce gelişmiş seçenek XML yapılandırma ile kullanılabilir, ama şimdi kullanıcı arayüzü doğrudan uygulamada bu iş için uygun diyaloglar içeriyor.
DataCleaner 2.5 kaydet sonucu özelliğini kullanırken
CouchDB ve MongoDB yana
sürüm 2.4.1 yeni Nedir:
- Özellik geliştirmeleri:
- Toplu yükleme özellikleri veritabanı tablolarına veri yazarken biz büyük ölçüde iyileştirilmiştir ediyoruz. Burada büyüklüğü gelişmeler birçok siparişleri görmek için bekliyoruz.
- veri yazma daha rahat pencere menüsüne seçenekleri ekleyerek kullanılabilir hale getirilmiştir.
- Şimdi kolayca kendi sekmeleri çift tıklatarak bir iş bileşenlerini yeniden adlandırabilirsiniz.
- JavaScript trafosu Javascriptlerinizi incelemek ve değiştirmek için daha kolay olacak şekilde şimdi, sözdizimi renklendirme sahiptir.
- Bugfixes:
- biz bu veri deposuna tablo önbelleği yenilendikten emin yaptık (örneğin. DataCleaner evreleme alan) okuma ve aynı veri deposuna yazarken. Önceden bazı senaryolar tablolar bir out-of-date görünümünü görmek için izin verdi.
- uygulamayı başlatma Olası bir kilitlenme çözüldü. Bu kilitlenme JVM bir sorun nedeniyle bir sonucuydu, ama biz Java belirli API tüm aramaları eşitleyerek etrafında çalıştı.
sürüm 2.4 yeni nedir: (aka. Tekilleştirme veya kayıt Bulanık eşleştirme)
- algılama çoğaltın , en fazla 500.000 değerleri kullanmak için ücretsiz olan.
- Adres veri doğrulama ve temizlik. Bu adresler varsa onlar doğru biçimlendirilmiş ve hatta hatalar olması durumunda düzeltmeleri önermek eğer, kontrol etmenizi sağlar.
- Ad veri doğrulama ve temizlik. Adı servisi ile EasyDQ sadece tutarlı bir şekilde adlarını biçimlendirmek, ama aynı zamanda adı parçaları imla hataları denetler ve yorumlar.
- E-posta ve telefon doğrulama ve temizlik. Bu hizmetler, bu ülke kodları doğru ve çok daha fazlası olan e-posta alanları var emin, e-posta ve telefon verilerinin kontrol sağlarlar.
nedir sürüm 2.3 yeni
- Uluslararası veri desteği:
- uluslararası verilerle çalışıyorsanız, o zaman örneğin verilerinizin farklı karakter setleri, Çince veya İbranice olabilir. Size karakter setleri için veri olarak kullanıldığı anlamaya olanak sağlayan bir profil seçeneği Karakter seti dağıtım analizörü ekledi.
- Farklı karakter setleri içeren verilerle çalışmak sorunlu olabilir. Latin karakter farklı yazı sistemleri dizeleri transliterasyon şimdi yeni çevirisini trafosu kullanma.
- dokümantasyon bölümünde DataCleaner 2.3 uluslararası veri yetenekleri odaklanarak, aynı zamanda yeni bir Web yayını gösteri var.
- ikincil sütuna göre analiz sonuçlarının Gruplandırılması:
- Desen analizörü şimdi ikinci bir sütuna dayalı grup desenleri yapabiliyor. Bu gibi analizler için yararlıdır:
- ülkeye göre gruplandırılmış telefon numaraları, desenlerini alın.
- e-posta kullanıcı adı desenleri e-posta etki alanına göre alın.
- Değer Dağıtım analizörü için yapılmıştır benzer bir şey; : Bu gibi analizler için izin verir
- Tüm şehir adları posta kodu ile gruplandırılmış zaman, farklı? Are
- belirli müşteri tipleri içinde cinsiyet dağılımı nedir?
- Geliştirilmiş grafikler:
- Desen bulucu sonuçları artık bir grafik gösterilebilir. Bu dağılım görünür kılan ve bir & quot ne kadar gösterir, uzun kuyruk & quot; desen var.
- değer dağıtım analizörü çıkış alanlarının birkaç geliştirilmiştir:
- grafiğin okunabilirlik iyileştirilmiştir.
- Bu satırların üzerinde toplam satır sayısını ve farklı sayısını gösterir. Bu yinelenen değerler var ne sıklıkta sergiyi yardımcı olur.
- Boş dizeler varsa onları tanımak için daha kolay olduğunu bu yüzden biz, bunun için anahtar kelime kullanın.
- Çıktı:
- .
- veri deposuna yazdıktan sonra, çıkış beklentilerinize uygun olup olmadığını kontrol edebilirsiniz, böylece çıkış önizleme artık mümkün.
- Bu yeni bir iş için girdi olarak kullanılabilir, böylece yeni bir veri deposuna olarak çıktı eklemek için şimdi de mümkündür.
- Diğer iyileştirmeler:
- Belgeleme genellikle geliştirilmiştir. Özellikle, günlük ve komut satırı arayüzü açıklamaları eklendi.
- uzatma mekanizması uygulamasının birkaç adet modüler hale ve uzatma geliştiriciler için genel kullanıma bağımlılık enjeksiyon çerçeve olarak Google Guice tanıtarak geliştirilmiştir.
- Ve tabii ki yirmiden fazla küçük iyileştirmeler ve hata düzeltmeleri yaptı.
satır var farklı değerlerin sayısını:
mevcut çıkış biçimleri (CSV dosyaları ve H2 yavaş değişen) biz Excel tabloları çıktı yazma eklendi yanında
sürüm 2.2 yeni Nedir: genişletilebilirlik hakkında
- Bu sürümde temel nedeni olmuştur hikaye . ExtensionSwap: Uygulamayı bırakmadan ederken biz Simultaniously yeni ve önemli bir alanı sunmaktadır bir yeni DataCleaner web sitesi yeniliyor. ExtensionSwap fikri sadece tarayıcıda bir düğmeye basarak DataCleaner ve montaj uzantıları paylaşımını sağlamaktır!
- DataCleaner uzatma API mümkün kendi transformatörler, analizörleri ve filtreler oluşturmak için yapım, bu sürümde bir çok geliştirilmiştir. Eğer uzantıları, diğer kullanıcıların ilgisini olabilir düşünüyorsanız, ExtensionSwap üzerinde paylaşmak ve kolayca binlerce kullanıcıya dağıtmak için bir kanal sağlar. Uzatma API ve ExtensionSwap ayrıca bir ilgi ile geliştiriciler ve diğer teknik adamlara yönelik yeni web yayını gösteri açıklanmıştır.
- Biz de ExtensionSwap başlangıç uzantıları bir dizi yeniliyor. Biz de Eklenti Geliştirme kendilerini denemek isteyen geliştiriciler için bir örnek teşkil edecek bir örnek uzantısı satışa sunuluyor. Önümüzdeki aylarda biz emin İnsan Çıkarım bilgisi toplama ekipleri de kullandığımız araçlardan bizim iç portföy kaynaklı daha uzantıları göndermek için yapacaktır.
- . Biz her yerde profil ve veri analizi mümkün kılmak için diğer uygulamalar içine kolayca DataCleaner embed edebilmek istiyorum! Biz uygulamalar DataCleaner paket ve dinamik bir yapılandırmaya ile bootstrap ya da & quot çalıştırmak için izin veren yeni bir önyükleme API oluşturduk, uygulama sadece tek bir veri deposuna teftiş doğru ayarlanmış tek veri deposu modu & quot ;, (genellikle uygulama tarafından tanımlanan bu) DataCleaner gömer. Biz zaten eserlerinde DataCleaner gömme bazıları gerçekten ilginç vaka var -. Diğer açık kaynak uygulamaları yanı sıra ticari uygulamalarda hem
- SAS veri kümelerini analiz desteği ekledik. Bu, bizim gibi, bildiğimiz kadarıyla, ilk büyük açık kaynak uygulama sonuçta SAS kullanıcılarının çok özgürleştirici, böyle bir işlevsellik sağlamak için oldukça gurur duyuyoruz şeydir. SAS birlikte çalışabilirlik bölümü ayrı bir proje, SassyReader olarak oluşturulur, bu yüzden çok erken DataCleaner en ücretsiz açık kaynak toplulukları benimsenmesini görmeyi beklediğiniz oldu!
- Biz de veri deposuna başka bir türü için destek ekledik. Sabit genişlik dosyaları her sütun sabit bir genişliğe sahip metin dosyalarıdır. CSV dosyaları gibi bir ayırıcı ya da tırnak karakteri, değer uzunlukları kümesine göre yerine her satır uzunluğu eşit ve her satır simgeleþtirilmiþ olacak vardır.
- & quot Bir seçeneği; tutarsızlıkları & quot başarısız; CSV dosyası ve sabit genişlik dosya yavaş değişen eklendi. Bu metin dosyası tabanlı veri depolarıyla kullanırken bu bayraklar bir biçim bütünlük denetimi ekleyin.
- Bir hata kullanıcı arayüzü, bir CSV datastore düzenleme. muhafaza olmamak CSV ayırıcı ayarlarını neden olan, sabit
- Japon ve diğer karakterler kullanıcı arayüzünde desteklenmez. Bu & quot; hata & quot; sistemde kullanılabilir yazı tiplerini araştırmak ve özellikle karakterleri işleyebilir bir yazı seçme meselesi idi. en modern sistemlerde yetenekli yazı tipleri mevcut olacak, ama orada bazı Unix / Linux dallar üzerinde hala sınırlamalar olabilir.
- dokümantasyon bölümü güncellendi! Hiç ilk 2.0 sürümünden bu yana belgeler çok geride olmuştur, ama biz nihayet tarihe kadar almak için başardınız. Orada dokümanlar eksik parçalar hala, ama kesinlikle temel kullanım yanı sıra en başlıklar için bir referans için yararlı olacaktır.
- Uygulama başlangıç zamanı yapılandırma yükleme koşutlama tarafından ve ilk vitrin için gerekli olmayan yapılandırma bu parçaların başlatma geciktirerek geliştirildi.
- fonetik benzerlik bulucu analizörü, ana dağıtım kaldırıldı. Artık bulmak ve ExtensionSwap üzerinde fonetik benzerlik bulucu yükleyebilirsiniz.
- iptal veya errornous iş işleme geliştirildi ve kullanıcı arayüzü iş durdurdu eğer, düğmeler ve ilerleme göstergeleri devre dışı bırakarak daha doğrusu yanıt verir.
- kaydırma tablo boyutlandırma ve kullanımı ile ilgili birkaç küçük UI sorunları giderildi.
İnsan Çıkarsamalar doğal dil işleme DQ web hizmetleri dayalı, gelişmiş İsim, Telefon ve E-posta temizlik sağlar DataCleaner uzantısı HIquality İletişim:
biz de embeddability üzerinde duruluyor genişletilebilirlik ek olarak
Sabit genişlik dosyalar:
Bu oldukça deneysel ve kavramının bir kanıtı ve daha gelişmiş eşleme analizörleri oluşturmak için topluma meze olarak çoğunlukla hizmet olarak
sürüm 2.1.1 yeni Nedir:
- Donanımlar:
- DataStores listesinde arama / filtreleme metin alanını eklendi. Bu ekranda mevcut daha fazla veri depolarıyla kayıtlı varsa hızlı bir şekilde veri deposuna bulmanızı sağlar.
- ülke kodları için referans veri standart dağılımına eklendi, teşekkürler bu sağlamak için Graham RHIND gider.
- 10'dan fazla sütun vardır camlarını önizleme verilere yatay kaydırma çubuğu eklendi.
- zamanında Seçenekler iletişim kutusunda yeni işlevselliği ile bir uzantı paketi eklemek için yeteneği. uzantıları ile ilgili daha fazla odaklanma yaklaşan bültenleri takip edecek.
- Size Uygulamayı çağırmak için izin vererek bizim komut satırı arayüzü (CLI) erken önizleme maruz ettik & quot; -kullanım & quot; CLI seçenekleri gösterecektir parametre.
- eklendi numara & quot; Number & quot dönüştürme; transformatör.
- Bugfixes:
- sütunlar (150 +) bir LOT ile tablo sorgularken bir yetersiz bellek sorunu düzeltildi.
- neden bir sorun düzeltildi & quot; Limit analizi & quot; kaydettikten sonra iş yeniden açıldığında düzgün kontrol edilemez kutusunu işaretleyin.
- resmi bir özellik değildi, ama değil gerçekten bir bugfix şimdi DataCleaner önceki sürümlerinden kullanıcı tercihlerini (userpreferences.dat dosyası) geri destekler.
için biçimlendirme seçeneklerini
sürüm 2.1 yeni Nedir:
- kullanıcı arayüzünde yapılan bir sürü iş vardı ( ) medya sayfasına bakın:
- çevre yapılandırma seçeneklerini içeren sol taraftaki pencere çıkarmaya karar verdiler.
- yerine tüm bu seçenekler artık iş kurma penceresine taşındı.
- karşılama / giriş iletişim de ana pencereden çekilir ya da gizli olabilir, daha ayrık panelin lehine kaldırıldı.
Kullanıcı sadece bir işi yapmak için gerekli tüm etkileşimleri için tek bir pencere odaklanmak vardır bu yüzden
Yorum Bulunamadı