Apache Solr , Apache Lucene projesine dayanan, XML / HTTP ve JSON API'lerini kullanan, açık kaynaklı, ücretsiz, platformdan bağımsız ve yüksek performanslı bir arama sunucusudur. Proje şu anda Apache Software Foundation'da inkübasyon altında.
Bir bakışta özellikler
Temel özellikler arasında vurgular vurgulama, yönlü arama, önbellekleme, çoğaltma, web tabanlı yönetim arayüzü, gelişmiş tam metin arama özellikleri, yüksek hacimli web trafiği için optimize edilmiş, HTTP gibi açık arabirimler, standartlar , XML ve JSON.
Ayrıca, kapsamlı HTML yönetim arabirimleri, sunucu istatistikleri, otomatik dizin çoğaltma, otomatik kurtarma ve yük devretme, gerçek zamanlı dizinlemeye yakın, XML yapılandırmasıyla uyarlanabilir ve esnek ve genişletilebilir eklenti mimarisi ile birlikte gelir.
Proje, kullanıcının Apache Solr ile hızlı bir şekilde başlamasına izin veren şematik bir uygulamadır. Şema ve şema modlarının her ikisi de şu anda desteklenir, ancak ikincisi güçlü bir üretim ortamına yol açacaktır.
Çeşitli türler, herhangi bir kod yazmadan Lucene analizörlerini karıştırıp eşleştirmenize yardımcı olacak Alan Türleri de dahil olmak üzere Solr tarafından desteklenir. Ayrıca, proje, anında etkinleştirilebilen dinamik alanları da destekler.
Diğer ilginç özelliklerin yanı sıra, kullanıcıların farklı yöntemlerle aynı içeriği kolayca analiz etmelerine olanak tanıyan kopyalama alanı işlevselliği, alan türlerini tahmin etme gereksinimini ortadan kaldırmak için açık türler için destek, harici dosyalara dayalı özel yapılandırmalar gibi Çok sayıda ek metin analizi bileşeni olarak.
Kaputun ve kullanılabilirliğin altında
Apache Solr'un başlığının altına baktığımızda, uygulamanın tamamen Java programlama dilinde yazıldığını ve Linux'un yanı sıra Microsoft Windows ve Mac OS'nin 32-bit ve 64-bit dağıtımlarını desteklediğini fark edebiliriz. X işletim sistemleri.
Size kolaylık sağlamak için, hem ikili hem de kaynak arşiv olarak dağıtılır, böylece Apache Solr ile kolayca başlayabilirsiniz ve çok fazla güçlük çekmeden çok az zaman kazanabilirsiniz.
Nedir? Bu sürümdeki yeni :
- Overser hiçbir zaman son mesajlarını işleyemez.
- Çekirdek solr bağımsız modda yeniden adlandırılmıyor.
- QueryComponent'in rq parametresi ayrıştırması artık defType parametresini dikkate almaz.
- Filtre maddesindeki sorgu terimleri hiçbir şeye düşmediğinde SolPEQueryParser'da NPE'yi düzeltin.
Sürümde yeni: :
- Güvenlik çerçevesindeki diğer birçok gelişmeye ek olarak, Solr şimdi de ZooKeeper'da güvenli bir şekilde kimlik bilgilerini depolayan HTTP Temel Yetkilendirmesini uygulayan bir AuthenticationPlugin içerir. Bu, Solr'un yönetici ekranına veya API'lerine erişen herkes için bir kullanıcı adı ve şifre gerektirmenin basit bir yoludur.
- ZooKeeper'da saklanan izin verme kuralları ile çeşitli kaynaklar için ACL'leri uygulamak üzerinde hassas kontrol sağlayan yerleşik YetkilendirmePozusu.
- JSON Facet API'si, faset komutları için etki alanını değiştirebilir, esasen bir blok katılımını gerçekleştirir ve ebeveyn verilerini çocuklara veya ebeveynlere veriyi hesaplamadan önce ebeveynlere taşıyabilir.
- Yeni Faset Modülü / JSON Facet API'sinin performansında önemli gelişmeler.
- Pivot Facets altındaki Sorgu ve Aralık Yönleri. JSON Facet API'sinde olduğu gibi, pivot yüzler menzil ve sorgu yönleri gibi diğer faset tiplerinin nasıl yuvalanabileceğidir.
- Bu Sorgu Ayrıştırıcı Seçenekleri gibi daha fazlası. MoreLikeThis QParser artık MLT İşleyici tarafından sağlanan tüm seçenekleri desteklemektedir. Sorgu ayrıştırıcısı, bulut modunda ve normal bir sorgu belirtilebileceği gibi işleyiciden çok daha çok yönlüdür.
- SolrJ'de Şema API desteği eklendi
- Sorgu zamanı katılma ve katılmayı engelle için Puanlama modu eklendi.
- Gülümseme yanıt biçimi eklendi
4.10.3 sürümündeki yeni :
- Solr 4.10.2, 10 hata düzeltmesinin yanı sıra Lucene 4.10.2 ve 2 hata düzeltmesini içerir.
Sürüm 4.6.1’de yeni: :
- Apache Tika 1.4
- Carrot2 3.8.0
- Velocity 1.7 ve Velocity Tools 2.0
- Apache UIMA 2.3.1
- Apache ZooKeeper 3.4.5
- Hata Düzeltmeleri:
- SOLR-5408: Birden çok sıralama ölçütü kullanıldığında CollapsingQParserPlugin hatalı şekilde derecelendirildi
- (Brandon Chapman, Joel Bernstein)
- SOLR-5416: CollapsingQParserPlugin, Etiketlemeyi / Dışlamayı Kapatma 'nı kırdı
- (David Boychuck, Joel Bernstein)
- SOLR-5442: Python istemcisi, Tomcat tarafından sunulduğunda proxy yanıtı ayrıştıramaz.
- (Patrick Hunt, Gregory Chanan, Vamsee Yarlagadda, Romain Rigaux, Mark Miller)
- SOLR-5445: Proxy yanıtları, her anahtar için ilk olandan ziyade tüm başlıkları yaymalıdır.
- (Patrick Hunt, Mark Miller)
- SOLR-5479: İstek için bir lider 1 saniye içinde bulunamazsa SolrCmdDistributor yeniden deneme mantığı durur.
- (Mark Miller)
- SOLR-5532: SolrJ İçerik Türü doğrulaması, bazı web barındırıcıları / proxy'leri için çok sıkı.
- (Jakob Furrer, hosman, Shawn Heisey, Uwe Schindler, Mark Miller)
- SOLR-5547: SolrJ CollectionAdminRequest kullanarak bir koleksiyon takma adı oluşturmak, takma adı ve koleksiyonları takma adıyla aynı değere ayarlar.
- (Aaron Schram, Mark Miller)
- SOLR-5577: Benzer bir şekilde ZooKeeper'ın sona ermesi belirli bir miktardaki güncellemeleri yavaşlatmamalı, bunun yerine belirli bir süreden sonra güncellemeleri kesmemelidir.
- (Mark Miller, Christine Poerschke, Ramkumar Aiyengar)
- SOLR-5580: Hem açık shard hem de coreNodeName ile çekirdek oluştururken NPE.
- (YouPeng Yang, Mark Miller)
- SOLR-5552: Lider kurtarma işlemi, bir shard için tüm replikasyonlar kapalıysa ve kurtarılmaya çalışılan güncellemeleri kaybetmenin yanı sıra kurtarmaya çalışırken yanlış lideri seçebilir.
- (Timothy Potter, Mark Miller)
- SOLR-5569 Bir çoğaltma, bir liderin ACTIVE olduğunu yayınlayana kadar denememeli ve kurtarılmamalıdır.
- (Mark Miller)
- SOLR-5568 Bir SolrCore lider olma konusunda karar veremez çünkü küme durumu başka bir SolrCore'un aktif olmadığını söylüyor.
- (Mark Miller)
- SOLR-5496: HttpClients dışındaki bir http bağlantısı yöneticisini paylaşmalı ve tüm http bağlantı yöneticilerinin kapatılmasını sağlamalıyız.
- (Mark Miller)
- SOLR-5583: ConcurrentUpdateSolrServer # blockUntilFinished, yürütme hizmeti kapalıysa sonsuza kadar bekleyebilir.
- (Mark Miller)
- SOLR-5586: Tüm ZkCmdExecutor'lar, zk istemcisi zaman aşımıyla başlatılmalıdır.
- (Mark Miller)
- SOLR-5587: ElectionContext uygulamaları, seçim yollarının düzgün bir şekilde oluşturulduğundan emin olmak için ZkCmdExecutor # warrantyExists kullanmalıdır.
- (Mark Miller)
- SOLR-5540: HdfsLockFactory, gerekirse kilit ana dizini açıkça oluşturmalıdır.
- (Mark Miller)
- SOLR-4709: Yapılandırma dosyaları değiştiyse, çoğaltma işleminden sonra çekirdek yeniden yüklenmeden sonra yeniden yüklenebilir. (Mark Miller, Hossman))
- SOLR-5503: IOException ve status 500, ConnectException'dan ziyade "lideriyle ilet" isteklerini daha az agresif bir şekilde yeniden deneyin.
- (Mark Miller)
- SOLR-5588: PeerSync, tüm bağlantı hatalarını başarı olarak saymaz.
- (Mark Miller)
- SOLR-5564: geri dönüş yapıldığında hl.maxAlternateFieldLength orijinal alana uygulanmalıdır
- (janhoy)
- SOLR-5608: Kapalı SolrCore'un durumu ZooKeeper'a yayınlamasına izin verme.
- (Mark Miller, Shawn Heisey)
- SOLR-5615: ZK oturumu sona erdikten sonra kurtarmaya çalışırken kilitlenme.
- (Ramkumar Aiyengar, Mark Miller)
- SOLR-5543: Çekirdek geçişleri, solr.xml kalıcılık kullanırken solr.xml dosyasında yinelenen çekirdek girişleri ile sonuçlandı.
- (Bill Bell, Alan Woodward)
- SOLR-5618: hashCodes eşit olduğunda ve sorgulardan birinde yinelenen filtre sorguları olduğunda queryResultCache'de yanlış önbellek isabetlerini düzeltin
- (hossman)
- SOLR-4260: ConcurrentUpdateSolrServer # blockUntilFinished, önceden eklenen tüm güncellemeler tamamlanmadan önce geri dönebilir. Bu, kopyaların kaybolması için dağıtılmış güncelleştirmelere neden olabilir.
- (Markus Jelsma, Timothy Potter, Joel Bernstein, Mark Miller)
- SOLR-5645: CoreContainer üzerinden bir SolrCore yeniden yükleme, yeni SolrCore ile tekrar zk'ye girmeye çalışacaktır.
- (Mark Miller)
- SOLR-5636: SolrRequestParsers, her istekte bazı xpath aramaları yapar ve bu da eş zamanlılık sorunlarına neden olabilir.
- (Mark Miller)
- SOLR-5658: commitWithin ve üzerine yazılanlar, SolrCloud'un güncellemeleri dağıtmak için javabin kullandığı kopyalara dağıtılmıyor.
- (Mark Miller, Varun Thacker, Elodie Sannier, shalin)
- Optimizasyonları:
- SOLR-5576: Tüm SolrCore'ların AŞAĞI durumunu kaydettirmek için kaydolup beklerken eşzamanlılığı artırın.
- (Mark Miller ile Christine Poerschke)
4.6.0 sürümünde yeni :
- Serpme seçenekleri için birçok geliştirme ve iyileştirme
- AnalyzingInfixSuggester 'ten yararlanmak için Yeni AnalizInfixLookupFactory
- Yüksek kardinalite alanlarında yoğunlaşan yüksek performanslı alan için Yeni CollapsingQParserPlugin
- Koleksiyon yönetimi için yeni SolrJ API'leri
- Kullanıcı tarafından yapılandırılan doküman merkezli sürüm oluşturma kuralları için destek sağlayan yeni DocBasedVersionConstraintsProcessorFactory
- Yeni varsayılan dizin biçimi: Lucene46Codec
- Yeni EnumField türü
Sürüm 4.5.1’de yeni: :
- Solr 4.5.1, çok ciddi kabul edilen 2 de dahil olmak üzere bir avuç hata düzeltmesi içeriyor.
Sürüm 4.5.0’da yeni: :
- Özel anahtarlık desteği, geliştirilmiş yönlendirme ve çok iş parçacıklı düzenlemeler.
4.2.0 sürümünde yeni :
- Şema için bir okuma tarafı REST API'sı. Her zaman şemayı http üzerinden mi görmek istediniz? Şimdi yapabilirsin. Yazma tarafı gelecek gibi gözüküyor.
- DocValues, Solr'a entegre edildi. DocValues, alan önbelleğinden çok daha hızlı yüklenebilir ve RAM ya da Disk gösterimlerinde olduğu gibi farklı sıkıştırma algoritmalarını da kullanabilir. Faceting, sorting ve function sorgularının tümü fayda sağlar. İşletim sistemi önbellekleme ve yığın önbelleklerini ayıklama hakkında ne dersiniz? 60 gigabyte yığınları yok mu? Her segmente yönelik yeni bir dokunuş DocValues kaplama yöntemi ne dersiniz? Geliştirilmiş sayısal faceting? Tatlı.
- Koleksiyon Aliasing. Zaman bazlı veri var mı? Geçici bir koleksiyonda yeniden indekslemek ve daha sonra üretime geçirmek ister misiniz? Bitti. Shard Aliasing için bizi takip etmeye devam edin.
- Koleksiyon API'sı yanıtları. Koleksiyon API'sı 4.0'da hala çok yeniydi ve 4.1'de biraz düzelirken, yanıtlar kesinlikle gerekliydi, ancak kesintileri kaçırdı. Başlangıçta, Toplama API'sini süper hataya toleranslı hale getirme kararını verdik, bu da yanıtların daha sert olmasını sağladı. Kimse şeylerin nasıl ortaya çıktığını görmek için günlük dosyaları ile avlanmak istemez. 4.2'de tamamlandı.
- Herhangi bir düğümde herhangi bir koleksiyonla etkileşim kurun. 4.2'ye kadar, yalnızca sorgulamak / güncellemek istediğiniz koleksiyonun en az bir kopyasını barındıran kümenizdeki bir düğümle etkileşimde bulunabilirsiniz. Artık herhangi bir düğümü sorgulayın, istediğiniz koleksiyonunuzun bir parçası olsun veya olmasın ve proxy yanıtı alın.
- Özel kanal adlarına izin verin, böylece yeni ana bilgisayar adresleri emekli kırıcılar için devralınabilir. Esnek ips olmadan Amazon üzerinde çalışıyor? Bu senin için.
- Lucene 4.2 sıkıştırılmış terim vektörleri gibi optimizasyonlar.
Sürüm 3.3.0’da yeni: :
- Gruplama / Alan Çökmesi
- Büyük, küçük RAM tüketiminin bir sırasını sunan yeni, otomatikleştirilmiş bir öneri / otomatik tamamlama uygulaması.
- KStemFilterFactory, İngilizce için daha az agresif bir kökleştiricinin optimize edilmiş bir uygulamasıdır.
- Solr, yeni ve daha verimli bir birleştirme ilkesi (TieredMergePolicy) için varsayılan değerdir. Daha fazla bilgi için http://s.apache.org/merging adresine bakın.
- Yazım denetiminde son derece yüksek RAM kullanımı da dahil olmak üzere önemli hata düzeltmeleri.
- Apache Lucene 3.3 ile ilgili hata düzeltmeleri ve geliştirmeler
3.2.0 sürümünde yeni :
- JSON güncelleme biçimini kullanırken istek parametreleri olarak istek ve taahhüt belirtme yeteneği
- TermQParserPlugin, alan yüzleşmesinden veya terim bileşenlerinden döndürülen terimlerden filtre sorguları oluştururken yararlıdır.
- DebugComponent artık Explanation.toString yerine Açıklamalar nesnelerini Açıklama nesnelerini modellemek için bir NamedList kullanarak desteklemektedir
- UIMA ve Carrot2 entegrasyonlarının iyileştirilmesi
- Apache Lucene 3.2 ile ilgili düzeltmeler ve geliştirmeler
3.2.0 sürümünde yeni :
- JSON güncellemesi geliştirildi.
- Arama sonucu kümelenmesi ve UIMA entegrasyonu iyileştirildi.
- Hatalar düzeltildi.
Yorum Bulunamadı