WebGraph Web grafik incelemek için bir çerçevedir. WebGraph Modern sıkıştırma teknikleri istismar çok büyük grafikler yönetmek için basit yollar sağlar. Daha kesin olarak, şu anda yapılmıştır:
1. (belirli bir üstel aralığında genel olarak, ya da, güç hukuk dağılımı ile tamsayılar) özellikle web grafikleri saklamak için uygun kodlar olarak adlandırılan düz kodları, bir dizi. Bu kodlar iyi çalışır olması kolayca ampirik test edilebilir, ama biz de detaylı bir matematiksel analiz sağlamak için çalışın.
2. Algoritmalar boşluk sıkıştırma ve referentiation (la LINK) istismar web grafikleri sıkıştırmak için, intervalisation ve kodları bir yüksek sıkıştırma oranı sağlamak için: Örneğin, WebBase grafiği (2001 tarama) bağlantı başına 3.08 bit sıkıştırılmış ve bir anlık olduğunu ve UbiCrawler tarafından toplanan .uk etki yaklaşık 18.500.000 sayfa bağlantı başına 2.22 bit sıkıştırılmış (transpoze grafikler için ilgili rakamlar bağlantı başına 2.89 bit ve bağlantı başına 1.98 bit). algoritmalar erişim hızı ve sıkıştırma oranı arasında farklı tradeoffs sağlayan çeşitli parametreler tarafından kontrol edilir.
Aslında, o açılıyor aslında gerekli kadar dekompresyon gecikme tembel teknikleri kullanmadan sıkıştırılmış grafik erişmek için 3. Algoritmalar.
Paket it.unimi.dsi.webgraph bulunan Java yukarıdaki algoritmaların 4. tam, belgelenmiş uygulama. Açıkça tanımlanmış API yanı sıra, paket böylece çeşitli ayarlarla deneme, bir grafik değiştirme (örn, devrik) veya yeniden sıkıştırmak için izin birkaç sınıfları içerir. paket hazır kullanımlı, verimli algoritmalar için ve hat-komuta ayrıştırma GNU getopt üzerinde COLT dağılımına, bit düzeyinde I / O için MG4J üzerine, bir tür özel, yüksek-performanslı koleksiyonları çerçeve için fastutil dayanır.
Çok büyük grafik için 5. Veri setleri (örneğin, bağlantıları milyar dolar). Bunlar ya kamu kaynaklardan (örneğin WebBase gibi) bir araya veya UbiCrawler ile üretilir.
Sonunda, WebGraph ile bile RAM az 256 MB ile bir PC'de erişmek ve çok büyük web grafik analiz edebilirsiniz. WebGraph kullanarak birkaç kavanoz dosyaları yükleme ve veri seti indirmek kadar kolay. Bu tür PageRank web grafiğinde, vb çok kolay grafik özelliklerinin dağılımı gibi olayları okuyan yapar
Bu sürümde Yeni nedir:.
- Bu sürüm HyperANF birkaç iyileştirmeler ve bir kaç onarımları ekler.
- WebGraph artık Maven Central bulunabilir.
nedir sürüm 2.4.5 Yeni:
- Bu sürüm HyperANF, yeni bir uygulama içeriyor Mahalle işlevi ortalama en kısa yolu ve diğer türetilmiş verileri hesaplamak ve yöntemler grafiğin mahalle fonksiyonunun hesaplanması için son derece ölçeklenebilir algoritma.
- Ayrıca, istatistiksel verilerin zenginliği artık sıkıştırma sırasında hesaplanır.
sürüm 2.4.4 yeni nedir:.
- Bazı eski seçenekler kaldırıldı
- mülkiyet dosyaları artık yararlı istatistiklerin bir zenginlik içeriyor.
- Rasgele erişim hızı iyileştirilmiştir.
sürüm 2.4.3 Yeni nedir:
- Sabit ArrayListMutableGraph.addNodes () (teşekkürler Erik bulma ve) bu hata düzeltme için Lumer.
- Yeni seçenekler ASCII grafik çıkışını kaydırmak için.
- RemappedImmutableGraph.successorArray (x) dolayısıyla miras halefleri paralel farklı listelerde tarama kullanılamaz (x) yöntemi yapma, her çağrıda aynı dizi sağlıyordu. Sabit (şimdi yerine, dizinin bir kopyasını döndürür).
- Yeni rastgele dönüşüm grafik.
Rastgele süzülür
nedir sürüm 2.4.2 Yeni:
- Yeni & quot; & quot oluşturmak; inşa (Ark etiketli) oluşturmak mümkün grafikler yapar.
Yorum Bulunamadı