Apache Spark

Yazılım ekran görüntüsü:
Apache Spark
Yazılım detaylar:
Versiyon: 1.3.1 Güncelenir
Qayıt: 12 May 15
Geliştirici: UC Berkeley AMP Lab
Lisans: Ücretsiz
Popülerlik: 45

Rating: 5.0/5 (Total Votes: 1)

Kıvılcım veri analizi ve manipülasyon programları için işlem hızlarını artırmak için tasarlanmıştır.
Bu Java ve Scala yazılı ve ana değiliz, ne de olmayan veri işleme uygulamaları için bu kullanışlı çoğunlukla, diğer sistemlerde bulunmayan özellikleri sağlar edildi.

Yeni nedir Bu sürümde:.

  • çekirdek API artık pahalı işlemleri azaltmak hızlandırmak yardımcı olmak için çoklu-seviye toplama ağaçları destekler
  • Geliştirilmiş hata bildirimi belli yakaladım operasyonlar için eklenmiştir.
  • Spark'ın İskelesi bağımlılığı artık kullanıcı programları ile çatışmaları önlemek için gölgeli.
  • Spark şimdi bazı iletişim bitiş noktası için SSL şifreleme destekler.
  • Gerçek Zamanlı GC ölçütleri ve kayıt sayıları UI eklenmiştir.

sürüm 1.3.0 Yeni nedir:

  • çekirdek API şimdi destekler multi-level toplama ağaçlar Pahalı işlemleri azaltmak hızlandırmak yardımcı olur.
  • Geliştirilmiş hata bildirimi belli yakaladım operasyonlar için eklenmiştir.
  • Spark'ın İskelesi bağımlılığı artık kullanıcı programları ile çatışmaları önlemek için gölgeli.
  • Spark şimdi bazı iletişim bitiş noktası için SSL şifreleme destekler.
  • Gerçek Zamanlı GC ölçütleri ve kayıt sayıları UI eklenmiştir.

nedir sürüm 1.2.1 Yeni:

  • PySpark en sıralama operatörü artık büyük veri setleri için dış dökülmesini destekler .
  • PySpark şimdi 2GB daha yayın değişkenleri büyük destekler ve türlü sırasında dış dökülmesini gerçekleştirir.
  • Spark iş düzeyinde ilerleme Spark UI sayfasını ilerleme raporlaması için istikrarlı bir API ve işler tamamlandı.
  • gibi çıkış ölçümleri dinamik güncelleştirilmesi ekler
  • Spark artık görüntü ve diğer ikili biçimleri için ikili dosyaları okumak için desteği vardır.

sürüm 1.0.0 Yeni Ne:

  • Bu sürüm, Spark'ın standart kütüphaneleri genişletir, yeni tanıtan sağlayan SQL paketi (Spark SQL) kullanıcıların varolan Spark iş akışlarına entegre SQL sorguları.
  • MLlib, Spark'ın makine öğrenme kütüphane, seyrek vektör desteği ve birkaç yeni algoritmalar ile genişletilir.

nedir sürüm 0.9.1 Yeni:

  • Dış dökülmesini Sabit hash çarpışma hata
  • Diğer günlüğü backend'e dayanarak kullanıcılar için Spark'ın log4j Sabit çatışma
  • Sabit GRAPHX maven Spark montaj kavanoz eksik oluşturur

  • Akka Çerçeve boyutu aşan çıkış durumunu Haritayı nedeniyle
  • Sabit sessiz hataları
  • ASM kaldırıldı Spark'ın gereksiz doğrudan bağımlılık

  • LGPL lisansı çatışma nedeniyle varsayılan yapı
  • Kaldırılan metrikler-ganglionlar
  • dağıtım paketindekini Sabit hata içermeyen kıvılcım montaj kavanoz

nedir sürüm 0.8.0 Yeni:

  • Geliştirme bir Apache sowftware Vakfı taşındı Kuluçka projesi.

sürüm 0.7.3 Yeni Ne:

  • Python performansı
      : Python VM yumurtlama için Spark'ın mekanizması vardır JVM Python API hızlandırmak, büyük bir yığın boyutunu olduğunda daha hızlı bunu yapmak için geliştirilmiştir.
    • Mesos giderir: Mesos görev sonuçlarını deserializing yaparken işinize eklenen kavanozları şimdi üzerinde sınıf olacak
    • .
    • Hata Raporlama:. Serileştirilebilir olmayan istisnalar ve aşırı büyük görev sonuçları için daha iyi hata bildirimi
    • Örnekler:. UpdateStateByKey ile durum bilgisi akışı işleme bir örnek eklendi
    • Vücut:. Akış artık Çin'de inşa izin vermelisiniz Twitter4J repo bağlıdır Spark
    • foldByKey içinde Hata düzeltmeleri, akarsu sayısı, istatistik yöntemleri, dokümantasyon ve web arayüzü.

    sürüm 0.7.2 Yeni nedir:.

    • Scala sürüm 2.9.3 için güncellendi

    • Performans düzeltmeleri ve yapılandırılabilir depolama düzeyinde olmak üzere
    • Bagel Çeşitli gelişmeler.
    • Yeni API yöntemleri:. SubtractByKey, foldByKey, mapWith, filterWith, foreachPartition ve diğerleri
    • Her hesaplama aşamasına hakkında bilgi toplamak için, arayüz, SparkListener raporlama yeni ölçümler:. Görev uzunlukları, karıştırılır bayt vb
    • K-aracı ve bilgisayar pi dahil Java API kullanarak birçok yeni örnekler.

    sürüm 0.7.0 yeni Nedir:

    • 0.7 Spark PySpark adında bir Python API ekler <. / li>
    • Spark işleri şimdi Programdaki her dağıtılmış veri kümesi (RDD) bellek kullanımını izlemek için bir web panosunu başlatın.
    • Spark şimdi SBT yanı sıra Maven kullanılarak inşa edilebilir.

    sürüm 0.6.1 yeni Nedir:

    • Sabit aşırı agresif mesaj bu işçilerin neden olabilir zaman aşımları kümeden ayırın.
    • HDF'ler mevkiinde etkileyen, scheduler konak maruz vermedi bağımsız dağıtmak modunda bir hata düzeltildi.

    • Büyük ölçüde küçük değişimlerin hızlandırabilir
    • shuffle Geliştirilmiş bağlantı yeniden.
    • Blok yöneticisi Sabit bazı potansiyel kilitlenmeleri.
    • Mesos başarısız konak kimlikleri elde bir hata düzeltildi.

    • Spot örneklerinin daha iyi taşıma gibi
    • Çeşitli EC2 komut gelişmeler.
    • Yapılan bu Spark özelleştirilebilir bağlanan yerel IP adresi.
    • Hadoop 2 dağıtımları için destek.
    • Debian dağıtımlarında Scala bulmak için destek.

    sürüm 0.6.0 yeni nedir:.

    • Basit dağıtım
    • Spark'ın belgelerine yeni hızlı başlangıç ​​kılavuzu, ek dağıtım talimatları, yapılandırma rehberi, ayar rehberi ve geliştirilmiş Scaladoc API belgeleri ile genişletildi.
    • asenkron Java NIO kullanarak yeni bir iletişim yöneticisi shuffle işlemleri, özellikle veri veya iş birçok görevleri varken büyük miktarda gönderirken, daha hızlı çalışmasını sağlar.
    • Yeni bir depolama yöneticisi destekleyen başına veri kümesi depolama düzeyi ayarları (örn vb, hatta düğümlere çoğaltılır, diskte, serisi kaldırılan, bellekte veri kümesi tutmak için olsun).
    • Gelişmiş hata ayıklama.

  • Benzer yazılım

    vtop
    vtop

    13 Apr 15

    CacheBox
    CacheBox

    1 Mar 15

    Puppet
    Puppet

    11 Dec 15

    Yorumlar Apache Spark

    Yorum Bulunamadı
    Yorum eklemek
    Görüntülerde açın!