Apache Spark

Yazılım ekran görüntüsü:
Apache Spark
Yazılım detaylar:
Versiyon: 1.6.0 Güncelenir
Qayıt: 6 Mar 16
Lisans: Ücretsiz
Popülerlik: 70

Rating: nan/5 (Total Votes: 0)

Apache, Spark veri analizi ve manipülasyon programları için işlem hızlarını geliştirmek için tasarlanmıştır.

Onlar ana, ne de olmayan veri işleme uygulamaları için bu yararlı değil çünkü çoğunlukla, Java ve Scala yazılı ve diğer sistemlerde bulunmayan özellikleri sağlar edildi.

Kıvılcım ilk UC Berkeley AMP Lab oluşturulan ve daha sonra Apache Yazılım Vakfı'na bağışlandı

Bu sürümdeki yeni Nedir:.

  • Birleştirilmiş bellek Yönetimi -. yürütme ve yerine bölgelerin özel bölümü önbelleğe alma için Paylaşılan bellek
  • Parke Performansı - düz şemalar kullanırken Parke tarama performansını artırmak
  • .
    farklı toplamalardan sahip sorguları için
  • Geliştirilmiş Sorgu planlayıcısı -. ayrı toplamalardan Sorgu planları farklı sütunlar yüksek önem düzeyi olduğunda daha sağlam
  • Adaptif sorgu yürütme -. Otomatik katılır ve toplamalardan için redüktör sayısını seçmek için İlk destek
  • Veri Kaynağı API çift filtreleri kaçınmak -. Filtre Pushdown ile bir veri kaynağı uygularken, geliştiriciler artık bir itti aşağı filtre değerlendiren çift önlemek için Spark SQL söyleyebilir
  • Hızlı null güvenli katıldı - null güvenli eşitlik kullanılarak Katıldı (& # x3c = & # x3e;) şimdi bir cartisian ürünü bilgisayar yerine SortMergeJoin kullanarak yürütecek
  • .
    In-bellek Columnar Önbellek Performans
  • - DataFrames veya SQL karmaşık türlerini içerir verileri önbelleğe zaman (en 14x) Önemli hızlandırmak
  • .
    Off-Öbek Bellek Kullanımı
  • SQL Yürütme - Destek sorgu yürütme yapılandırmak için GC yükü önlemek için off-yığın belleği kullanarak meydana gelmesi

sürüm 1.5.2 yeni Nedir:

  • çekirdek API artık destekler çok düzeyli toplama ağaçları pahalı işlemleri azaltmak hızlandırmak yardımcı olur.
  • Geliştirilmiş hata raporlama bazı yakaladım işlemler için eklenmiştir.
  • Spark'ın İskele bağımlılığı artık kullanıcı programları ile çatışmaları önlemek için gölgeli.
  • Spark şimdi bazı iletişim bitiş noktası için SSL şifreleme destekler.
  • Gerçek Zamanlı GC ölçütleri ve kayıt sayıları UI eklenmiştir.

sürüm 1.4.0 yeni Nedir:

  • çekirdek API artık destekler çok düzeyli toplama ağaçları pahalı işlemleri azaltmak hızlandırmak yardımcı olur.
  • Geliştirilmiş hata raporlama bazı yakaladım işlemler için eklenmiştir.
  • Spark'ın İskele bağımlılığı artık kullanıcı programları ile çatışmaları önlemek için gölgeli.
  • Spark şimdi bazı iletişim bitiş noktası için SSL şifreleme destekler.
  • Gerçek Zamanlı GC ölçütleri ve kayıt sayıları UI eklenmiştir.

Hangi sürümü 1.2.0 yeni

  • PySpark en sıralama operatörü şimdi büyük veri setleri için harici dökülmesini destekler .
  • PySpark şimdi 2GB daha yayın değişkenleri büyük destekler ve türlü sırasında harici dökülmesini gerçekleştirir.
  • Spark iş düzeyinde ilerleme Kıvılcım UI sayfayı, ilerleme raporlama için istikrarlı bir API ve işler tamamlandı.
  • olarak çıktı metrik dinamik güncelleştirilmesi ekler
  • Spark şimdi görüntüleri ve diğer ikili biçimleri için ikili dosyaları okumak için desteği vardır.

sürüm 1.0.0 Yeni Ne:

  • Bu sürüm, Spark'ın standart kütüphaneleri genişletir yeni tanıtan sağlayan SQL paketi (Kıvılcım SQL), kullanıcıların mevcut Spark iş akışlarına entegre SQL sorguları.
  • MLlib, Spark'ın makine öğrenme kütüphanesi, seyrek vektör desteği ve birkaç yeni algoritmalar ile genişletilmiştir.

Hangi sürümü 0.9.1 yeni

  • Dış dökülmesini Sabit karma çarpışma hata
  • Diğer günlüğü backends dayanarak kullanıcılar için Spark'ın log4j Sabit çatışma
  • Sabit GRAPHX maven Spark montaj kavanoz eksik oluşturur

  • Akka Çerçeve boyutu aşan çıkış durumunu harita nedeniyle
  • Sabit sessiz hataları
  • ASM kaldırıldı Spark'ın gereksiz doğrudan bağımlılık

  • LGPL lisansı çatışma nedeniyle varsayılan inşa
  • Kaldırılan ölçümlerini-ganglionlar
  • dağıtım paketindekini Sabit hata içermeyen kıvılcım montaj kavanoz

Hangi sürümü 0.8.0 yeni

  • Geliştirme bir Apache sowftware Vakfı taşındı inkübatör projesi.

sürüm 0.7.3 Yeni Ne:

  • Python performans
      : Python VM yumurtlama için Spark'ın mekanizması vardır JVM Python API hızlandırmak, büyük bir yığın boyutunu olduğunda daha hızlı bunu yapmak için geliştirilmiştir.
    • Mesos giderir: Mesos görev sonuçlarını deserializing zaman iş eklenen kavanozları şimdi üzerinde sınıf olacak
    • .
    • Hata raporlama. Serileştirilebilir olmayan istisnalar ve aşırı büyük görev sonuçları için daha iyi hata raporlama
    • Örnekler:. UpdateStateByKey ile durum bilgisi akışı işleme örneği eklendi
    • Yapı:. Akış artık Çin'de inşa izin vermelisiniz Twitter4J repo bağlıdır Spark
    • foldByKey içinde hata düzeltmeleri, akarsu sayısı, istatistik yöntemleri, dokümantasyon ve web arayüzü.

    sürüm 0.7.2 yeni Nedir:.

    • Scala sürüm 2.9.3 için güncellendi

    • performans düzeltmeleri ve yapılandırılabilir bir depolama seviyesi dahil
    • Bagel çeşitli iyileştirmeler.
    • Yeni API yöntemleri:. SubtractByKey, foldByKey, mapWith, filterWith, foreachPartition ve diğerleri
    • Her hesaplama aşamasında hakkında bilgi toplamak için, arayüz, SparkListener raporlama yeni ölçütleri:. Görev uzunlukları, karıştırılır bayt vb
    • K-araç ve bilgi işlem pi dahil olmak üzere Java API kullanarak birçok yeni örnekler.

    sürüm 0.7.0 yeni Nedir:

    • 0.7 Spark PySpark denilen bir Python API ekler <. / li>
    • Kıvılcım işleri şimdi programda her dağıtılmış veri kümesi (RDD) bellek kullanımını izlemek için bir web panosunu başlatın.
    • Kıvılcım şimdi SBT ek olarak Maven kullanılarak inşa edilebilir.

    sürüm 0.6.1 yeni Nedir:

    • Sabit aşırı agresif mesaj bu işçileri neden olabilir zaman aşımları kümeden ayırın.
    • HDF'ler mevkiinde etkileyen, scheduler hostname maruz vermedi bağımsız dağıtmak modunda bir hata düzeltildi.

    • büyük ölçüde küçük değişimlerin hızlandırabilir
    • shuffle Geliştirilmiş bağlantı yeniden.
    • Blok yöneticisi Sabit bazı potansiyel kilitlenmeleri.
    • Mesos başarısız konak kimliklerini almak bir hata düzeltildi.

    • Spot örnekleri daha iyi işlenmesi gibi
    • Çeşitli EC2 komut gelişmeler.
    • Yapılan bu Spark özelleştirilebilir bağlanan yerel IP adresi.
    • Hadoop 2 dağıtımları için destek.
    • Debian dağıtımlarında Scala bulmak için destek.

    sürüm 0.6.0 yeni Nedir:.

    • Basit dağıtım
    • Spark'ın belgeleri yeni bir hızlı başlangıç ​​rehberi, ek dağıtım talimatları, yapılandırma rehberi, ayar rehberi ve geliştirilmiş Scaladoc API belgeleri ile genişletilmiştir.
    • asenkron Java NIO kullanarak yeni bir iletişim yöneticisi shuffle işlemleri, özellikle veri veya iş birçok görevleri varken büyük miktarda gönderirken, daha hızlı çalışmasını sağlar.
    • Yeni bir depolama yöneticisi destekler başına veri kümesi depolama düzeyi ayarları (örneğin, vb diskte, serisi kaldırılan, hatta düğümleri arasında çoğaltılır, bellekte veri kümesi tutmak için olsun).
    • Gelişmiş hata ayıklama.

  • Geliştirici Diğer yazılım Apache Software Foundation

    Apache Wink
    Apache Wink

    13 Apr 15

    Apache Jena
    Apache Jena

    10 Feb 16

    Apache Kafka
    Apache Kafka

    10 Dec 15

    Apache Stanbol
    Apache Stanbol

    13 Apr 15

    Yorumlar Apache Spark

    Yorum Bulunamadı
    Yorum eklemek
    Görüntülerde açın!