Yazılım detaylar:
speedparser Evrensel Yem Ayrıştırıcı bir kara-kutu reimplementation olduğunu. . Bu yem ayrıştırma ve isteğe bağlı HTML temizleme & nbsp lxml kullanır; feedparser ile speedparser uyumluluk bu alt kümesi dışındaki alanlar için çok alanlarda sıkı bir alt kümesi için iyi, ama kötü. Alanlar daha fazla veya daha az uyumlu olduğu ve olmadığı hangi daha fazla bilgi için testler / speedparsertests.py bakın.
Speedparser HTML ile yaklaşık 65 yemler / sn yönetir ise sadece tek çekirdek üzerinde çalışan Intel Core i5 750, günü, feedparser testi besleme sette 2.5 yemler / sn yönetilen, (kabaca 4200 testler / feeds.tar.bz2 içinde "beslemeleri") . temizliği ve kapalı temizlik 200 yemler / sn
Gereksinimler :
- Python
- lxml
Yorum Bulunamadı