Scrappy Python% 100 yazılır ve sayfa izleme, Web arama motorları ve hatta kod testleri için basit veri madenciliği için kullanılabilir.
Scrapy kelimenin gerçek anlamıyla bir arama motoru değil, ancak (indeksleme parçası olmadan) gibi davranır. Yine scrapy üzerinde arama motoru mantığı oluşturmak için harika bir araç olabilir.
Bu çerçevede gerçek gücü scrapy jenerik veya özel arama örümcekler (tarayıcılarının) oluşturmak için bir sistem olma, onun çekirdeğin çok yönlülüğü de dayanır.
Bu belgeleri ve mevcut öğreticiler üzerinde hızlı bir görünüme sahip, teknik olmayan kullanıcılar için çok karmaşık gelebilir iken, scrapy bunun dışında tüm sabit işlerini almak ve tüm süreci azaltmayı başardı nasıl görmek oldukça basit, sadece (kolay için, küçük tarayıcılarının) kod birkaç satır
Bu sürümde Yeni nedir:.
- demektedir istek yolu FtpClient geçmeden önce, zaten Kaçış Yollarının.
- MANIFEST.in içinde dağılımını kaynak testler / ekleyin.
nedir sürümü 1.0.1 Yeni
- demektedir istek yolu FtpClient geçmeden önce, zaten Kaçış Yollarının.
- MANIFEST.in içinde dağılımını kaynak testler / ekleyin.
sürümünde 0.24.6 yeni Nedir:
- şablonlar UTF8 kodlama başlığını ekleyin
- Telnet konsol şimdi varsayılan olarak 127.0.0.1 bağlanır
- Güncelleme debian / ubuntu yüklemek talimatları
- lxml XPath değerlendirmelerde akıllı dizeleri devre dışı bırakın
- HTTP önbelleği katman için varsayılan olarak dosya sistemi tabanlı önbelleği Restore
- scrapy kabukta geçerli paletli Açığa
- CSV ve XML ihracatçılar karşılaştıran testsuite geliştirin
- Yeni dışına / süzülür ve dışına / etki istatistikleri
- CrawlSpider jeneratör olarak destek process_links
sürümünde 0.24.5 yeni Nedir:
- şablonlar UTF8 kodlama başlığını ekleyin
- Telnet konsol şimdi varsayılan olarak 127.0.0.1 bağlanır
- Güncelleme debian / ubuntu yüklemek talimatları
- lxml XPath değerlendirmelerde akıllı dizeleri devre dışı bırakın
- HTTP önbelleği katman için varsayılan olarak dosya sistemi tabanlı önbelleği Restore
- scrapy kabukta geçerli paletli Açığa
- CSV ve XML ihracatçılar karşılaştıran testsuite geliştirin
- Yeni dışına / süzülür ve dışına / etki istatistikleri
- CrawlSpider jeneratör olarak destek process_links
nedir sürümü 0.22.0 Yeni
- scrapy.spider.BaseSpider scrapy.spider için Rename .Spider
- INFO seviyesine ayarları ve katman başlatma bilgi tanıtın
- Destek Partials
- Zehir yoluyla indiviual testler çalışan izin
- Bağlantı presi tarafından göz ardı Güncelleme uzantıları
- Seçiciler varsayılan EXSLT ad alanları kayıt
- birleştirin öğesi yükleyiciler
- RFPDupeFilter sınıfı kolayca subclassable
- geliştirin test kapsamı ve önümüzdeki Python 3 desteği
get_func_args util
adlandırma seçiciler benzer
sürümünde 0.20.1 yeni Nedir:
- include_package_data yayınlanan kaynaklardan tekerlekleri oluşturmak için gereklidir.
sürümünde 0.18.4 yeni nedir.
- kabuk komut isteği yerine Sabit AlreadyCalledError
- Sabit start_requests lazyness ve erken askıda kalıyor.
sürümünde 0.18.1 yeni nedir.
- kiraz tarafından eklenen kaldırıldı ekstra ithalat değişikliklerini aldı
- bükülmüş öncesi 11.0.0 altında testler tarama düzeltildi.
- py26 sıfır uzunlukta alanlarını {} biçimlendirmek olamaz.
- ilişkisiz tepkiler üzerine test PotentiaDataLoss hataları.
- iyi tepkiler olarak içerik uzunluğu veya Transferi-kodlama olmadan yanıtları davranın.
- hiçbir ResponseFailed dahil mi.
http11 işleyici etkin değilse
Gereksinimleri
- Python 2.7 veya daha yüksek
- Twisted 2.5.0 veya daha yüksek
- libxml2 2.6.28 veya üstü
- pyOpenSSL
Yorum Bulunamadı