Yazılım detaylar:
lxml etrafında sarıcı olarak tasarlanan, şimdi normal HTML veri madenciliği gerekli tüm özellikleri ile lxml genişletir
Özellikler :.
- Genel özellikleri:
- Güzel jQuery gibi CSS seçicileri
- elemanı Basit erişim bağlıyor
- başka bir formata dönüştürmek HTML kolay yolu (BBcode, Markdown, vb)
- metin ile çalışmak için birkaç güzel işlevler
- lxml tüm orijinal özelliklerini kaydeder
- Fonksiyonlar saf metin ile çalışmak için:
- to_unicode - Unicode dize dize dönüştürme
- strip_accents - Bir dizeden Şerit aksan
- strip_symbols - Bir dizeden Şerit çirkin Unicode sembolleri
- strip_spaces - Bir dize aşırı boşluk Şerit
- strip_linebreaks - Bir dize aşırı satır sonlarını Şerit
Gereksinimler :
- lxml
Yorum Bulunamadı