lxml

Yazılım ekran görüntüsü:
lxml
Yazılım detaylar:
Versiyon: 3.4.1
Qayıt: 17 Feb 15
Geliştirici: Martijn Faassen
Lisans: Ücretsiz
Popülerlik: 72

Rating: nan/5 (Total Votes: 0)

lxml Python geliştiricileri kendi Python code.An XML işleme librarylxml (Genişletilebilir İşaretleme Dili XML hem XML ve HTML dosyaları içeriden çalışmak için izin, libxml2 ve libxslt kütüphaneleri bağlayan bir, sofistike, güçlü, özgür ve özgün Python modülü Python programlama dilinde yazılmış) işleme kütüphanesi, özellikle mümkün olduğunca ElementTree API şartname takip için tasarlanmış.
Böyle NG (Yeni Nesil), XPath, XML Şeması, c14n, XSLT (Genişletilebilir Stil Sayfası Dili) Relax gibi libxslt ve libxml2 kütüphaneler, özel işlevselliğini göstermek için ElementTree API uzatabilirsiniz, etc.Use lxml Python kodunu arayın XSLT stylesheetsDevelopers uzatma fonksiyonları vasıtasıyla XSLT stil ve XPath ifadeleri Python kodunu aramak için lxml programı kullanmak mümkün olacak. Öğreticiler geniş bir yelpazede proje & rsquo mevcuttur; s anasayfa (makalenin sonundaki bağlantıya bakınız).
Yazılım tasarımı ile açık kaynak ve Python & rsquo sadeliği ile yukarıda belirtilen kütüphanelerin özelliği eksiksiz ve hızını birleştiren; s API (Uygulama Programlama Arayüzü) .Getting lxmlIt ile başlayan kullanarak bir GNU / Linux dağıtımı üzerinde lxml yüklemek oldukça kolaydır Kaynak arşiv Softoware ve proje & rsquo dağıtılan; ın resmi web sitesi. Sadece Terminal uygulamasını açın ve ayıklanan arşiv dosyalarının konumu (örneğin cd /home/softoware/lxml-3.4.1) gidin, onu açarsınız, Ev dizininde kaydetmek, kaynak paketini indirin.
& Lsquo çalıştırın; yapmak & rsquo; Modern bir bilgisayarda yaklaşık 1-2 dakika sürer programı, derlemek komutunu. Başarılı bir derleme sonra, & lsquo çalıştırın; install & rsquo yapmak; root veya komut & lsquo; sudo install & rsquo yapmak; ayrıcalıklı bir kullanıcı olarak komut GNU / Linux ve systemsThe yazılım işletim Microsoft Windows resmen GNU / Linux ve Microsoft Windows işletim sistemleri desteklenir lxml sistem wide.Supports yüklemek için. Başarıyla 32-bit ve 64-bit bilgisayarlarda test edilmiştir

Bu sürümde Yeni nedir:.

  • Özellikler eklendi:
  • Yeni htmlfile HTML jeneratör artan xmlfile seri API eşlik edecek. Burak Arslan tarafından Patch.
  • Bugs sabit:
  • lxml.sax.ElementTreeContentHandler onun üst sınıfı ilklendirmeyecektir vermedi.

sürüm 3.3.1 yeni nedir:

  • Bugs sabit:
  • LP # 1014290: parser.feed ile çözümlenen HTML belgeleri () etiketi yineleme sırasında öğeleri bulmak için başarısız
  • .
  • LP # 1273709: PYPY İnşaat nedeniyle * () PYPY C-API PyUnicode_Compare () ve PyByteArray _ için destek eksik başarısız
  • .
  • LP # 1274413: MSVC Derleme nedeniyle eksik & quot başarısız; stdint.h & quot; standart başlık dosyası.
  • LP # 1274118: iterparse () BOM dosyaları öneki ayrıştırmak için başarısız
  • .

sürüm 3.0 Alpha 2 yeni nedir:

  • Özellikler eklendi:
  • elemanların .iter () yöntemi şimdi quot & gibi etiket argümanları kabul {*} adı & quot; Herhangi bir ad verilen bir yerel adıyla elemanları aramak için. Bu eklenmesiyle, joker tüm kombinasyonları artık işe beklendiği gibi: & quot; {ns} adı & quot ;, & quot; {} adı & quot ;, & quot; {*} adı & quot ;, & quot; {ns} * & quot ;, & quot; {} * & quot; ve & quot; {*} * & quot ;. Bu & Not quot; adı & quot; & quot eşdeğerdir; {} adı & quot ;, ancak & quot; * & quot; & quot; {*} * & quot ;. strip_attributes (), strip_elements () ve strip_tags () işlevleri, aynı değişim) .getiterator (için .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren () ve .itertext () yöntemleri uygular yanı sıra iterparse () sınıf olarak.
  • C14N dahil önekleri belirterek sağlar özel seri sırasında üst seviyeye terfi edilecek.
  • Bugs sabit:
  • yem () ayrıştırıcı arayüzü içine uzun Unicode dizeleri Passing tüm dizeyi okunamadı.

sürüm 2.3.5 yeni nedir:

  • Crash element.remove metin düğümleri birleştirme ( ).
  • saksafon / hedef çözümleyici Crash boş doctype raporlama.

nedir sürüm 2.3.4 Yeni:

  • Crash bir nsmap (Eleman özelliği) ile oluştururken Boş ad URI.
  • nedeniyle yarış durumu Crash hataları (veya kullanıcı mesajları) dişli XSLT işleme sırasında ortaya çıktığında.
  • derleme hataları görmezden XSLT stil derleme.

sürüm 2.3.2 yeni nedir:

  • Özellikler eklendi:
  • lxml.objectify.deannotate () somutlaştırabilir ad alanı bildirimlerini kaldırmak (ve genellikle ad bildirimleri temizlemek) tipi açıklamaları çıkardıktan sonra yeni bir boolean seçenek cleanup_namespaces sahiptir.

  • Kullanıcı tarafında lxml.etree bir aksi takdirde gereksiz ithalat önlemek için etree.SubElement bir kopyası olarak kendi alt öğesi () işlevini kazanmış lxml.objectify
  • .
  • Bugs sabit:
  • Sabit & quot; soyundan & quot; cssselect bug (lxml 2.3.1 ilk düzeltme sonra) ikinci kez. Bir önceki değişiklik çevrilmiş ifade XPath tabanlı değerlendirme için ciddi bir performans gerileme sonuçlandı. Bu daha önce 2.3.1 çalışmış XSLT konum yolları olarak üretilen XPath ifadeleri bazı kullanımını kırar unutmayın.
  • cssselect bazı seçiciler Sabit ayrıştırma. Bağdaştırıcılarla & quot sonra boşluk; & Gt; & quot ;, & quot; + & quot; ve peroksiasit ağartma ön-quot; şimdi doğru göz ardı edilir. Daha önce soyundan combinator olarak ayrıştırıldı edilir. Örneğin, & quot; div & gt; .foo & quot; aynı ayrıştırıldı & quot; div & gt; * .foo & quot; div & gt; bunun yerine & quot .foo & quot;.

sürüm 2.3.1 yeni nedir:

  • Özellikler eklendi:
  • Yeni seçenek, belirli etiketler ve bunların içeriğini (yani onların bütün alt ağaç) kaldırmak için lxml.html.clean olarak kill_tags.

  • Işleme talimatları metin içeriğinden sözde özelliklerini ayrıştırmak için işleme talimatları
  • pi.get () ve pi.attrib.
  • lxml.get_include () lxml.etree karşı dış C kodu derlemek için kullanılan yolları dahil bir listesini verir. Kod kendisi lxml olarak aynı başlık dosyası sürümleri karşı derlemek gerektiğinde bu özellikle statik olarak bağlı lxml için gereklidir oluşturur.
  • Resolver.resolve_file () dosyası (benzeri) nesne okuma veya sonra değil kapalı olacak eğer yapılandıran bir ek seçenek close_file alır. Kullanıcı bir referansı tutmak beklenmiyor Varsayılan olarak, dosya, kapalı olacaktır.
  • Bugs sabit:
  • HTML temizleme 'verileri:' çıkarmak değildi. Bağlantıları
  • html5lib ayrıştırıcı entegrasyonu şimdi kütüphanede yeni sürümleri ile iş yapar html5lib kendisi 'resmi' uygulaması kullanır.

  • Ilgili başlangıç ​​olay varsayılan ad olması, aynı düz etiket adı olayla zaman lxml.sax
  • , endElementNS () yanlış bir düz etiket adı reddetmek olabilir.
  • Bir açık dosya gibi bir nesne ayrıştırma geçirilen zaman () veya iterparse (), çözümleyici artık yakın bu kullanımdan sonra. Bu, tüm dosyaların kapalı olacağını lxml 2.3 bir değişiklik döner. Düzgün hata durumlarda da, dosya (-like) nesnesini kapatmak için kullanıcıların sorumluluğundadır.
  • lxml.html.cleaner içinde onaylama hatası üst düzey elemanları atarak.

  • Lxml.cssselect
  • , css yerine 'A / torun :: B' xpath ('A / torun-veya-self :: düğüme () / B' için kısa) 'A // B' kullanmak soyundan seçici ('A B'). Bu WebKit ve Firefox, seçici davranışı ile tutarlı olması için bir kaç kenar durumlarda yapar ve (xsl kullanım için: şablon maç) daha fazla css ifadeler geçerli konum yolları yapar.
  • lxml.html olarak, seçili olmayan etiketleri artık toplanan form değerleri göstermek.
  • Ekleme / çoktan seçmeli form alanı düzgün onları seçer ve onları unselects gelen / değerleri kaldırarak.
  • Diğer değişiklikler:
  • Statik --Forum-dir seçeneği ile indirme dizini belirtebilirsiniz oluşturur.

sürüm 2.3 yeni nedir:

  • Özellikler eklendi:

  • Çocuklar ararken üst ad aksine
  • lxml.objectify, boş bir ad anlamında '{} etiketi' alır.
  • Bugs sabit:
  • Bir dosya gibi bir nesne okuma bittiğinde, ayrıştırıcı derhal .close () yöntemini çağırır.

  • Ayrıştırma bittiğinde
  • iterparse () hemen giriş dosyayı kapatır.
  • (libxml2'nin 2.7.8 sabit) bir bilmecik kırık belge ayrıştırma sonra işlevsel olmayan devlet HTML çözümleyici bırakabilirsiniz libxml2 hata için etrafında çalışın.

  • HTML temizleme kodu
  • marque etiketi doğru adlandırılır kayan yazı.
  • Diğer değişiklikler:
  • Cython-düzey C-API bazı kamu işlevleri daha açık dönüş türleri vardır.

sürümünde yeni 'nedir 2.2.8 / 2.3 Beta 1:

  • yeni libxml2 sürümleri ne zaman Crash yerine XInclude düğümlerinde özelliklerini vardı belgeler arasında elemanları hareketli.
  • XMLID () fonksiyonu opsiyonel ayrıştırıcı ve base_url parametreleri eksikti.
  • () PY3 kırıldı. Iterparse joker etiketleri aranıyor
  • lxml.html.open_in_browser () nedeniyle os.tempnam kullanımı Python 3 işe yaramadı. Şimdi isteğe bağlı 'kodlama' parametresini alır.

Gereksinimler :

  • Python

Benzer yazılım

DAPS
DAPS

20 Feb 15

plywood
plywood

20 Feb 15

LaTeX2Markdown
LaTeX2Markdown

14 Apr 15

ws_docutils
ws_docutils

14 Apr 15

Geliştirici Diğer yazılım Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

Yorumlar lxml

Yorum Bulunamadı
Yorum eklemek
Görüntülerde açın!