Ruby için Nokogiri HTML ayrıştırıcı dayanarak, sterilize metin bloğunun HTML kaldırmak için bir beyaz liste tabanlı bir sistemdir.
"Beyaz liste" tekniği kurulum için geliştiricilere sterilize o "kabul edilebilir" HTML ne düşündüğü için referans olarak kullanacağı HTML etiketleri bir listesini sağlayacaktır.
Listede olmayan diğer her HTML etiketi çözümlü metin silinecektir.
Sterilize standartlarına uyumlu olan veya bozuk HTML ile çalışabilirsiniz.
Kütüphane algılamak ve HTML etiketlerini, niteliklerini ve protokoller filtreleyebilirsiniz.
temizlenmiş metin her zaman geçerli HTML veya XHTML olarak outputted edilecektir.
Geliştiriciler kendi projelerine başlamanıza yardımcı olacak, sterilize dahil bir kaç hazır yapılandırmaları ile birlikte gelir. Daha fazla bilgi için README dosyasını kontrol edin
Bu sürümde Yeni nedir:.
- Eklenenler iki yeni CSS yapılandırma ayarları: at_rules_with_properties ve:. at_rules_with_styles
- tam destek eklendi.
- -kurallar rahat config aşağıdaki CSS eklendi.
- rahat config CSS özellikleri bir sürü eklendi. Burada tam listesini görüntüleyin.
- Küçük performans iyileştirmeleri.
- CSS @ Page kurallarının ayrıştırma etkilenen bir düzeltme almak için.
Tüm sayfa kenar kutusu kuralları için destek dahil rahat config CSS @ Page kuralları için
1.0.2 için Crass Yükseltildi
sürüm 3.1.2 yeni Nedir:
- Sabit: #document ve #fragment donmuş başarısız dizeleri ve istemeden de UTF-8 dışında bir kodlama kullanıldığında donmamış dizeleri değiştirmek ya da karakterler içeriyorsa HTML izin olamazdı.
sürüm 3.0.2 yeni Nedir:
1.1, çünkü 1.1.12'de için Nokogumbo Güncelleme
- . 11 sessizce son sürümde almaya çalışıyorlardı değişikliği döndürülür.
sürüm 3.0.0 yeni Nedir:
- Crass kullanarak Eklenenler gelişmiş CSS Sanitization desteği olan CSS sözdizimi Modülü Seviye 3 ayrıştırma spec ile tam uyumlu. beyaz listeye & # x3c içeriği; stili & # x3e; elementler ve stil HTML niteliklerini CSS olarak dezenfekte edilecek, ya da kendiniz CSS stil veya özellikleri sterilize etmek için sterilize :: CSS sınıfını kullanabilirsiniz.
- Bir eklendi: allow_doctype ayarı. Gerçek, iyi biçimlendirilmiş doctype tanımları belgelerinde izin verilecektir zaman. Ne zaman false (varsayılan), doctype tanımları belgelerden silinecektir. Doctype tanımları bu ayardan bağımsız, parçalar halinde asla izin verilmez.
- çeşitli özelliklere ek olarak, rahat config aşağıdaki unsurları eklendi. Makale, bir kenara, vücut, veriler, div, altbilgi, kafa, başlık, html, ana, nav, bölüm, açıklık, stil, başlık
- : whitespace_elements yapılandırma artık Hash olduğunu ve daha önce onlar kaldırılmış konum bu unsurların sonra girilmelidir metni belirlemenizi sağlar. Eski stil Dizi tabanlı yapılandırma değeri hala geriye dönük uyumluluk için desteklenir.
- Uygun olmayan Unicode karakterler artık HTML kaldırılır.
- Sabit:
- Non-tag parantez; 1 & # x3e; 2 ve 2 # x3c; 1 & quot; şimdi ayrıştırılır ve quot olma ve HTML5 spec göre doğru kaçtı; 1 & gt; 2 ve 2 lt; 1 & quot;.
- geçişi sırasında geçerli düğüm sonra eklenen Kardeşleri şimdi de geçilen edilir. Önceki sürümlerde onlar sadece atlandı.
- Nokogiri, smacked ve bazı elementlerin sonra yeni satır eklemeyi durdurmak için talimat edilmiştir.
Bu ayrıştırılır oluyor önce
& Quot gibi girdi
Insanlar kahretsin, oraya koymak olurdu orada satırsonu istedim çünkü eğer
nedir sürüm 2.0.6 Yeni:
- Sürüm 2.0.5 yanlışlıkla bazı işler-dahil ana şube içine onların yol yaptık olmamalıdır -ilerleme değişir.
sürüm 1.2.1 yeni Nedir: remove_contents yapılandırma ayarı:
- eklendi. True olarak ayarlanırsa, sterilize elemanları kendilerini ilaveten olmayan tüm beyaz listede elementlerin içeriğini kaldıracaktır. Eleman isimleri bir Array olarak ayarlanırsa, sterilize yalnızca bu unsurların (süzülmüş zaman) içeriğini kaldırmak ve diğer filtrelenmiş unsurların içeriğini bırakacaktır. [Dizi seçeneği için Rafael Souza sayesinde]
- eklendi. varsayılan 'utf-8'.
- transformatörler geçirilen çevre karma artık içerir.
- Şimdi istenmeyen NameError ziyade anlamlı sterilize :: Hata istisnası çıkaracağız bir trafo bir Hash veya sıfır dışında başka bir şey döndürülüyor.
Belirtilmesi HTML çıkış için karakter kodlamasını izin ayarı output_encoding yapılandırma:
Geçerli HTML düğümün küçük adını (; div & quot; örneğin & quot) içeren düğüm_adı öğesi :
Gereksinimleri :
- Ruby 1.9.2 veya daha yüksek
- Nokogiri 1.4.4 veya daha yüksek
Yorum Bulunamadı