uni2ascii ve ascii2uni UTF-8 Unicode ve dahil 7-bitlik ASCII eşdeğerleri çeşitli herhangi arasında dönüştürme: onaltılık ve ondalık HTML sayısal karakter başvuruları, U-çıkar, standart onaltılık ve ham onaltılık.
Unicode karakter kümesi işleyebilir ama 8-bit güvenli olmayan edebilirsiniz Web programlarına Metin girerken, ve hata ayıklama, program kaynak Unicode metin dahil olmak üzere bu tür ASCII karşılıkları yararlıdır.
Unicode kullanılabilir kaçar gibidir:
- HTML onaltılık sayısal karakter referansları (örn)
- HTML ondalık sayısal karakter referansları (örn ȳ)
- U-kaçar, Python kullanılan (örn u00E9)
- Örneğin BMP, ötesinde BMP ve U-kaçar içinde u-kaçar u00E9 ancak U00010024.
- U -escapes (örneğin U 00E9)
- U-kaçar (örn U00E9)
- U-kaçar (örn u00E9)
- Köşeli parantez içinde U-kaçar (örn)
- X-kaçar (örn x00E9)
- Parantez x-kaçar (örneğin x {00E9})
- Standart onaltılık (örn 0x00E9)
- Ham onaltılık (örn 00E9)
uni2ascii bazı bazı programlar yalnızca birini veya diğerini kabul beri onaltılık basamak olarak af üst davayı AF veya alt-davayı oluşturmak için olup olmadığının belirlenmesi bir komut satırı bayrağını kabul eder. ascii2uni ya kabul eder.
Varsayılan olarak uni2ascii durumunda, ASCII aralığının dışında fazla karakter dönüştürülür. ASCII karakterleri de dönüştürülür bile onların dönüşüm açıkça talep edilmediği sürece, satırsonu korunur. Dönüşüm açıkça talep edilmediği sürece boşluk karakterleri de korunur. Boşluk karakterleri dönüştürülmüş değilse 7- içindeki çıkışını tutacak şekilde üç ASCII olmayan boşluk karakterleri (Etiyopyaca kelime boşluk, Ogham uzay ve ideografik alan) durumunda, bu ASCII boşluk (0x20) ile değiştirilir bit ASCII aralığı.
Bu paket dört programlarını içerir. Ana program uni2ascii olduğunu. Bu C ile yazılmıştır ve derlenmiş olmalıdır. uni2html.py uni2ascii gelen öncüsü. Python ile yazılmış olduğundan, derlenmeye gerekmez ve herhangi bir geçerli bilgisayar hakkında çalıştırmak gerekir. uni2ascii ki, aksi takdirde daha üstün:
- Bu çıkış biçimleri daha geniş bir yelpazede oluşturur.
- Yaklaşık 20 kat daha hızlıdır.
- Bu tam 32 bit Unicode aralığında girişini yönetir. Buna karşılık, yalnızca uni2html kolları
Temel Dilde Düzlem çünkü bugünkü Python de (Plane 0) dahili 16-bit tamsayı kullanarak Unicode kodlanmış metin temsil eder. Lineer B veya Ugaritik, diyelim ki, metin var ise, size uni2ascii gerekir.
Bu hataları raporlama daha iyi bir iş yapar. Mal-oluşturulmuş UTF-8, bu dosyanın başından itibaren karakter sayısı (0'dan başlayarak) cinsinden ve bayt sayısı açısından hem de hata yerini bildirir gibi onun girişine bir hata, karşılaşırsa Dosyanın başından (ayrıca 0'a başlayarak). (UTF-8 kodlu karakter bir ila dört bayt kaplar beri Karakter sayısı ve byte sayısı genellikle aynı değildir.) Python sürümü raporları sadece karakter sayısı. uni2ascii ayrıca hata doğası hakkında bilgi sağlar.
Üçüncü program ascii2uni, uni2ascii tersidir. Bu Unicode karakterler ASCII temsilleri çeşitli içeren metni kabul eder ve UTF-8 Unicode oluşturur.
Dördüncü program ascii2uni.py içeren 7 bit ASCII okur u kaçtı Python ve Tcl kullanılan ve UTF-8 Unicode dönüştürür olarak, Unicode. Bu ascii2uni bir genelleme olduğu özgün bir program
Bu sürümde Yeni nedir:. Uni2ascii olarak
- Sabit hata bazı durumlarda hangi subsitution sayımı Debian hata # 626268 sabitleme, çok yüksek oldu.
- getline yoksun NetBSD durumu ele Yamalı.
- uzay ve yeni satır dışındaki ASCII aralığında karakterleri dönüştürme gibi saf seçeneği semantik Aydınlatılmış. Sabit hata olduğu bu UTF8 türleri için doğru bir şekilde uygulandığında değildi.
sürüm 4.17 yeni Nedir:
- yakın ASCII eşdeğer aşağıdaki dönüşümleri uni2ascii gelen eklendi: U satırsonu dönem için 'o', U + 00B7 orta nokta, yeni satır U + 0085 sonraki satıra, U + 2028 hat ayırıcı için 2022 mermi.
sürüm 4.16 yeni Nedir:
- Q formatında ascii2uni tekrar çalışır .
- Eklendi U + 2033 ÇİFT PRIME uni2ascii e biçimini kullanarak altında yakın ASCII eşdeğerine dönüştürülür karakter.
sürüm 4.15 yeni nedir :
- Renamed endian.h ile çatışma ortadan kaldırmak için u2a_endian.h için Dış endian.h.
- Bu POSIX2008 olarak standart olarak ascii2uni.c GNU getline'ın kaldırıldı kopyası.
nedir sürüm 4.14 Yeni:
- Q formatının kullanımı ile müdahale bir hata düzeltildi uni2ascii. içinde
- Sabit hata + 2502 U ve U + 2503 hangi ascification içinde çıkışa çift tırnak ekledi.
- Sabit bir hata olduğu S seçeneği oluşturulan -a & quot; çok karakter & quot Converted; nedeniyle hata ayıklama kodu bırakarak her karakter için hattı.
sürüm 4.13 yeni Nedir:
karakterlerin aşırı sayıda ASCII değiştirildi neden
- Sabit hata rapor edilecektir.
nedir sürüm 4.12 Yeni:
- Her iki program artık izin girdi dosyası adı üzerinde belirtilmesi yönlendirme olmadan komut satırı.
nedir sürüm 4.11 Yeni:
- Bu sürüm için destek ekler & lt; XX & gt; & lt; XX & gt; ve% uXXXX biçimleri.
nedir sürüm 4.10 Yeni:
- Bu sürüm Y argümanı yapılan hata düzeltmeleri -a ascii2uni no-op bayrağı ve man sayfalarına düzeltir ve her iki program için -a bayrak Y ve Q argümanlar için yardımcı olur.
- Y argümanı artık uni2ascii bir hatadır.
- sürüm bilgileri ve eylem özetleri daha bilgilendirici.
Yorum Bulunamadı