PDFTextStream

Yazılım ekran görüntüsü:
PDFTextStream
Yazılım detaylar:
Versiyon: 2.6.0
Qayıt: 20 Feb 15
Lisans: Shareware
Fiyat: 1900.00 $
Popülerlik: 2

Rating: nan/5 (Total Votes: 0)

PDFTextStream projesi Java, Python ve .NET için kullanılabilir bir PDF metin ve metadata çıkarma kütüphanedir.
Bu (Acrobat 7 tarafından kullanılan v1.6 dahil) PDF belgesi şartname tüm sürümlerini destekler, 40-bit ve 128-şifre çözme (Çince, Japonca ve Korece dahil) çift bayt karakter setleri kullanılarak kodlanmış metin çıkarma bit şifreli belgeler ve (form verileri, yer imleri ve ek açıklamalar dahil) PDF belgeleri tarafından sağlanan tüm belge meta veri çıkarma.
Cakarta Lucene ile kolay entegrasyon dahil

Bu sürümde Yeni nedir:.

  • Bu sürüm yapılan düzeltmeler çeşitli içerir PDFTextStream PDF şartnameye uygun olmayan PDF belgelerini metin çıkarma yeteneğine sahiptir sağlamak.
  • Aynı zamanda performans geliştirmeleri çeşitli içerir.

sürüm 2.3.0 yeni nedir:

  • com bir .isStruckThrough () yöntemini eklendi. snowtide.pdf.TextUnit, bir karakter içinden çekilen bir çizili olup olmadığını gösteren.
  • gömülü karakter eşleştirmeleri için PDFTextStream desteği Geliştirilmiş.

  • Açıkça kaynak PDF belgelerinde kodlanmış boşluk hesaba düzgün
  • kelimeler arasında boşluk hesaplanması sabit olmuştur.
  • Daha önce çıkarılması sırasında 'göz ardı' olma PDF içeriği bazı aralıkları sonuçlanan başarısız olabilir kompozit içerik kodlamanın, bir PDFTextStream tutuşu Geliştirilmiş.
  • tek bir satır metin birden hatlar üzerinden bölmek olacaktır VisualOutputTarget bir hata düzeltildi
  • metnin Geliştirilmiş dikey hizalama VisualOutputTarget kullanılarak çıkartılan
  • yakından bitişik kelimeler arasında sahte ek boşluk ortadan kaldırmak için özler VisualOutputTarget üretilen Geliştirilmiş

nedir sürüm 2.2.5 Yeni :

  • Bu sürüm olarak XFA formları veri ayıklanması için destek ekler XML.
  • Bu anlamlı VisualOutputTarget kullanarak metin çıkarma performansını artırır. 2GB daha büyük PDF belgeleri için destek.
  • gömülü Tür1 yazı tiplerini kodlamalar önce bazı durumlarda düzgün uygulanan değil, bir hata için bir düzeltme.
  • güncellenmiş PDF belgelerinde yeni içerik bazen göz ardı ediliyordu bir soruna yönelik düzeltme.
  • PDFDocEncoding kodlanmış imleri ve meta düzgün deşifre ediliyor değil bir soruna yönelik düzeltme.
  • .getDestinationName () com.snowtide.pdf.Bookmark yöntemi.

Gereksinimler :

  • Apache Lucene

Yorumlar PDFTextStream

Yorum Bulunamadı
Yorum eklemek
Görüntülerde açın!