WordTabulator metin analizi için tasarlanmıştır. WordTabulator yardımı ile tanımlanmış metin kümesinden çıkarılan kelime elemanlarının dizin oluşturabilir. Kelime elemanları kelimeler, (tanımlı boyutta), N-gram ya da deyimler (Öbek) olabilir. Program Çokbaytlı UTF-8 kodlaması gibi, kodlama sıradan 2-bayt (ANSI) gibi metinleri işleyebilir. Kaynak metinler düz metin dosyaları veya HTML / XML / SGML belgelerin bir dizi olarak tanımlanır. Son durumda programı biçimlendirme içerik filtreleme yapabilirsiniz. Ayrıca, seçilen eşleştirilmiş etiketleri içinde sadece tanımlanmış içeriği işleyebilir. Yoksa işleme bu içeriği atlayabilirsiniz. Bu üretim endeksinde, kelime elemanları (kelimeler, N-gram ve deyimler), bağlam tarayıcısı ve gerçek alfabetik sipariş üç farklı türleri Rusça, üç farklı formatları için morfolojisi modülü içerir.
Yazılım detaylar:
Versiyon: 3.5
Qayıt: 15 Apr 15
Lisans: Ücretsiz
Popülerlik: 370
Boyut: 2708 Kb
Yorum Bulunamadı