PDFMiner ilk bir PDF faylı məzmunu alaraq və HTML kimi bir daha döymə format üçün konvertasiya çalışır.
Oradan, mətn və məlumatların hasil və təhlil və əvvəlcədən təyin edilmiş qaydaları ayrılmış və təqdim istifadəçi və ya digər daha güclü analiz alətləri göndərilir əsaslanır.
Mətn təhlili etmək niyyətində nə deyil, siz asanlıqla PDFMiner sadəcə çıxarış konfiqurasiya və ya yalnız yaxşı PDF data çevirə bilərsiniz.
Onun funksiyaları bu geniş istifadə spektri sayəsində bir-birindən ayrı iş və imkan verir
Features .
- 100% Python indeksi, heç C və ya C ++
- analiz PDF
- təhlil PDF
- digər formatlara PDF Convert
- TOC extractor
- məzmun etiketli almaq yalnız
- mətn PDF xüsusiyyətləri çox sayda Support
- PDF daxili font növləri çox sayda Support
- Əsas şifreleme (RC4) dəstəyi
Bu azad yeni nədir:
- PDFDocument.initialize () metodu çıxarılır və lazım artıq . A parol PDFDocument konstruktor bir arqument kimi verilir.
versiyası 20110515 yeni nədir.
- API dəyişikliklər
- LTPolygon sinif LTCurve kimi adlandırılmışdır.
versiyası 20110227 yeni nədir.
- Hata düzeltmelerini və layout təhlili təkmilləşdirilməsi
nədir versiyası 20101226 Yeni:.
- bugfixes və kiçik irəliləyişlər bir neçə
nədir versiyası 20101017 Yeni:.
- bugfixes bir neçə və bir kiçik təkmilləşdirilməsi
versiyası 20100424 yeni nədir.
- Bugfixes və TOC hasilatı kiçik təkmilləşdirilməsi
tələblər
- Python 2.4 3 üçün
məhdudiyyətlər .
- PDFMiner C / C ++ 20 dəfə yavaş ola bilər - based proqram
Şərhlər tapılmadı