cpdetector layihə kod page aşkarlanması üçün kiçik hələ ağıllı çərçivəsində edir.
cpdetector müxtəlif strategiyaları inteqrasiya kod page aşkarlanması üçün kiçik hələ ağıllı çərçivəsində edir. Bu şəbəkə üzərində mətn data çatmaz üçüncü proqram üçün kitabxana kimi istifadə edilə bilər.
O, həmçinin çeşidlənməsi və onların kod page əsasında sənədlərin böyük kolleksiyalar dəyişdirir imkan verir ki, command line alət şəklində bir ən yaxşı təcrübə həyata keçirilməsi daxildir.
Mövcud strategiyaları daxildir: XML encoding bəyannamə jchardet (istisna, tezlik analizi, və guessing), HTML charset əmlakın aşkar və aşkar.
Bir kod səhifə nədir?
İlk, mətn sənəd bit ardıcıllığı başqa bir şey deyil. Kompüter o (nömrələri kimi kompüter tərəfindən müəyyən edilir) simvol şəklində bu məlumatları bilərsiniz necə qərar qəbul edir.
A code səhifə - də charset encoding kimi tanınır - simvol bir mətn sənəd xammal məlumat xəritələri. Məsələn orijinal ASCII kodu səhifə yalnız 128 müxtəlif simvol xəritəsi imkan beləliklə təmsil olunur xarakter qərar üçün octet (bayt) 7 bit istifadə edir. Ötən xatirəsinə bahalı idi və kompüter ən tez-tez yalnız 8 bit üçün qeydiyyat və avtobus var idi.
Bir mainframe düşdü zaman bu dəstək olan simvol qərar idi. Məsələn Həkim və riyaziyyatçılar tənliklər üçün xüsusi simvol lazımdır. Nəticədə, kompüter tez-tez xüsusi kod page sövq
Bu azad Yeni nədir.
- Bu böyük bugfix version command-line toplu rejimində iki məsələlər giderir.
- hərəkət aşkar sənədlər keçmək üçün keçid yenidən indi işləyir.
- No cəhd (sonuncu müstəsna proqram axını səbəb) aşkar sənədlər transcode ediləcək.
nədir versiya 1.0.8-ci Yeni
- Bu azad bir sabitlik azad və giderir byte OpenJDK ilə mark aşkarlanması və uyğunsuzluq sifariş. Bu da indi Java 1.5 tələb edir.
Şərhlər tapılmadı