Beautiful şorbaları layihə ekran qaşınma kimi sürətli dönüş layihələri üçün nəzərdə tutulmuşdur bir Python HTML / XML parser edir. Üç xüsusiyyətləri güclü:
Siz pis biçimlendirme vermək əgər gözəl şorbaları boğmaq deyil. Bu orijinal sənəd kimi təxminən kimi çox anlamlı bir analiz ağacı verir. Bu sizə lazım olan məlumat toplamaq və qaçmağa kifayət qədər adətən yaxşıdır.
Sənəd dissecting və sizə lazım nə çıxarılması üçün bir aracı: Beautiful şorbaları, naviqasiya axtarış və analiz ağacı dəyişmək üçün bir neçə sadə üsulları və Pythonic deyim təmin edir. Siz hər bir proqram üçün xüsusi bir parser yaratmaq yoxdur.
Beautiful şorbaları avtomatik UTF-8 Unicode və gedən sənədlər daxil olan sənədləri çevirir. Siz sənəd şifrələmə müəyyən etmir halda, kodlamaları haqqında düşünmək yoxdur və gözəl şorbaları bir autodetect bilməz. Sonra yalnız orijinal encoding qeyd etmək lazımdır.
Beautiful Yemək vermək bir şey çözümler, və sizin üçün ağac traversal məhsulları yoxdur. Siz "bütün links tap" demək, və ya "class externalLink bütün links tap", və ya "onun url eşleşen bütün links tap" bilərsiniz foo.com "və ya" masa ki, var qalın, mətn mal tap, sonra vermək Mənə mətn. "
Bir zəif dizayn saytlarda bağlanıldı qiymətli data sizin zəngin ərzində indi. . Saat etmişlər ki Layihələr Beautiful şorbaları yalnız dəqiqə
tələblər
- Python
Şərhlər tapılmadı