lxml

Software screenshot:
lxml
Software ətraflı:
Version: 3.4.4 Yenil?nib
Tarixi Upload: 12 May 15
Geliştirici: infrae.com
Lisenziya: Pulsuz
Məşhurluq: 245

Rating: 5.0/5 (Total Votes: 1)

lxml Python dilinin sadəliyi ilə həmin kitabxana sürəti birləşdirir.
3.2 2.4 bütün CPython versiyasını uyğun

Bu azad Yeni nədir.

  • lxml.html.iterlinks indi meta Yenile tags daxilində links qaytarır.
  • Yeni XMLParser seçimi collect_ids = ID hash table yaradılması aradan False. Bu əhəmiyyətli dərəcədə istifadə olunur, bir çox müxtəlif kimlikleri ilə sənədlərin təhlil sürətləndirmək bilər.
  • parser XML kimlikleri üçün başına sənəd hash masalar istifadə edir. Bu qlobal parser Dict yük azaldır və bir çox kimlikleri ilə sənədlər təhlil sürətləndirir.
  • ElementTree.getelementpath (element) lookups sonra üçün istifadə edilə bilər verilmiş element üçün struktur ElementPath ifadə qaytarır.
  • xmlfile () (-kimi) onlara yazılı sonra obyektlərin faylı bağlamaq üçün True = yaxın yeni dəlil qəbul edir. Əvvəl, xmlfile () yalnız daxili açdı əgər fayl bağlıdır.
  • izin ver & quot; bytearray & quot; ASCII mətn daxil edin.

nədir versiyası 3.4.2 Yeni

  • lxml.html.iterlinks indi meta daxili links qaytarır tags yenileyin.
  • Yeni XMLParser seçimi collect_ids = ID hash table yaradılması aradan False. Bu əhəmiyyətli dərəcədə istifadə olunur, bir çox müxtəlif kimlikleri ilə sənədlərin təhlil sürətləndirmək bilər.
  • parser XML kimlikleri üçün başına sənəd hash masalar istifadə edir. Bu qlobal parser Dict yük azaldır və bir çox kimlikleri ilə sənədlər təhlil sürətləndirir.
  • ElementTree.getelementpath (element) lookups sonra üçün istifadə edilə bilər verilmiş element üçün struktur ElementPath ifadə qaytarır.
  • xmlfile () (-kimi) onlara yazılı sonra obyektlərin faylı bağlamaq üçün True = yaxın yeni dəlil qəbul edir. Əvvəl, xmlfile () yalnız daxili açdı əgər fayl bağlıdır.
  • izin ver & quot; bytearray & quot; ASCII mətn daxil edin.

nədir versiyası 3.3.2 Yeni

  • xassələri resolvers və versiyası, eləcə də üsulları set_element_class_lookup () və makeelement () iterparse obyektlərin həlak olub.
  • XMLSchema, Schematron və RelaxNG halları bir dəyərləndirmə çalışan əvvəl yerli error_log aydın olmadı.

  • Gözlənilən & quot;
  • lxml.doctestcompare up & quot qarışdırılır; və & quot; faktiki & quot; atribut dəyərlər.

versiyası 3.3.1 yeni nədir:

  • Bugs Sabit:
  • parser.feed ilə ayrıştırılan HTML sənədləri () tag iteration zamanı elementləri tapa bilmədi.
  • PyPy Tikinti görə * () PyPy C-API PyUnicode_Compare () və PyByteArray _ dəstək itkin bilmədi.
  • MSVC yığma görə itkin & quot bilmədi; stdint.h & quot; standart header file.
  • iterparse () BOM faylları prefixed analiz edə bilmədi.

versiyası 3.3.0 yeni nədir:

  • Bugs Sabit:
  • URL fayl yolları ayıran Heuristic az yalan neqativ istehsal dartılmış edilmişdir.

nədir versiyası 3.2.3 Yeni

  • 3.2 itirilmiş Python 2.4 Sabit dəstək 2.

nədir versiyası 3.2.1 Yeni

  • üsulları apply_templates () və process_children () və XSLT uzadılması elementləri nəticə siyahıdan bütün strings və ya ağ-yalnız strings və ya imtina elements_only və remove_blank_text iki yeni boolean variantları əldə etmişik.

nədir versiyası 3.2.0 Yeni

  • Simsiz təhlil davranışını dəyişə bilər ağ Aparıcı lxml.html fəaliyyət göstərir.
  • lxml.html funksiyaları təhlil string framesets və ya bədən tags itkin kimi qeyri-adi HTML məzmun qarşısında daha güclü olur.
  • I / O səhvlər IOError hesabat düzgün UnicodeDecodeError qaldırmaq bilər qeyri-ASCII simvol ola yolları ilə faylları daxil olmaq üçün çalışırıq əvəzinə isə.
  • in-yaddaş strings default parser əlil şəbəkə girişi təhlil və uğursuz bir URL analiz sonrakı cəhdlər etdi.

nədir versiyası 3.1.2 Yeni

  • keçən ad-xəbərsiz API vasitəsilə atributları (handler.startElement () metodu yəni) saksafon körpü bir TypeError ilə uğursuz.

  • XSLT çıxdı
  • Sabit serialization səhv bir Unicode simli nəticə ağac konvertasiya.

nədir versiyası 3.0.2 Yeni

  • Cython 0.17 keçid tərcüməçi bağlanması zamanı Sabit crash bina üçün 3.

nədir versiyası 3.0 Yeni

  • C14N top- irəli etmək üçün daxil önek ifadə verir xüsusi serialization zamanı səviyyəsində.
  • (cpyext vasitəsilə) PyPy bina üçün ilkin dəstək.
  • DTD obyektləri onların bəyanatları oxumaq imkanı verir bir API qazanıb.
  • xpathgrep.py xətti-by-line (məsələn, grep çıxdı) təhlil və yeni kök tag ilə çıxış ətraf dəstək qazanıb.

  • Onların ətrafında elementləri bina zaman lxml.builder da
  • E-factory (məsələn, simli alt kimi) məlum data növləri alt qəbul edir.

  • Bir seçmə tag arqumenti ilə
  • Tree iteration və iterparse () tags bir sıra keçən dəstəkləyir. Onlar tags hər hansı bir uyğun əgər Tree qovşaqlarının Iterators tərəfindən qaytarılır.

versiyası 2.3.5 yeni nədir:

  • Crash element.remove mətn qovşaqlarının birləşməsi ( ).
  • sax / hədəf parser Crash boş doctype hesabat.

nədir versiyası 2.3.4 Yeni

  • Crash bir nsmap (Element mülkiyyət) ilə tikinti zaman boş ad URI'ler.
  • səbəbiylə irqi vəziyyətdə Crash səhvlər (və ya istifadəçi mesaj) yivli XSLT emal zamanı baş verən zaman.
  • yığma səhvlər ignore bilər XSLT stil tərtib.

versiyası 2.3.3 yeni nədir:

  • Features əlavə etdi:
  • lxml.html.tostring () with_tail və DOCTYPE yeni serialization variantları qazandı.
  • Bugs Sabit:
  • HTML təhlil üçün iterparse () istifadə və start hadisələr tələb zaman bir qəza Sabit.
  • cssselect daha seçiciler Sabit təhlil. Bu nəslindən Combinator kimi yalançı elementləri və yalançı siniflər əvvəl ağ əhəmiyyətlidir. & Quot; E: yalançı & quot; yalançı & quot ;, deyil & quot; E: E *; & quot eyni analiz etməlidir. yalançı & quot;

  • "Src" atributu olmadan "img" tags vuruş zaman
  • lxml.html.diff artıq bir istisna doğurur.

versiyası 2.3.2 yeni nədir:

  • Features əlavə etdi:
  • lxml.objectify.deannotate () nesnelleştirmek ad bəyannamə aradan qaldırılması (və ümumiyyətlə ad bəyannamələrinin təmizləmək) növü notları aradan qaldırılması sonra yeni bir boolean seçim cleanup_namespaces var.

  • Istifadəçi tərəfində lxml.etree bir başqa lazımsız idxal qarşısını almaq üçün etree.SubElement surəti öz SubElement () funksiyası əldə lxml.objectify
  • .
  • Bugs Sabit:
  • Sabit & quot; nəslindən & quot; cssselect səhv (lxml 2.3.1 bir ilk fix sonra) ikinci dəfə. Əvvəlki dəyişiklik tərcümə ifadə XPath əsasında qiymətləndirilməsi üçün ciddi performans reqressiya ilə nəticələndi. Bu əvvəl 2.3.1 çalışıb XSLT yeri yolları kimi yaradılan XPath ifadələr bəzi istifadə pozur unutmayın.
  • cssselect bəzi seçiciler Sabit təhlil. & # X3e; combinators olarak sonra ağ & quot ;, & quot; + & quot; və & quot; ~ & quot; indi düzgün yoksayılır. Əvvəllər nəslindən Combinator kimi ayrıştırılan edildi. Məsələn, & quot; div & # x3e; .foo & quot; div & # x3e; * .foo olarak & quot eyni ayrıştırılan edilmişdir; əvəzinə & quot edir; div & # x3e; .foo & quot;.

versiyası 2.3.1 yeni nədir:

  • Features əlavə etdi:
  • Yeni seçimi xüsusi tags və onların məzmunu (yəni onların bütün subtree) aradan qaldırılması üçün lxml.html.clean ilə kill_tags.

  • Emal təlimat mətn content yalançı atributları analiz emal təlimatı üzərinə
  • pi.get () və pi.attrib.
  • lxml.get_include () lxml.etree qarşı xarici C kodu tərtib üçün istifadə edilə bilər yolları daxildir siyahısını qaytarır. Code özü lxml eyni header file versiyasını qarşı tərtib etmək lazımdır zaman xüsusi statik bağlı lxml üçün tələb olunur qurur.
  • Resolver.resolve_file () fayl (-kimi) obyekt oxu və ya sonra bağlanacaq əgər yapılandırır əlavə seçim close_file edir. Istifadəçi istinad saxlamaq gözlənilmir kimi Mənim cari olaraq, fayl, qapalı olacaq.
  • Bugs Sabit:
  • HTML təmizləmə data: "aradan etməyib. Links
  • html5lib parser inteqrasiya indi kitabxananın yeni relizlər ilə iş edir html5lib özü rəsmi "həyata keçirilməsini istifadə edir.

  • Müvafiq start hadisə default ad olmaq eyni düz tag adı məlum zaman lxml.sax In
  • endElementNS () yanlış bir düz tag adını rədd edə bilər.
  • açıq fayl kimi obyekt parse keçdi zaman () və ya iterparse () parser artıq yaxın istifadədən sonra. Bu, bütün faylları qapalı olardı lxml 2.3 bir dəyişiklik qaytarır. Bu düzgün səhv hallarda da, fayl (-kimi) obyekt yaxın istifadəçi məsuliyyət daşıyır.
  • lxml.html.cleaner da Bəyannaməsini səhv yüksək səviyyəli elementləri discarding.

  • Lxml.cssselect ildə
  • CSS əvəzinə "A / nəslindən :: B" XPath ("A / övlad və ya öz-özünə :: node () / B" üçün qısa) 'A // B' istifadə nəslindən selector ('A B). Bu WebKit və Firefox ildə selector davranış uyğun olmaq üçün bir neçə kənar hallarda edir və (XSL istifadə üçün: şablon matç) daha css ifadələri etibarlı yer yolları edir.
  • lxml.html, qeyri-seçilmiş & # x3c; seçimi & # x3e; tags artıq toplanmış forması dəyərlər göstərilir.
  • / durub aradan qaldırılması & # x3c; seçimi & # x3e; Bir neçə seçin forma sahəsində lazımi qaydada seçir və onları unselects / from dəyərlər.
  • Digər dəyişikliklər:
  • Static --download-dir seçimi ilə yukle kataloq belirtebilirsiniz qurur.

Versiya 2.3 yeni nədir:

  • Features əlavə etdi:

  • Uşaqlar üçün axtarır zaman valideyn ad fərqli olaraq
  • lxml.objectify, boş ad mənası kimi '{} tag "edir.
  • Bugs Sabit:
  • bir fayl kimi obyekt oxu başa zaman, parser dərhal bağlayın () metodu çağırır.

  • Təhlil başa zaman
  • iterparse () dərhal daxil fayl bağlayır.
  • (Libxml2 2.7.8 müəyyən) bir severly broken sənəd təhlil sonra qeyri-funksional dövlət HTML parser tərk edə bilər Libxml2 səhv üçün ətrafında iş.

  • HTML təmizləmə kodu
  • Marque tag düzgün çadır adlanır.
  • Digər dəyişikliklər:
  • Cython səviyyədə C-API bəzi ictimai funksiyaları daha açıq qaytarılması növləri var.

version 2.3beta1 yeni nədir:

  • Bugs Sabit:
  • yeni Libxml2 versiyasını Crash əvəz XInclude qovşaqlarının atributları idi sənədlər arasında elementləri hərəkət.
  • XMLID () funksiyası isteğe parser və base_url parametrləri itkin edildi.
  • () Py3 qırıldı. Iterparse da wildcard tags üçün axtarış
  • lxml.html.open_in_browser () görə os.tempnam istifadə Python 3 iş deyil. İndi isteğe "encoding" parametri edir.

Oxşar proqram

hgtools
hgtools

1 Mar 15

httpagentparser
httpagentparser

13 Apr 15

pylibcurl
pylibcurl

13 May 15

BinaryOrNot
BinaryOrNot

13 Apr 15

Şərh lxml

Şərhlər tapılmadı
Şərh əlavə
Images yandırın!