Zanurkuj w Pythonie/Przetwarzanie HTML-a: Różnice pomiędzy wersjami

Usunięta treść Dodana treść
Piotr (dyskusja | edycje)
mNie podano opisu zmian
Derbeth (dyskusja | edycje)
m mylący cudzysłów
Linia 1:
== Nurkujemy ==
 
Na comp.lang.python często można zobaczyć pytania w stylu "jak można znaleźć wszystkie nagłówki/obrazki/linki w moim dokumencie HTML?", "jak mogę sparsować/przetłumaczyć/przerobić tekst mojego dokumentu HTML tak, aby zostawić znaczniki w spokoju?" lub też "jak mogę natychmiastowo dodać/usunąć/zacytować atrybuty z wszystkich znaczników mojego dokumentu HTML?". Rozdział ten odpowiada na wszystkie te pytania.
 
Poniżej przedstawiono w dwóch częściach całkowicie działający program. Pierwsza część, {{Python/Src|BaseHTMLProcessor.py}} jest ogólnym narzędziem, które przetwarza pliki HTML przechodząc przez wszystkie znaczniki i bloki tekstowe. Druga część, {{Python/Src|dialect.py}}, jest przykładem tego, jak wykorzystać {{Python/Src|BaseHTMLProcessor.py}}, aby przetłumaczyć tekst dokumentu HTML, lecz przy tym zostawiając znaczniki w spokoju. Przeczytaj notki dokumentacyjne i komentarze w celu zorientowania się, co się tutaj właściwie dzieje. Duża część tego kodu wygląda jak czarna magia, ponieważ nie jest oczywiste w jaki sposób dowolna z metod klasy jest wywoływana. Jednak nie martw się, wszystko zostanie wyjaśnione w odpowiednim czasie.
Linia 265:
}}
 
<noinclude>{{Nawigacja|Zanurkuj w Pythonie|
{{Nawigacja|Zanurkuj w Pythonie|
[[../Wyrażenia regularne - podsumowanie|Podsumowanie]]|
[[../Wprowadzenie do sgmllib.py|Wprowadzenie do <tt>sgmllib.py</tt>]]|
}}
{{Podświetl|py}}</noinclude>
</noinclude>