Zanurkuj w Pythonie/Przetwarzanie HTML-a - podsumowanie
Podsumowanie
edytujPython dostarcza potężne narzędzie do operowania na HTML-u - bibliotekę sgmllib.py, która obudowuje kod HTML w model obiektowy. Możemy używać tego narzędzia na wiele sposobów:
- parsując HTML w poszukiwaniu specyficznych informacji
- gromadząc wyniki, np. tak jak to robi URL lister.
- modyfikując strukturę w dowolny sposób, np. dodawać cudzysłowy do atrybutów
- transformując HTML w inny format, poprzez manipulowanie tekstem bez ruszania znaczników, np. tak jak nasz
Dialectizer
Po tych wszystkich przykładach, powinniśmy umieć wykonywać wszystkie z tych operacji:
- Używać odpowiednio
locals()
iglobals()
, aby dostać się do przestrzeni nazw - Formatować łańcuchy w oparciu o słowniki