Zanurkuj w Pythonie/Wyciąganie danych z dokumentu HTML: Różnice pomiędzy wersjami

Usunięta treść Dodana treść
Piotr (dyskusja | edycje)
Nie podano opisu zmian
Piotr (dyskusja | edycje)
dziwny przypis przetłumaczny ;-
Linia 82:
</nowiki>
 
# Wywołujemy metodę <tt>feed</tt> zdefiniowaną w <tt>SGMLParser</tt>, aby przekazać HTML do parsera. <ref>
# Wywołujemy metodę <tt>feed</tt> zdefiniowaną w <tt>SGMLParser</tt>, aby przekazać HTML do parsera. <ref>The technical term for a parser like SGMLParser is a consumer: it consumes HTML and breaks it down. Presumably, the name feed was chosen to fit into the whole “consumer” motif. Personally, it makes me think of an exhibit in the zoo where there's just a dark cage with no trees or plants or evidence of life of any kind, but if you stand perfectly still and look really closely you can make out two beady eyes staring back at you from the far left corner, but you convince yourself that that's just your mind playing tricks on you, and the only way you can tell that the whole thing isn't just an empty cage is a small innocuous sign on the railing that reads, “Do not feed the parser.” But maybe that's just me. In any event, it's an interesting mental image.
Technicznym określeniem parsera, takiego jak <tt>SGMLParser</tt>, jest konsument (ang. ''consumer''): konsumuje on HTML i rozkłada go. Przypuszczalnie nazwa <tt>feed</tt> (czyli ''karm'' w języku polskim) została wybrana, aby dopasować parser do takiego motywu „konsumenta”. W tym momencie, niektórym może przyjść na myśl zoo, w którym znajduje się ciemna klatka bez drzew, roślin i bez żadnych oznak życia. Jeśli będziesz bardzo cicho i przyglądniesz się bardzo dokładnie, to zobaczy w odległym lewym rogu parę lśniących oczów spoglądających na ciebie, ale przekonujesz się, że to twój mózg płata tobie figle, a jedynie możesz powiedzieć, że to co widzisz nie jest właściwie pustą klatką, ponieważ jest tutaj na barierce mała, nieszkodliwa tabliczka z napisem „Nie karmić parsera”. Jednak jest to interesujący obraz, stworzony przez wyobraźnię jednego z autorów tego podręcznika.
</ref>. Metoda ta bierze łańcuch znaków, którym w tym przypadku będzie wartość zwrócona przez <tt>usock.read()</tt>.
# Podobnie jak pliki, powinieneś zamknąć swoje obiekty URL, kiedy już nie będą ci potrzebne.