Zanurkuj w Pythonie/Wyciąganie danych z dokumentu HTML: Różnice pomiędzy wersjami

Usunięta treść Dodana treść
Piotr (dyskusja | edycje)
zaczynam tłumaczyć
Piotr (dyskusja | edycje)
Nie podano opisu zmian
Linia 30:
[...ciach...]</nowiki>
 
# Moduł <tt>urllib</tt> jest częścią standardowej biblioteki Pythona. Zawiera on funkcje służące do pobierania informacji o danych, a także pobierania danych z internetu na podstawie adresu URL (głównie strony web).
# The urllib module is part of the standard Python library. It contains functions for getting information about and actually retrieving data from Internet-based URLs (mainly web pages).
# Najprostszym sposobie wykorzystanie <tt>urllib</tt>-a, aby pobrać tekst ze strony web, jest wykorzystanie funkcji <tt>urlopen</tt>. Otworzenie URL-a jest równie proste, jak otworzenie pliku. Zwracana wartość funkcji <tt>urlopen</tt> przypomina normalny obiekt pliku i posiada niektóre identyczne metody.
# The simplest use of urllib is to retrieve the entire text of a web page using the urlopen function. Opening a URL is similar to opening a file. The return value of urlopen is a file-like object, which has some of the same methods as a file object.
# Najprostszą czynnością, którą możemy wykonać na obiekcie zwróconym przez <tt>urlopen</tt>, jest wywołanie <tt>read</tt>. Metoda ta odczyta cały HTML strony internetowej i zwróci go w postaci napisu, łańcucha znaków. Obiekt ten posiada także metodę <tt>readlines</tt>, która czyta tekst linia po linii, dodając kolejne linie do listy.
# The simplest thing to do with the file-like object returned by urlopen is read, which reads the entire HTML of the web page into a single string. The object also supports readlines, which reads the text line by line into a list.
# Kiedy skończymy pracę na tym obiekcie, powinniśmy go jeszcze zamknąć za pomocą <tt>close</tt>, podobnie jak normalny plik.
# When you're done with the object, make sure to close it, just like a normal file object.
# YouMamy nowkompletny havedokument theHTML completew HTMLpostaci ofłańcucha theznaków, homepobraną pageze ofstrony domowej http://diveintopython.org/ ini ajesteśmy string,przygotowani anddo you're readytego, toaby parse itsparsować.
 
'''ExamplePrzykład 8.6. IntroducingWprowadzenie do <tt>urllister.py</tt>'''
 
If you have not already done so, you can download this and other examples used in this book.