Wikipedysta:Delimata/Brudnopis/LaTeX a sprawa polska
LaTeX powstał w USA i w naturalny sposób przejął anglosaskie zwyczaje typograficzne. Polska typografia rozwijała się odmiennie. W niniejszym podrozdziale zajmiemy się kwestią polonizacji.
Podstawy
edytujPodstawy polonizacji obejmujące polskie znaki diakrytyczne i polskie nagłówki zostały wyjaśnione w rozdziale [[]]. Tutaj przyjrzymy się szczegółowiej tym kwestiom.
Kodowanie
edytujAby stosować wprost polskie i nie tylko znaki diakrytyczne nie wystarcza tekst zapisany w czystym kodowaniu ascii. Aby zapisywać znaki spoza ascii niezbędne jest przyjęcie jakiegoś standardu kodowania. Dla polskich tekstów powszechnie stosowane są dwa Windows 1250 promowany przez Microsoft oraz ISO 8859-2 (promowany przez międzynarodowe standardy ISO). Ponadto swego rodzaju uniwersalnym kodowaniem jest kodowanie Unicode. Obecne edytory dają często możliwość wyboru kodowania w jakim zapisywane są edytowane w nich pliki, ale domyślnie można przyjąć, że użytkownik systemu Windows najprawdopodobniej zetknie się z kodowaniem Windows 1250, zaś użytkownik systemu Linux będzie używać kodowania ISO 8859-2.
Aby LaTeX zrozumiał z jakim kodowaniem ma do czynienia należy mu o tym w jakiś sposób powiedzieć. Można to uczynić co najmniej dwojako
- poprzez pierwszą linię kodu źródłowego (tzw. linię komentarza strukturalnego)
- poprzez użycie pakietu przekodowującego inputenc
W pierwszym przypadku plik z kodem źródłowym powinien rozpoczynać się linią
%& --translate-file=cp1250pl
lub
%& --translate-file=il2-pl
W drugim należy w preambule zawrzeć linię:
\usepackage[cp1250]{inputenc}
lub
\usepackage[latin2]{inputenc}
Jednoczesne użycie obu metod jest błędem. Wady drugiej metody mogą objawić się w przypadku automatycznego tworzenia skorowidza gdzie bardzo istotne jest zachowanie prawidłowej kolejności wyrazów.
Stosowanie notacji prefiksowych mimo swej uciążliwości posiada jednak pewne zalety. Jedną z nich jest pewna uniwersalność mająca znaczenie przy współpracy międzynarodowej. Osoba nie posiadająca nawet w swym komputerze czcionek z polskimi znakami diakrytycznymi nie będzie miała problemów z edytowaniem stworzonego przez nas pliku źródłowego.
Linia komentarza strukturalnego nie umożliwia stosowania unicode. W przypadku tego kodowania jedyną możliwością jest pakiet inputenc z opcją utf8. Nie ka
Pakiet polonizacyjny
edytujKolejną kwestią jest polonizacja nazw jakie pojawiają się w dokumentach. Są to daty, nazwy rozdziałów, spisów treści itp.
Najbardziej podstawowym rozwiązaniem jest wielojęzyczny pakiet babel. Występuje on standardowo w niemal każdej dystrybucji LaTeX-a
\usepackage[polski]{babel}
Bardziej dopracowany pakiet dla bardziej wymagających użytkowników jest styl polski z pakietu platex ładowany poleceniem.
\usepackage{polski}
Polskie zwyczaje typograficzne
edytujKlasy MWCLS
edytuj...
\documentclass{mwart}
zamiast
\documentclass{article}
\documentclass{mwrep}
zamiast
\documentclass{report}
\documentclass{mwbk}
zamiast
\documentclass{book}
Listy
edytujNiestety odpowiednika klasy letter w zestawie mwcls nie znajdziemy.
...
Prace magisterskie
edytujNiektóre wydziały w Polsce posiadają już własne klasy do tworzenia prac magisterskich. Przykładowo:
Gdy nie mamy klasy dla naszego wydziału można zawsze przerobić nieco istniejące rozwiązania. Nie jest to wbrew pozorom trudne zadanie.
O zasadach składu w języku polskim słów parę
edytujCzy to już wszystko?
edytujI tak i nie. Jest to wszystko co należy wiedzieć na początek. Tak naprawdę jest to jednak tylko początek poznawania niuansów składu tekstów. Wiele zagadnień wymyka się temu co można ująć w pakiety, ani rozwiązać automatycznymi narzędziami.