Wikipedysta:Delimata/Brudnopis/LaTeX a sprawa polska

LaTeX powstał w USA i w naturalny sposób przejął anglosaskie zwyczaje typograficzne. Polska typografia rozwijała się odmiennie. W niniejszym podrozdziale zajmiemy się kwestią polonizacji.

Podstawy edytuj

Podstawy polonizacji obejmujące polskie znaki diakrytyczne i polskie nagłówki zostały wyjaśnione w rozdziale [[]]. Tutaj przyjrzymy się szczegółowiej tym kwestiom.

Kodowanie edytuj

Aby stosować wprost polskie i nie tylko znaki diakrytyczne nie wystarcza tekst zapisany w czystym kodowaniu ascii. Aby zapisywać znaki spoza ascii niezbędne jest przyjęcie jakiegoś standardu kodowania. Dla polskich tekstów powszechnie stosowane są dwa Windows 1250 promowany przez Microsoft oraz ISO 8859-2 (promowany przez międzynarodowe standardy ISO). Ponadto swego rodzaju uniwersalnym kodowaniem jest kodowanie Unicode. Obecne edytory dają często możliwość wyboru kodowania w jakim zapisywane są edytowane w nich pliki, ale domyślnie można przyjąć, że użytkownik systemu Windows najprawdopodobniej zetknie się z kodowaniem Windows 1250, zaś użytkownik systemu Linux będzie używać kodowania ISO 8859-2.

Aby LaTeX zrozumiał z jakim kodowaniem ma do czynienia należy mu o tym w jakiś sposób powiedzieć. Można to uczynić co najmniej dwojako

  1. poprzez pierwszą linię kodu źródłowego (tzw. linię komentarza strukturalnego)
  2. poprzez użycie pakietu przekodowującego inputenc

W pierwszym przypadku plik z kodem źródłowym powinien rozpoczynać się linią

%& --translate-file=cp1250pl

lub

%& --translate-file=il2-pl

W drugim należy w preambule zawrzeć linię:

\usepackage[cp1250]{inputenc}

lub

\usepackage[latin2]{inputenc}

Jednoczesne użycie obu metod jest błędem. Wady drugiej metody mogą objawić się w przypadku automatycznego tworzenia skorowidza gdzie bardzo istotne jest zachowanie prawidłowej kolejności wyrazów.

Stosowanie notacji prefiksowych mimo swej uciążliwości posiada jednak pewne zalety. Jedną z nich jest pewna uniwersalność mająca znaczenie przy współpracy międzynarodowej. Osoba nie posiadająca nawet w swym komputerze czcionek z polskimi znakami diakrytycznymi nie będzie miała problemów z edytowaniem stworzonego przez nas pliku źródłowego.

Linia komentarza strukturalnego nie umożliwia stosowania unicode. W przypadku tego kodowania jedyną możliwością jest pakiet inputenc z opcją utf8. Nie ka

Pakiet polonizacyjny edytuj

Kolejną kwestią jest polonizacja nazw jakie pojawiają się w dokumentach. Są to daty, nazwy rozdziałów, spisów treści itp.

Najbardziej podstawowym rozwiązaniem jest wielojęzyczny pakiet babel. Występuje on standardowo w niemal każdej dystrybucji LaTeX-a

\usepackage[polski]{babel}

Bardziej dopracowany pakiet dla bardziej wymagających użytkowników jest styl polski z pakietu platex ładowany poleceniem.

\usepackage{polski}

Polskie zwyczaje typograficzne edytuj

Klasy MWCLS edytuj

...


\documentclass{mwart}

zamiast

\documentclass{article}
\documentclass{mwrep}

zamiast

\documentclass{report}
\documentclass{mwbk}

zamiast

\documentclass{book}

Listy edytuj

Niestety odpowiednika klasy letter w zestawie mwcls nie znajdziemy.

...

Prace magisterskie edytuj

Niektóre wydziały w Polsce posiadają już własne klasy do tworzenia prac magisterskich. Przykładowo:

Gdy nie mamy klasy dla naszego wydziału można zawsze przerobić nieco istniejące rozwiązania. Nie jest to wbrew pozorom trudne zadanie.

O zasadach składu w języku polskim słów parę edytuj

Czy to już wszystko? edytuj

I tak i nie. Jest to wszystko co należy wiedzieć na początek. Tak naprawdę jest to jednak tylko początek poznawania niuansów składu tekstów. Wiele zagadnień wymyka się temu co można ująć w pakiety, ani rozwiązać automatycznymi narzędziami.