Programowanie w systemie UNIX/Kodowanie: Różnice pomiędzy wersjami
Usunięta treść Dodana treść
m →Więcej: http://petiteprogrammer.com/ |
Zbędne spacje, spolszczenie tabeli |
||
Linia 2:
=Kodowanie=
==Dekodery ==
* znaków (
**Character Encoder / Decoder <ref>[http://www.string-functions.com/encodedecode.aspx Character Encoder / Decoder]</ref>
** Online Character Map <ref>[http://charmap.online-toolz.com/tools/character-map.php Online Character Map ]</ref>
Linia 18:
==Typowe problemy ==
* kopiowanie i wklejanie powoduje że,
=Znaki=
[[Plik:UnicodeGrow2b.png|mały|prawo|Najczęściej używane standardy kodowanie występujące w sieci]]
Znaki z punktu widzenia programisty dzielimy na
* drukowalne
* niedrukowalne
Podział wg znaczenia : <ref>[http://unicodebook.readthedocs.org/en/latest/unicode.html znaki unicode ]</ref>
* litery (
* symbole (
* znaki (
* cyfry (Number): 1,100 (1.0%)
* Punctuation: 598 (0.5%)
Linia 46:
===Podobne znaki ===
* ascii '-' ( Hyphen, dash, minus )
* UTF-8 characters
** kod = U+2212 ( MINUS SIGN )
** kod = U+002D ( HYPHEN-MINUS )
Linia 74:
Wyświetlanie znaków niedrukowalnych<ref>[http://www.commandlinefu.com/commands/view/11486/bash-function-to-highlight-non-printing-characters-tab-newline-bom-nbsp bash function to highlight non-printing characters: tab, newline, BOM, nbsp]</ref> (
Linia 99:
file * | grep UTF
albo znaleźć i usunąć BOM
find . -type f -exec sed '1s/^\xEF\xBB\xBF//' -i.bak {} \; -exec rm {}.bak \;
Linia 145:
{| class="wikitable"
|-
! Kodowanie
!
!
! Bajty jako znaki CP1252
|-
| [[UTF-8]]
Linia 193:
| <code>0E FE FF</code>
| <code>14 254 255</code>
| <code>␎þÿ</code> (␎ represents the ASCII [[W:en:Shift Out and Shift In characters|"shift out"]] character)
|-
| [[BOCU-1]]
Linia 210:
<!-- Unicode Byte-Order-Marker (BOM), which is useless in UTF-8 encoding, but some editors might insert it anyway.-->
Można go usunąć za pomocą
sed '1 s/\xEF\xBB\xBF//' < input > output
Dodać
printf("\xef\xbb\xbf");
Linia 221:
Plik tekstowy<ref>[[w:Plik tekstowy|Plik tekstowy]]</ref> składa się z linii<ref>[[w:en:Line (text file)| linia w ang. wikipedii]]</ref> i kończy się znakiem końca pliku ( EOF )<ref>[[w:EOF|EOF w wikipedii ]]</ref>.
Linia jest to ciąg znaków<ref>[[w:Znakowy typ danych|znakowy typ danych w wikipedii]]</ref> (
Linię możemy podzielić na wyrazy rozdzielone spacjami<ref>[[w:spacja|spacja]]</ref>
Linia 227:
==typy plików tekstowych==
* zwykły
** plik z kodem w [[Programowanie_w_systemie_UNIX/C|C]] (
* [[R_(język_programowania)#CSV|csv]]
* ical
Linia 236:
===csv===
Przykładowy csv<ref>[http://manas.tungare.name/software/csv-to-ical/ CSV to iCal Calendar Convertor by Manas Tungare]</ref>
<pre>
Subject,Start Date,Start Time,End Date,End Time,All Day,Description
Linia 265:
</pre>
biblioteki
* libical <ref>[http://libical.github.io/libical/ libical library]</ref>
* gcalcli <ref>[https://github.com/insanum/gcalcli gcalcli library]</ref>
|