R (język programowania): Różnice pomiędzy wersjami

Usunięta treść Dodana treść
Linia 7:
 
 
=Dane=
==Źródła danych==
 
===Dane wewnętrzny R===
Pakiet R zawiera przykładowe zbiory danymi .
 
Linia 18 ⟶ 19:
data(package = .packages(all.available = TRUE))
 
====cats====
Wybieramy zbiór cats z pakietu MASS ( ładujemy pakiet i wczytujemy zbiór ) :
 
Linia 39 ⟶ 40:
 
 
====mtcars====
Często używany zbiór danych mtcars znajduje się w bibliotece datasets. Nie zawsze jest ona domyślnie ładowana. Wtedy ładujemy bibliotekę :
 
Linia 51 ⟶ 52:
attach(mtcars)
 
===Dane w plikach===
 
 
Linia 58 ⟶ 59:
Najłatwiejsze jest wczytywanie danych z plików tekstowych, jak csv. Jest to stosowany przy małej i średniej ilości danych. Przy dużej ilości danych szybsze i objętościowo mniejsze będą pliki binarne. <ref>[http://cran.r-project.org/doc/manuals/R-data.pdf R Data Import/Export Version 2.12.1 (2010-12-16) by R Development Core Team]</ref>
 
==== Katalogi ====
 
Najpierw sprawdźmy jaki jest aktualny katalog roboczy :
Linia 70 ⟶ 71:
list.files()
 
==== Pliki ====
 
===== Pliki binarne =====
 
=====Pliki tekstowe=====
======CSV======
Pliku csv<ref>[[wikipedia:CSV%20(format%20pliku) CSV (format pliku) w polskiej wikipedii]]</ref> jest plikiem tekstowym.
 
 
======= Tworzenie =======
 
'''Ręczne'''
Linia 122 ⟶ 123:
Plik csv możemy utworzyć w każdym edytorze tekstów. Zapisujemy go jak o plik tekstowy z rozszerzeniem csv i przecinkiem jako znakiem rozdzielającym pola.
 
======= Konwersja =======
Plik :
* baz danych, np. Accessa z rozszerzeniem mdb
Linia 134 ⟶ 135:
Plik csv z przecinkami nie wczytamy ponownie do Accessa ( błąd), dlatego bezpieczniej jest używać pliku ze średnikiem jako znakiem oddzielającym pola
 
======= Otwieranie =======
 
''' Plik lokalny'''
Linia 172 ⟶ 173:
* [http://www.is.umk.pl/projects/datasets.html datasets at Department of Informatics Nicolaus Copernicus University]
 
=== Dane tworzone przez użytkownika ===
 
> macierz=matrix(1:6,2,3)
Linia 179 ⟶ 180:
[1,] 1 3 5
[2,] 2 4 6
==Export danych ==
Zapis danych do pliku csv
t=table(a$ROK_WYPISU,a$ICD9CM);
t;
write.table(t,"t.csv", quote = FALSE, sep = ";");
 
= Przygotowanie danych do analizy =