Program R-CRAN jest obecnie jednym z najpopularniejszych programów do statystycznej i ekonometrycznej analizy danych. Jego siłą jest darmowość (licencja pozwala na wykorzystywanie programu bezpłatnie także w zastosowaniach komercyjnych), wszechstronność (stale tworzone są nowe pakiety zawierające procedury statystyczne wykorzystywane w m. in. analizach ekonometrycznych, psychometrycznych, socjologicznych, geologicznych pogodowych czy biomedycznych) oraz olbrzymia społeczność użytkowników współtworząca nowe pakiety i wspierająca się nawzajem za pośrednictwem internetowych forów. R jest również najlepszym obecnie programem do wizualizacji danych.

Kurs jest przeznaczony dla osób, które chcą opanować zaawansowane metody analizy i wizualizacji danych i/lub opanować w stopniu zaawansowanym program R. Biegłe posługiwanie się tym programem wymaga poznanie specjalistycznego języka poleceń, który jest językiem programistycznym (wszystkie polecenia wydaje się wyłącznie za pomocą odpowiednich komend). Dlatego ok. 50% czasu zajęciowego zostanie przeznaczone na szczegółowe omawianie języka używanego w R.

Szczegółowa tematyka kursu:

• Podstawy obsługi R – omówienie edytora R-Studio, instalowanie pakietów, import danych, podstawowe komendy, typy obiektów, specyfika pracy w R.

• Eksploracyjna analiza danych – praca na tabelach danych, pakiety: dplyr, tidyr, plyr, data.table

• Podstawy wizualizacji w R – pakiet base i graphics

• Tworzenie diagramów w R – pakiet diagram

• Wizualizacja danych 2D cz. 1– pakiet ggplot2 i jego rozszerzenia

• Wizualizacja danych 2D cz. 2 – przegląd wykresów

• Wizualizacja danych 2D cz. 3– tabele danych, złożone wykresy i infografiki

• Wizualizacja danych 3D cz. 1– pakiety lattice oraz scatterplot3d

• Wizualizacja danych 3D cz. 2 – przegląd wykresów

• Sztuka tworzenia efektywnych i ciekawych wykresów

• Interaktywne wykresy – pakiety RCharts, htmlwidgets, ggvis

• Wizualizacja wyników analiz statystycznych cz. 1 – rysowanie przedziałów ufności, wizualizacja wyników regresji liniowej, korelogramy

• Wizualizacja wyników analiz statystycznych cz. 2– PCA, klasteryzacja, klasyfikacja, text mining (analiza sieci)

• Podstawy programowania w R – instrukcje warunkowe, pętle, rodzina funkcji apply(), praca na obiektach w R, tworzenie własnych funkcji, tworzenie animacji w R

• Automatyzacja pracy – parametryzacja kodu i powtarzalność analiz

• Tworzenie automatycznych raportów i prezentacji za pomocą Rmarkdown