Cilj seminara je upoznavanje polaznika s programskim jezikom R – trenutno jednim od vodećih za statistiku i data science. Pregršt gotovih paketa i funkcija pojednostavljuje rad U R-u pa će se tijekom modula polaznici upoznati s njih nekoliko. Prediktivne i statističke analize prezentirane su kroz „case study“ prilikom kojih će polaznici steći razumijevanje promatranog poslovnog procesa te načine predikcije primjenom više tehnika (Primjerice ponašanja klijenta – „Churn“ u telekom industriji, „Default“ u poslovanju banaka). Znanjem pokrivenim ovim modulom, polaznici će biti spremni za analizu podataka korištenjem R-a, primjenu prediktivnih modela te interpretaciju rezultata izračuna.
Seminar
DATA ANALYTICS KORIŠTENJEM R-A
Predavači: Renomirani stručnjaci
20-21.05.2024.
Datum
09:30 - 14:00
Sat
350€ *
Kotizacija
* bez PDV-a
-15% do 30.04.
Popust
Uživo, Online
Pratite
Syllabus
- DAN – Osnove statistike
S obzirom na ranije definirani cilj modula, od polaznika se ne očekuje određena razina predznanja osim osnovnog poznavanja matematičkih pojmova. Tijekom prvog dana, obradit će se slijedeće teme:
- Uvod u programski jezik R
- Razvoj i primjene u Big Data-i
- Najčešće korišteni paketi – CRAN
- Instalacija konzole i razvojna okolina
- Osnovni objekti i tipovi podataka
- Funkcije
- Jednostavne transformacije podataka
VJEŽBE:
Upoznavanje s razvojnom okolinom i osnovnim tipovima podataka potrebnim za rad u programskom jeziku. Pridruživanja, jednostavne naredbe i transformacije nad podacima
- DAN – Data Mining i vizualizacije podataka
- Učitavanje podataka (txt, xls, db, …)
- Pregled i osnovne obrade podataka
- Napredne obrade podataka (čišćenje podataka, manipulacija i join – dplry, …)
- Export podataka
- Osnove vizualizacije podataka
- Napredne vizualizacije (ggplot)
- Korelacije
- Case Study: Povrati od ulaganja i Value-at-Risk (Quantitative Risk Management)
- Uvod u regresijski model
- Linearna i logistička regresija
- Case Study: Primjena logističke regresije za Probability of Default
- Predviđanje primjenom vremenskih nizova
- Case Study: Primjena vremenskih nizova za predviđanje potrošnje energenta
VJEŽBE:
Drugi dan modula polaznicima daje pregled tehnika koja je moguće istraživati podatke. Rad počinje učitavanjem podataka iz raznih izvora i pregledom podataka (osnovne kontrole i obrade). Polaznici se upoznavanju s naprednim tehnikama rada u dplry paketu (jedan od vodećih paketa za data mining u R-u). Kraj cjeline čini osnove vizualizacije podataka korištenjem R-a (paket ggplot).
Nakon uvoda u R i pripreme podataka za analizu, zadnji dan modula daje pregled osnovnih prediktivnih tehnika. Uz prethodni teoretski uvod u pojedini Case-Study, korištenjem paketa i funkcija u R-u polaznici samostalno izvršavaju prediktivne tehnike te interpretiraju rezultate predikcija.