Seminar

DATA ANALYTICS KORIŠTENJEM R-A

Predavači: Renomirani stručnjaci

20-21.05.2024.

Datum

09:30 - 14:00

Sat

350€ *

Kotizacija

* bez PDV-a

-15% do 30.04.

Popust

Uživo, Online

Pratite

Cilj seminara je upoznavanje polaznika s programskim jezikom R – trenutno jednim od vodećih za statistiku i data science. Pregršt gotovih paketa i funkcija pojednostavljuje rad U R-u pa će se tijekom modula polaznici upoznati s njih nekoliko. Prediktivne i statističke analize prezentirane su kroz „case study“ prilikom kojih će polaznici steći razumijevanje promatranog poslovnog procesa te načine predikcije primjenom više tehnika (Primjerice ponašanja klijenta – „Churn“ u telekom industriji, „Default“ u poslovanju banaka). Znanjem pokrivenim ovim modulom, polaznici će biti spremni za analizu podataka korištenjem R-a, primjenu prediktivnih modela te interpretaciju rezultata izračuna.

Syllabus

  1. DAN – Osnove statistike

S obzirom na ranije definirani cilj modula, od polaznika se ne očekuje određena razina predznanja osim osnovnog poznavanja matematičkih pojmova. Tijekom prvog dana, obradit će se slijedeće teme:

  • Uvod u programski jezik R
  • Razvoj i primjene u Big Data-i
  • Najčešće korišteni paketi – CRAN
  • Instalacija konzole i razvojna okolina
  • Osnovni objekti i tipovi podataka
  • Funkcije
  • Jednostavne transformacije podataka

 

VJEŽBE:

Upoznavanje s razvojnom okolinom i osnovnim tipovima podataka potrebnim za rad u programskom jeziku. Pridruživanja, jednostavne naredbe i transformacije nad podacima

 

  1. DAN – Data Mining i vizualizacije podataka
  • Učitavanje podataka (txt, xls, db, …)
  • Pregled i osnovne obrade podataka
  • Napredne obrade podataka (čišćenje podataka, manipulacija i join – dplry, …)
  • Export podataka
  • Osnove vizualizacije podataka
  • Napredne vizualizacije (ggplot)
  • Korelacije
  • Case Study: Povrati od ulaganja i Value-at-Risk (Quantitative Risk Management)
  • Uvod u regresijski model
  • Linearna i logistička regresija
  • Case Study: Primjena logističke regresije za Probability of Default
  • Predviđanje primjenom vremenskih nizova
  • Case Study: Primjena vremenskih nizova za predviđanje potrošnje energenta

 

VJEŽBE:

Drugi dan modula polaznicima daje pregled tehnika koja je moguće istraživati podatke. Rad počinje učitavanjem podataka iz raznih izvora i pregledom podataka (osnovne kontrole i obrade). Polaznici se upoznavanju s naprednim tehnikama rada u dplry paketu (jedan od vodećih paketa za data mining u R-u). Kraj cjeline čini osnove vizualizacije podataka korištenjem R-a (paket ggplot).

Nakon uvoda u R i pripreme podataka za analizu, zadnji dan modula daje pregled osnovnih prediktivnih tehnika. Uz prethodni teoretski uvod u pojedini Case-Study, korištenjem paketa i funkcija u R-u polaznici samostalno izvršavaju prediktivne tehnike te interpretiraju rezultate predikcija.

Ciljana skupina

Prijavite se na seminar

DATA ANALYTICS KORIŠTENJEM R-A