- Leren door doen
- Trainers met praktijkervaring
- Klassikale trainingen
- Gedetailleerd cursusmateriaal
- Duidelijke inhoudsbeschrijving
- Maatwerk inhoud mogelijk
- Trainingen die doorgaan
- Kleine groepen
De cursus Data Analyse met R is bestemd voor Big Data analisten en wetenschappers die R willen gebruiken om hun data te analyseren en voor het maken van statische analyses.
Ervaring met programmeren is bevorderlijk voor een goede begripsvorming maar is niet vereist.
De theorie wordt behandeld aan de hand van presentaties en voorbeelden. De concepten worden toegelicht met demo's. Daarna is er tijd om er zelf mee te oefenen. R-Studio wordt gebruikt als ontwikkelomgeving. De cursustijden zijn van 9.30 tot 16.30
De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat R Programmeren.
In de cursus Data Analyse met R leert u programmeren in de taal R en hoe u R kunt gebruiken voor data analyse en visualisatie. R is uitgegroeid tot een standaard platform voor data analyse en het maken van grafieken en kan een enorme reeks statistische procedures uitvoeren. In de cursus Data Analyse met R wordt gebruikt gemaakt van een reeks samenhangende R packages die bekend staan onder de naam de tidyverse. Deze packages hebben een onderliggende design filosofie, grammatica en data structuren gemeen en zijn speciaal geschikt voor data science.
De cursus Data Analyse met R gaat van start met de installatie van R en de R Studio ontwikkelomgeving. Ook wordt ingegaan op de basis syntax van R en de installatie van R packages.
Vervolgens leert hoe u met het ggplot2 package door middel van grafieken snel inzicht kunt krijgen in de data. Hierbij komen de verschillende plot types, themes en layouts aan de orde.
Dan is het tijd voor het dplyr package waarmee veel voorkomende data transformatie problemen zoals filteren, sorteren, sommeren en groeperen, kunnen worden opgelost.
Ook het presenteren van data met het rmarkdown package wordt behandeld. Evenals het in een nette vorm brengen van ruwe data met het tidyr package, waarbij kolommen variabelen en rijen observaties worden.
In veel data sets komen tijd reeksen voor. Op de verwerking daarvan wordt ingegaan met het lubridate package dat beschikt over vele handige functies voor de verwerking van datums en tijd.
Onderdeel van het programma van de cursus is ook het importeren van data uit csv files en file formaten van andere statistische pakketten zoals SPSS of SAS. Het lezen uit en schrijven naar databases passeert ook de revue.
Tenslotte behandelt de cursus Data Analyse met R statistische analyse modellen zoals lineaire en niet-lineaire modellen, variable transformaties en regressies. Dit alles wordt ondersteund met veel voorbeelden uit de praktijk en kan ook toegepast worden op cases die door de cursisten worden meegenomen.
Module 1 : Intro R |
Module 2 : Graphics and Plots |
Module 3 : Transformations |
Overview of R History of R Installing R The R Community R Development R Studio R Console R Style Using R Packages Cheatsheets R Syntax R Objects |
ggplot2 Graphics Devices and Colors High-Level Graphics Functions Low-Level Graphics Functions Graphical Parameters Controlling the Layout Changing Plot Types Quick Plots and Basic Control Aesthetics Changing Plot Types Labels Themes and Layout |
dplyr R Functions Functions for Numeric Data Scoping Rules mutate arrange group by summarize select filter joining dataframe |
Module 4 : Presentation |
Module 5 : Data Cleaning |
Module 6 : Date Times |
rmarkdown Reproducible research Reporting Sharing results Repetitive Tasks Family of apply Functions apply Function lapply Function sapply Function tapply Function |
tidyr spread gather seperate unite Logical Data Missing Data Character Data Duplicate Values NA’s |
Time and Date Variables lubridate Setting a datetime Getting values from a datetime strftime Command strptime Command as.Date function Datetimes Calculations difftime Command Time Series Analysis |
Module 7 : Data Import |
Module 8 : Linear Models |
Module 8 : Non-Linear Models |
R Datasets Data.Frames Importing CSV Files Import from Text Files Import from Excel Import from Spss or SAS Connecting to a database Connecting to a cluster Databases and ODBC dbplyr |
What is a model? Statistical Models in R How to evaluate a model? How to use a model? Simple Linear Models logistic regression linear regression R squared p values confidence intervals |
Decision Trees random forest boosting overfitting Optional material : Interactive dashboards with Shiny Web Scraping Writing packages Spark Functional programming |
Al onze cursussen zijn klassikale cursussen waarbij de cursisten aan de hand van een ervaren trainer met diepgaande materie kennis door de stof worden geleid. Theorie wordt steeds afgewisseld met oefeningen.
We doen ook maatwerk en passen dan de cursusinhoud aan op uw wensen. Op verzoek gaan we ook in op uw praktijkcases.
De cursustijden zijn in pricipe van 9.30 tot 16.30. Maar we zijn hierin flexibel. Soms moeten mensen namelijk kinderen naar de opvang brengen of halen en komen andere tijden hun beter uit. In goed overleg kunnen we dan andere cursustijden afspreken.
Wij zorgen voor de computers waarop de cursus gehouden kan worden. Op deze computer is de voor de cursus benodigde software al geinstalleerd. U hoeft geen laptop mee te nemen om aan de cursus te kunnen deelnemen. Als u liever op uw eigen laptop werkt kunt u hem desgewenst meenemen. De benodigde software wordt dan aan het begin van de cursus geinstalleerd.
Onze cursussen worden over het algemeen gegeven met Open Source software zoals Eclipse, IntelliJ, Tomcat, Pycharm, Anaconda en Netbeans. Het digitale cursusmateriaal krijgt u na de cursus mee naar huis.
De cursus is inclusief lunch die we in een restaurantje op loopafstand van het cursuslokaal gebruiken.
De cursussen worden op diverse plaatsen in het land gepland. Een cursus gaat op een locatie door als er zich minimaal 3 mensen voor die locatie inschrijven. Als er inschrijvingen voor verschillende locaties zijn gaat de cursus door op onze hoofdlocatie is Houten net onder Utrecht. Een cursus op onze hoofdlocatie gaat ook door bij 2 inschrijvingen en regelmatig ook bij 1 inschrijving. Overigens doen we ook cursussen op de locatie van de klant als men daar prijs op stelt.
De intellectuele eigendomsrechten van de gepubliceerde cursus inhoud, ook wel aangeduid als infosheet, behoren toe aan SpiralTrain. Het is niet toegestaan de cursusinformatie, de infosheet, te publiceren in schiftelijke dan wel digitale vorm zonder de uitdrukkelijke toestemming van SpiralTrain. Onder de cursus inhoud dient te worden verstaan de beschrijving van de cursus inhoud in zinnen alsmede de indeling van de cursus in modules en onderwerpen in de modules.