- Leren door doen
- Trainers met praktijkervaring
- Klassikale trainingen
- Gedetailleerd cursusmateriaal
- Duidelijke inhoudsbeschrijving
- Maatwerk inhoud mogelijk
- Trainingen die doorgaan
- Kleine groepen
De cursus Data Analyse met R is bestemd voor Big Data analisten en wetenschappers die R willen gebruiken om hun data te analyseren en voor het maken van statische analyses.
Ervaring met programmeren is bevorderlijk voor een goede begripsvorming maar is niet vereist.
De theorie wordt behandeld aan de hand van presentaties en voorbeelden. De concepten worden toegelicht met demo's. Daarna is er tijd om er zelf mee te oefenen. R-Studio wordt gebruikt als ontwikkelomgeving. De cursustijden zijn van 9.30 tot 16.30
De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat R Programmeren.
In de cursus Data Analyse met R leert u programmeren in de taal R en hoe u R kunt gebruiken voor data-analyse en visualisatie. R is uitgegroeid tot een standaard platform voor gegevens analyse en het maken van grafieken en kan een enorme reeks statistische procedures uitvoeren die niet beschikbaar zijn in andere statistische programma’s.
In de cursus Data Analyse met R leert u in de eerste plaats hoe R te installeren en te configureren. Vervolgens leert u hoe door middel van grafieken en transformaties snel inzicht te krijgen in de data. Het inlezen van data uit verschillende bronnen wordt behandeld.
Ook data types van R, zoals vectors, arrays, matrices, lists, data frames en factors komen aan de orde. Evenals control flow in R met de family van apply functies.
De cursus Data Analyse met R behandelt verder statistische analyse modellen zoals lineaire en niet-lineaire modellen, variable transformaties en regressies.
Tenslotte wordt in de cursus Data Analyse met R aandacht besteed aan hoe je resultaten te presenteren, door middel van grafieken, rapportages of interactieve dashboards. Dit alles wordt ondersteund met veel voorbeelden uit de praktijk en kan ook toegepast worden op cases die door de cursisten worden meegenomen.
Module 1 : Intro R |
Module 2 : Graphics and Plots |
Module 3 : Transformations |
Overview of R History of R Installing R The R Community R Development R Studio R Console R Style Using R Packages Cheatsheets R Syntax R Objects |
ggplot2 Graphics Devices and Colors High-Level Graphics Functions Low-Level Graphics Functions Graphical Parameters Controlling the Layout Changing Plot Types Quick Plots and Basic Control Aesthetics Changing Plot Types Labels Themes and Layout |
dplyr R Functions Functions for Numeric Data Scoping Rules mutate arrange group by summarize select filter joining dataframe |
Module 4 : Presentation |
Module 5 : Data Cleaning |
Module 6 : Date Times |
rmarkdown Reproducible research Reporting Sharing results Repetitive Tasks Family of apply Functions apply Function lapply Function sapply Function tapply Function |
tidyr spread gather seperate unite Logical Data Missing Data Character Data Duplicate Values NA’s |
Time and Date Variables lubridate Setting a datetime Getting values from a datetime strftime Command strptime Command as.Date function Datetimes Calculations difftime Command Time Series Analysis |
Module 7 : Data Import |
Module 8 : Linear Models |
Module 8 : Non-Linear Models |
R Datasets Data.Frames Importing CSV Files Import from Text Files Import from Excel Import from Spss or SAS Connecting to a database Connecting to a cluster Databases and ODBC dbplyr |
What is a model? Statistical Models in R How to evaluate a model? How to use a model? Simple Linear Models logistic regression linear regression R squared p values confidence intervals |
Decision Trees random forest boosting overfitting Optional material : Interactive dashboards with Shiny Web Scraping Writing packages Spark Functional programming |
Al onze cursussen zijn klassikale cursussen waarbij de cursisten aan de hand van een ervaren trainer met diepgaande materie kennis door de stof worden geleid. Theorie wordt steeds afgewisseld met oefeningen.
We doen ook maatwerk en passen dan de cursusinhoud aan op uw wensen. Op verzoek gaan we ook in op uw praktijkcases.
De cursustijden zijn in pricipe van 9.30 tot 16.30. Maar we zijn hierin flexibel. Soms moeten mensen namelijk kinderen naar de opvang brengen of halen en komen andere tijden hun beter uit. In goed overleg kunnen we dan andere cursustijden afspreken.
Wij zorgen voor de computers waarop de cursus gehouden kan worden. Op deze computer is de voor de cursus benodigde software al geinstalleerd. U hoeft geen laptop mee te nemen om aan de cursus te kunnen deelnemen. Als u liever op uw eigen laptop werkt kunt u hem desgewenst meenemen. De benodigde software wordt dan aan het begin van de cursus geinstalleerd.
Onze cursussen worden over het algemeen gegeven met Open Source software zoals Eclipse, IntelliJ, Tomcat, Pycharm, Anaconda en Netbeans. Het digitale cursusmateriaal krijgt u na de cursus mee naar huis.
De cursus is inclusief lunch die we in een restaurantje op loopafstand van het cursuslokaal gebruiken.
De cursussen worden op diverse plaatsen in het land gepland. Een cursus gaat op een locatie door als er zich minimaal 3 mensen voor die locatie inschrijven. Als er inschrijvingen voor verschillende locaties zijn gaat de cursus door op onze hoofdlocatie is Houten net onder Utrecht. Een cursus op onze hoofdlocatie gaat ook door bij 2 inschrijvingen en regelmatig ook bij 1 inschrijving. Overigens doen we ook cursussen op de locatie van de klant als men daar prijs op stelt.
De intellectuele eigendomsrechten van de gepubliceerde cursus inhoud, ook wel aangeduid als infosheet, behoren toe aan SpiralTrain. Het is niet toegestaan de cursusinformatie, de infosheet, te publiceren in schiftelijke dan wel digitale vorm zonder de uitdrukkelijke toestemming van SpiralTrain. Onder de cursus inhoud dient te worden verstaan de beschrijving van de cursus inhoud in zinnen alsmede de indeling van de cursus in modules en onderwerpen in de modules.