- Leren door doen
- Trainers met praktijkervaring
- Klassikale trainingen
- Gedetailleerd cursusmateriaal
- Duidelijke inhoudsbeschrijving
- Maatwerk inhoud mogelijk
- Trainingen die doorgaan
- Kleine groepen
In de cursus Machine Learning met R leert u hoe u de taal R en de R libraries kunt toepassen bij modellerings projecten en machine learning. Machine Learning is een onderdeel van artificial intelligence en betreft de bestudering van algoritmes die zich automatisch verbeteren op basis van ervaring. Machine learning algoritmes maken een model gebaseerd op training data en kunnen dan voorspellingen doen over nieuwe data.
Allereerst worden in een review de fundamentals van R besproken zoals data types en functies. Vervolgens komen een aantal belangrijke libraries zoals dplyr en ggplot2 aan bod.
Dan wordt ingegaan op de principes van machine learning, het bouwen van modellen op basis van data en de verschillen tussen supervised en unsupervised learning.
Lineaire regressie en logistische regressie en de verschillen ertussen komen aan de orde. Ook wordt besproken hoe modellen kunnen worden gecheckt op nauwkeurigheid door te kijken naar summaries, coëfficiënten en plots.
Vervolgens wordt ingegaan op hoe functionele programmeer technieken in R kunnen worden toegepast. Hierbij worden andere oplossingen voor iteratie middels diverse map en andere functions behandeld.
Ook is er aandacht voor de benadering van Apache Spark vanuit R door middel van een gedistribueerde data frame implementation met operaties als selection, filtering en aggregation.
Visualisatie in interactive web applicaties voor data representatie direct vanuit R via het Shiny package staat eveneens op het programma.
Dan komen in de cursus Machine Learning met R Decision Trees aan de orde. Dit Machine Learning algoritmes is gebaseerd op classificatie.
De cursus wordt afgesloten met de behandeling van diverse andere Machine Learning algoritmes zoals Naive Bayes, Principal Component Analysis en Support Vector Machines.
De cursus Machine Learning met R is bedoeld voor data analisten en data scientists die de R libraries willen gebruiken voor modellering en machine learning.
Om aan deze cursus te kunnen deelnemen is kennis van en ervaring met de programmeertaal R voor Data Analyse vereist. De nodige voorkennis met betrekking tot statistische methoden en algorithmen is bevordelijk voor de begripsvorming.
De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo's verduidelijken de concepten. De theorie wordt afgewisseld met oefeningen en case studies. De cursustijden zijn van 9.30 tot 16.30.
De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Machine Learning met R.
Module 1 : R Review |
Module 2 : Machine Learning |
Module 3 : Linear Regression |
R Data Types Data Frames Factors Rmarkdown tidy package Functions in R Apply functions Statistics R Data Files Using dplyr Package Plotting with ggplot2 |
What is Machine Learning? Building Models of Data Model Based Learning Tunable Parameters Supervised Learning Discrete Labels Continuous Labels Classification and Regression Unsupervised Learning Data Speaks for Itself Clustering and Dimensionality Reduction |
Check Model Using Summary Using Coefficients Correlation R R Squared F Test Check Model Graphically Check Residuals Polynomial Regression Gaussian Basis Functions Overfitting |
Module 4 : Logistic Regression |
Module 5 : Functional R |
Module 6 : Sparklyr Intro |
Compare with Linear Regression Explore with Graphics Logistic Function Checking Model Using Summary Using Coefficients Calculate Probabilities Making Predictions Confusion Matrix Accuracy Precision and Recall ROC Curve |
Solving Iteration purr package library tidyverse map Functions Parameters of map .x as placeholder map_lgl Function map_int and map_char map2 Function Other iteration functions Combine purr with dyplr walk Function |
Spark Session Copy data into Spark File Setup Load data Spark SQL Store Data Using dplyr showquery() Spark DataFrame Functions sdf_pivot() Feature Transformers Distributed R |
Module 7 : Shiny |
Module 8 : Decision Trees |
Module 9 : Andere Algorithms |
Web Applications Shiny Architecture Shiny Server UI and Server Input Object Output Object Reactivity Render Options Shiny Functions Shiny Layout and Dashboard Shiny Performance |
Ensemble Learner Creating Decision Trees DecisionTreeClassifier Overfitting Decision Trees Ensembles of Estimator Random Forests Parallel Estimators Bagging Classifier Random Forest Regression RandomForestRegressor Non Parametric Model |
Naive Bayes Classifiers Gaussian Naive Bayes Principal Component Analysis Least Squares Polynomial Fitting Constrained Linear Regression K-Means Clustering Support Vector Machines Conditional Random Fields Explained Variance Dimensionality Reduction |
Al onze cursussen zijn klassikale cursussen waarbij de cursisten aan de hand van een ervaren trainer met diepgaande materie kennis door de stof worden geleid. Theorie wordt steeds afgewisseld met oefeningen.
We doen ook maatwerk en passen dan de cursusinhoud aan op uw wensen. Op verzoek gaan we ook in op uw praktijkcases.
De cursustijden zijn in pricipe van 9.30 tot 16.30. Maar we zijn hierin flexibel. Soms moeten mensen namelijk kinderen naar de opvang brengen of halen en komen andere tijden hun beter uit. In goed overleg kunnen we dan andere cursustijden afspreken.
Wij zorgen voor de computers waarop de cursus gehouden kan worden. Op deze computer is de voor de cursus benodigde software al geinstalleerd. U hoeft geen laptop mee te nemen om aan de cursus te kunnen deelnemen. Als u liever op uw eigen laptop werkt kunt u hem desgewenst meenemen. De benodigde software wordt dan aan het begin van de cursus geinstalleerd.
Onze cursussen worden over het algemeen gegeven met Open Source software zoals Eclipse, IntelliJ, Tomcat, Pycharm, Anaconda en Netbeans. Het digitale cursusmateriaal krijgt u na de cursus mee naar huis.
De cursus is inclusief lunch die we in een restaurantje op loopafstand van het cursuslokaal gebruiken.
De cursussen worden op diverse plaatsen in het land gepland. Een cursus gaat op een locatie door als er zich minimaal 3 mensen voor die locatie inschrijven. Als er inschrijvingen voor verschillende locaties zijn gaat de cursus door op onze hoofdlocatie is Houten net onder Utrecht. Een cursus op onze hoofdlocatie gaat ook door bij 2 inschrijvingen en regelmatig ook bij 1 inschrijving. Overigens doen we ook cursussen op de locatie van de klant als men daar prijs op stelt.
Na afloop van iedere cursus worden de deelnemers verzocht de cursus te evalueren ten aanzien van cursusinhoud, cursusmateriaal, trainer en locatie. Het evaluatie formulier staat op https://www.klantenvertellen.nl/reviews/1039545/spiraltrain. De evaluaties van voorgaande deelnemers en voorgaande cursussen kunnen daar ook worden teruggevonden.
De intellectuele eigendomsrechten van de gepubliceerde cursus inhoud, ook wel aangeduid als infosheet, behoren toe aan SpiralTrain. Het is niet toegestaan de cursusinformatie, de infosheet, te publiceren in schiftelijke dan wel digitale vorm zonder de uitdrukkelijke toestemming van SpiralTrain. Onder de cursus inhoud dient te worden verstaan de beschrijving van de cursus inhoud in zinnen alsmede de indeling van de cursus in modules en onderwerpen in de modules.