fbpx
Code: DSC100
Duur in dagen: 4
Download: Open Rooster.pdf
Download: Infosheet
€ 1999

Cursus Data Analyse met Python

29-07 t/m 01-08-2019
26-08 t/m 29-08-2019
30-09 t/m 03-10-2019
28-10 t/m 31-10-2019
25-11 t/m 28-11-2019
Uw startdatum
Regio:

Doelgroep Cursus Data Analyse met Python

Cursus-Data-Analyse-met-PythonDe cursus Data Analyse met Python is bedoeld voor data analisten die Python en de Python libraries willen gebruiken in Data Analyse projecten.

Voorkennis training Data Analyse met Python

Om aan deze cursus te kunnen deelnemen is kennis van en ervaring met een willekeurige programmeertaal of pakket zoals SPSS, Matlab of VBA wenselijk. De cursus start met de behandeling van de beginselen van de programmeertaal Python.

Uitvoering cursus Data Analyse met Python

De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo’s verduidelijken de concepten. De theorie wordt afgewisseld met oefeningen. Als ontwikkelomgeving wordt de Anaconda distributie met Jupyter notebooks gebruikt. De cursustijden zijn van 9.30 tot 16.30.

Officieel Certificaat Data Analyse met Python

De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Data Analyse met Python.

Inhoud Cursus Data Analyse met Python

In de cursus Data Analyse met Python leert u hoe u de Python taal en Python libraries kunt gebruiken in Data Analysis projecten. De cursus start met een behandeling in vogelvlucht van de Python syntax aspecten die belangrijk zijn bij Data Analyse projecten. Variabelen, data types, functies, flow control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda. Vervolgens komt het NumPy package aan de orde, waarmee grote datasets zeer efficiënt verwerkt kunnen worden. Hierbij wordt NumPy’s ndarray object en zijn methodes besproken. Aandacht wordt besteed aan de verschillende array manipulatie technieken met broadcasting en vectorized operations. Vervolgens is het de beurt aan het gebruik van Panda’s voor data analyse. De pandas library introduceert twee nieuwe data structures in Python die gebruik maken van Numpy en daarom snel zijn. De data structures zijn DataFrame en Series en er wordt uitgebreid ingegaan hoe deze te gebruiken voor data analysis bij het inspecteren, selecteren, filteren, combineren en groeperen van data. Hierbij wordt ook de MatPlotlib library besproken die nauw is geïntegreerd met NumPy en een zeer krachtig instrument vormt voor het creeeren en plotten van complexe data relaties. En tenslotte wordt aandacht besteed aan de essentials van de ScikitLearn library voor modellering. De cursus maakt gebruik van vele voorbeelden uit de praktijk en laat zien hoe één- en twee- en drie dimensionale data sets kunnen worden gevisualiseerd.

Module 1 : Python Language Syntax

Module 2 : Functions and Modules

Module 3 : Classes and Objects

Python Features
Running Python
Anaconda Distribution
IPython Shell
Interactive and Script Mode
Python Data Types
Numbers and Strings
Sequences and Lists
Sets and Dictionaries
Python Flow Control
Exception Handling
Pass by Value and Reference
Scope of Variables
EFAP principle
What are comprehensions?
Lambda Operator
Filter, Reduce and Map
List comprehensions
Set and Dictionary comprehensions
Creating and Using Modules
import Statement
from…import Statement
Creating Classes
Creating and Using Objects
Accessing Attributes
Property Syntax
Constructors and Destructors
Encapsulation
Inheritance
super Keyword
Checking Relationships
issubclass and isinstance
Overriding Methods

Module 4 : Numpy

Module 5 : Pandas

Module 6 : Data Manipulation

NumPy Numerical Types
Data Type objects
dtype attributes
Slicing and Indexing
Array comparisons
Manipulating array shapes
Stacking and Splitting arrays
any(),all(), slicing, reshape()
Manipulating array shapes
Methods of ndarray
Views versus copies
ravel(),flatten(),transpose()
Pandas DataFrame
Import Data
Inspect Data
Data Visualization
DataFrame Data Types
Indexing and selection
Data operations in pandas
Missing Data
Hierarchical Indexing
Plotting with Pandas
Combining Datasets
Exploratory Data Analysis
Indexing Data Frames
.loc and .iloc Accessor
Slicing and Indexing a Series
Filtering with Boolean Series
Zeros and NaNs
all and any Nonzeros
Using map Function
Hierarchical Indexing
Rearranging Data
Reshaping by Pivoting
Transformation and Aggregation
Grouping Data

Module 7 : MatplotLib

Module 8 : Time Series

Module 9 : SciKitLearn Essentials

Simple Plots
Plot format String
Subplots
Histograms
Logarithmic Plots
Scatter plots
Fill between
Legend and Annotations
Three Dimensional Plots
Contour Plots
Transformations
Projections
Indexing Pandas Time Series
Reading and Slicing Times
Using a DatetimeIndex
Reindexing the Index
Separating and Resampling
Rolling mean and Frequency
Resample and Roll with it
Manipulating Time Series
Method chaining and Filtering
Missing values and Interpolation
Time Zones and Conversion
Plotting Time Series
SkiKit Learn library
Machine learning essentials
Supervised and Unsupervised
Feature matrix
Target array
Estimator API
Hyperparameters
Fit method
Predict method
Model Selection
Linear Regression
Logistic Regression

Kantooradres:
SpiralTrain BV

Gebouw "De Sijnsmeester"
Standerdmolen 8 – 1.11
3995 AA Houten

IP Computer Training Centrum
Diemerhof 32-36
1112 XN Diemen

020 7600027
http://www.ip-computer-training-centrum.nl

Compu Act Opleidingen
Slinge 303
3085 ER Rotterdam

023 - 551 3409
www.computertraining.nl

Trainspot
Kleine Singel 33
3572 CG Utrecht

030 - 737 05 81
http://www.trainspot.nl

IP Computer Training Centrum
Leenderweg 292
5644 AE Eindhoven

040 - 256 65 20
http://www.ip-computer-training-centrum.nl