Snel navigeren naar:

  • Inhoud
  • Voordelen
  • Specificaties
  • Reviews
  • More information
  • FAQ

Productinformatie

Statistieken zijn een belangrijke element bij gegevensanalyse en -modellering. In deze training leer je om verschillende dynamische statistische hulpmiddelen te gebruiken om je gegevens te verkennen en te begrijpen. Je onderzoekt populatieverdelingen om willekeurige variabelen te modelleren, werkt met discrete en continue kansverdelingen en gebruikt discrete kansverdelingstypen, zoals de uniforme, binominale en Poisson-verdelingen. Vervolgens leer je om de nul- en alternatieve hypothesen voor een tests op te stellen en om de resultaten te interpreteren. Je onderzoekt de meest gebruikte statistische toetsen, de T-toets en variantieanalyse (ANOVA).

Regressiemodellen worden gebruikt om continue waarden te voorspellen en zijn de meest gebruikte machine learning-modellen. In deze training leer je te begrijpen wat algoritmen voor machine learning (ML) precies zijn en hoe je ML-modellen kunt gebruiken om resultaten te voorspellen op basis van invoergegevens. Je leert logistische regressie en beslissingsbomen te gebruiken om classificatiemodellen te bouwen en je modellen te evalueren met behulp van nauwkeurigheid, precisie en terugroepactie. Clustering is een leeralgoritme zonder toezicht dat zelf patronen in gegevens ontdekt en helpt bij het identificeren van logische groeperingen. Je leert onderscheid te maken tussen begeleid en niet-gesuperviseerd leren én je herkent hoe regressie- en classificatie-algoritmen verschillen van clustering.

Ten slotte leer je de afweging tussen bias en variantie te begrijpen, waarmee datawetenschappers generaliseerbare modellen kunnen bouwen die goed presteren op testgegevens.

Inhoud van de training

Statistische analyse en modellering in R.

15 uur

Statistical Analysis and Modeling in R: Working with Probability Distributions

  • Interpreting data is a core pre-processing step in data analysis and modeling. Use this course to practice using various dynamic statistical tools to explore and understand your data.
  • During this course, you'll explore population distributions to model random variables, work with discrete and continuous probability distributions, and use discrete probability distribution types, such as the uniform, binomial, and Poisson distributions.
  • You'll also examine continuous distributions, such as the normal and the exponential distributions.
  • You'll round the course off by learning how to read and interpret QQ plots, which can be used to compare the distributions of two samples of data.
  • When you're finished, you'll be able to use probability distributions to model events and understand your data.

Statistical Analysis and Modeling in R: Understanding & Interpreting Statistical Tests

  • Statistical analysis involves making educated guesses known as hypotheses and testing them to see if they hold up. Use this course to learn how to apply hypothesis testing to your data.
  • Examine the use of descriptive statistics to summarize data and inferential statistics to draw conclusions. Learn how population parameters differ from summary statistics and how confidence intervals are used.
  • Discover how to perform hypothesis testing on sample data, construct null and alternative hypotheses, and interpret the results of your statistical tests.
  • Investigate the significance of the p-value of a statistical test and how it can be interpreted using the significance threshold or alpha level.
  • Additionally, examine the most commonly used statistical tests, the T-test and the analysis of variance (ANOVA).
  • When you're done, you'll have the confidence to set up the null and alternative hypotheses for your tests and interpret the results.

Statistical Analysis and Modeling in R: Statistical Analysis on Your Data

  • Hypothesis testing determines whether the educated guesses you've made about your data should be accepted or rejected. T-tests and ANOVA tests are some of the most commonly used methods in hypothesis testing. Knowing how to perform and interpret these tests are core data scientist skills.
  • In this course, get hands-on running statistical tests on your sample data. Test assumptions made by statistical tests, run T-tests, perform ANOVA analysis, and interpret the results.
  • Perform the one-sample t-test and the one-sample Z-test. Run the two-sample t-test to compare data from different groups or categories and the paired samples t-test to compare data across time.
  • When you're finished with this course, you'll have the know-how to run and interpret statistical tests using the R programming language.

Statistical Analysis and Modeling in R: Performing Regression Analysis

  • Regression models are used to predict continuous values and are some of the most commonly used machine learning models.
  • Use this course to grasp what exactly machine learning (ML) algorithms are and how you can use ML models to predict outcomes based on input data.
  • Learn how regression models work, train them, and evaluate regression results using metrics such as R2 and RMSE. Perform regression analysis in R using the ordinary least squares regression. Build models using simple and multiple regression and train a regression model using cross-validation.
  • Upon completing this course, you'll be able to perform regression to predict continuous values and evaluate these models using metrics such as the R2 and adjusted R2.

Statistical Analysis and Modeling in R: Performing Classification

  • Classification models are used to classify or categorize data points into two or more categories. Learn how these models work and how you can evaluate your classification models using the confusion matrix and metrics such as accuracy, precision, and recall.
  • During this course, you'll perform classification using both logistic regression and an imbalanced dataset. You'll also examine why precision or recall scores may be better metrics than accuracy to evaluate such models.
  • Furthermore, build a classification model using decision trees, visualize the tree structure, and explore the variable importance assigned by this tree structure to understand and interpret the model.
  • When you've finished this course, you'll be able to confidently use logistic regression and decision trees to build classification models and evaluate your models using accuracy, precision, and recall.

Statistical Analysis and Modeling in R: Performing Clustering

  • Clustering is an unsupervised learning algorithm that self-discovers patterns in data and helps identify logical groupings. Use this course to distinguish between supervised and unsupervised learning and recognize how regression and classification algorithms differ from clustering.
  • Examine the basic principles of clustering models and how k-means clustering finds logical groupings in your data. Learn the evaluation techniques used in clustering and find the optimal number of clusters in your data using both the elbow method and the Silhouette score.
  • Perform clustering on a dataset with multiple attributes and visualize clusters in your data using principal components.
  • When you've completed this course, you'll be able to find groupings in your data using k-means clustering and compute the optimal number of clusters for your data.

Statistical Analysis and Modeling in R: Building Regularized Models & Ensemble Models

  • Understanding the bias-variance trade-off allows data scientists to build generalizable models that perform well on test data. Machine learning models are considered a good fit if they can extract general patterns or dominant trends in the training data and use these to make predictions on unseen instances.
  • Use this course to discover what it means for your model to be a good fit for the training data. Identify underfit and overfit models and what the bias-variance trade-off represents in machine learning.
  • Mitigate overfitting on training data using regularized regression models, train and evaluate models built using ridge regression, lasso regression, and ElasticNet regression, and implement ensemble learning using the random forest model.
  • When you're done with this course, you'll have the skills and knowledge to train models that learn general patterns using regularized models and ensemble learning.

Kenmerken

Engels (US)
15 uur
Data Visualisatie
90 dagen online toegang
HBO

Meer informatie

Extra product informatie 0
Doelgroep Data-analist
Voorkennis

Geen voorkennis vereist. Ervaring met statistische analyses is aan te raden.

resultaat

Na het volgen van deze training kan je met behulp van verschillende dynamische statistische tools je data beter begrijpen.

Positieve reacties van cursisten

Ontwikkel je tot data analist

Service is echt heel goed. Snel, klantvriendelijk, weten waar ze over praten en denken met je mee met oplossingen. Daarnaast hebben ze ook een goed leerplatform om je studie te volgen en na elke module een korte toets om te zien hoeveel je ervan heb begrepen en je kan de status zien hoeveel tijd je hebt besteed aan je studie. Ik waardeer ze enorm en ik raad elke ICT'er aan om met hen in zee te gaan om je studie te volgen.

- Emilio Jones

Training: Introduction to SQL

Eén training geprobeerd en deze naar tevredenheid gevolgd. Een module werkte in eerste instantie niet, maar na contact opgenomen te hebben met klantenservice kreeg ik snel antwoord met een oplossing.

- Lars van der Spek

Training: Certified Ethical Hacker (CEHv12) - incl. examen

Eerste keer dat ik een online training heb gedaan en zou zo weer een training volgen via icttraningen.nl

- Jerry Jialal

Training: Microsoft Managing Modern Desktops (exam MD-101)

Het resultaat van de groep is absoluut bevredigend. Ik ga in ieder geval geen ander meer bellen.

- Antoine Evertze, Sales Engineer bij Chubb

Training: PRINCE2® 6e editie Foundation- incl. examen

Als er wat is staan ze altijd voor me klaar. Ik word meteen geholpen als ik bel.

- E. Zeijlmans, P&O adviseur bij Parnassia Groep

Training: ITIL® 4 Foundation - incl. examen

Wij zijn gebaat bij mensen die bijblijven in hun vakgebied en continu getriggerd worden.

- W. van Uijthoven, IT manager bij gemeente Arnhem

Training: Excel 2013 Compleet

Ik heb al eens eerder een training gehad via icttrainingen.nl en dat was een erg leerzame, leuke ervaring. Nu heb ik via het werk een online cursus en deze lijkt tot nu toe ook erg leerzaam.

- Michelle Brierley

Hoe gaat het te werk?

1

Training bestellen

Nadat je de training hebt besteld krijg je bevestiging per e-mail.

2

Toegang leerplatform

In de e-mail staat een link waarmee je toegang krijgt tot ons leerplatform.

3

Direct beginnen

Je kunt direct van start. Studeer vanaf nu waar en wanneer jij wilt.

4

Training afronden

Rond de training succesvol af en ontvang van ons een certificaat!

Veelgestelde vragen

Veelgestelde vragen

Op welke manieren kan ik betalen?

Je kunt bij ons betalen met iDEAL, PayPal, Creditcard, Bancontact en op factuur. Betaal je op factuur, dan kun je met de training starten zodra de betaling binnen is.

Hoe lang heb ik toegang tot de training?

Dit verschilt per training, maar meestal 180 dagen. Je kunt dit vinden onder het kopje ‘Kenmerken’.

Waar kan ik terecht als ik vragen heb?

Je kunt onze Learning & Development collega’s tijdens kantoortijden altijd bereiken via support@icttrainingen.nl of telefonisch via 026-8402941.

Background Frame
Background Frame

Onbeperkt leren

Met ons Unlimited concept kun je onbeperkt gebruikmaken van de trainingen op de website voor een vast bedrag per maand.

Bekijk de voordelen

Heb je nog twijfels?

Of gewoon een vraag over de training? Blijf er vooral niet mee zitten. We helpen je graag verder. Daar zijn we voor!

Contactopties