Data Science Bootcamp mit R
Essential Data Science Training GmbHData Science Bootcamp mit R
Alle verfügbaren Kurstermine
Beschreibung
Data Science Bootcamp mit R
Unser Data Science Bootcamp mit R vermittelt in einzeln buchbaren Modulen das elementare Grundwissen aus dem Bereich der Datenanalyse, Statistik und Machine Learning. Für die Anwendungsbeispiele und praktische Übungsaufgaben kommt die statistische Software R zum Einsatz.
Ziel des Bootcamps ist es, theoretisches und praktisches Wissen über wichtige Data Science Methoden zu vermitteln. Dies soll es den Teilnehmern erleichtern, in ihrem Arbeitsalltag eigene Analysen und Projekte zielgerichteter und effizienter bearbeiten zu können, ohne sich tagelang selber in bestimmte Data Science Themen einarbeiten zu müssen. Zudem werden in den einzelnen Themenblöcken hilfreiche Zusatzpakete in R empfohlen, deren Nutzung oft unnötige Programmierarbeit, zusätzliche Recherchen und Anfängerfehler ersparen können.
Inhalte / Module
Modul 1: R Crashkurs (1-tägig)
In diesem Tag werden Grundkenntnisse der Programmiersprache R vermittelt. Der Fokus liegt dabei auf die technische Einführung in R, das Erlernen der grundlegenden R-Syntax und das Arbeiten mit R zur Datenanalyse. Dieser Kurs ist sowohl für Teilnehmer ohne R Kenntnisse als auch zur Auffrischung der Grundlagen in geeignet.
Modul 2: Praktische Datenanalyse in R (2-tägig)
Kursteilnehmer sollen mit den wichtigsten Konzepten und Begriffen in Data Science, Statistik und der Datenanalyse vertraut gemacht werden und lernen erste explorative Analysen in verschiedenen Datensituationen durchzuführen.
Modul 3: Effiziente Datenverarbeitung und Programmierung in R (2-tägig)
Datenmanipulation und Verarbeitung kann oft eine der zeitaufwendigsten Tätigkeiten in einer statistischen Analyse sein. In diesem Kurs werden Fähigkeiten vermittelt um effizient auch mit größeren Datenmengen in R arbeiten zu können. Nach dem Kurs sollen Teilnehmer in der Lage sein effizient in R arbeiten zu können, sowie Datenvorverarbeitung klarer, einfacher und schneller durchführen zu können.
Modul 4: Supervised Machine Learning in R (3-tägig)
- Themenschwerpunkte Teil 1: Einführung in Machine Learning und Predictive Modeling
- Themenschwerpunkte Teil 2: Praktisches Machine Learning - Evaluation und Tuning
- Themenschwerpunkte Teil 3: Machine Learning Pipelines, Datenvorverarbeitung und Feature Engineering
Modul 5: Unsupervised Learning in R (1-tägig)
Während beim überwachten maschinellen Lernen (engl. supervised machine learning) Vorhersagemodelle und das Erstellen akkurater Prognosen für eine bestimmte Zielgröße im Vordergrund ist, steht im unüberwachten maschinellen Lernen (engl. unsupervised machine learning) das Auffinden von Strukturen und Erkennen von Mustern in den Daten (ohne Kenntnisse über die Zielgröße) im Vordergrund. Hauptkomponentenanalyse (PCA) und Clusteranalyse sind bekannte Verfahren aus dem Bereich des Unsupervised Machine Learning und werden in diesem Kurs ausführlich behandelt.
Modul 6: Interpretable Machine Learning in R (1-tägig)
Im Gegensatz zu Modelle aus der klassischen Statistik wie beispielsweise das lineare Regressionsmodell werden Machine Learning Modelle oft als intransparente Blackbox bezeichnet, da ihre Vorhersagen in der Regel nicht leicht nachvollziehbar sind. Um dennoch Machine Learning Modelle und ihre Vorhersagen besser verstehen zu können, wurden in den letzten Jahren zahlreiche post-hoc Methoden aus dem Bereich des interpretierbaren maschinellen Lernen (auch eXplainable Artificial Intelligence bzw. XAI genannt) entwickelt.
In diesem Modul lernen Teilnehmer die aktuell bekanntesten und wichtigsten modell-agnostischen Methoden für die Interpretation von Prognosemodellen, ihr Nutzen in der Praxis, sowie ihre Vor- und Nachteile. Der Fokus der Anwendungsbeispiele liegt dabei auf Machine Learning Modelle, die auf klassische tabulare Daten trainiert wurden.
Aufbau & Organisation
Ablauf: Jeder Kurstag besteht aus 3 Teilen
-
Theorieteil: Der Dozent vermittelt wichtige methodische oder technische Konzepte, Anwendungsmöglichkeiten, sowie Vor- und Nachteile in einem Vortrag.
-
Use-Case: Der Dozent demonstriert die praktische Anwendung der im Theorieteil vermittelten Methoden. Dabei wird kommentierter Code und das Ergebnis besprochen.
-
Übungsaufgaben: Basierend auf dem Use-Case werden einfache Erweiterungen oder ähnliche Analysen von den Teilnehmern selbständig durchgeführt. Der Dozent steht dabei für Rückfragen und Hilfestellung zur Verfügung. Am Ende wird eine Musterlösung vorgestellt
-
Webinar-Tool: Zoom (ermöglicht Breakout Sessions zur individuellen Betreuung und Beantwortung von Fragen während Hands-on Aufgaben)
Zielgruppe / Voraussetzungen
Voraussetzungen
Verwenden Sie einen Laptop/PC mit zuverlässigem Internetzugang und installieren Sie folgende Software für
-
R Kurse: R (ab Version 3.2.0), RStudio (ab Version 1.1.X) und ausreichend Berechtigungen um R Erweiterungspakete installieren zu können (z.B. mit dem Befehl install.packages).
-
Python Kurse: Python (ab Version 3.6), ein beliebiger Python-IDE und ausreichend Berechtigungen um Python module installieren zu können (z.B. über conda install oder pip install). Wir empfehlen die Anaconda Python Distribution (enthält beides).
Webinar-Tool
Das Webinar wird mit Zoom durchgeführt, was mittels Breakout Sessions (separate virtuelle Kursräume) die Gruppenarbeit und eine individuelle Betreuung während der Hands-on Aufgaben vereinfacht. Falls das Installieren und Nutzen der Zoom-Software bei Ihnen in der Firma nicht gestattet ist, ist unter Umständen die Teilnahme am Webinar per Internetbrowser (also ohne zusätzlicher Zoom-Software) erlaubt bzw. möglich.
Kostenzusatz
450 Euro pro Kurstag zzgl. MwSt.
Inklusive: digitales Kursmaterial, Teilnehmerzertifikat, Kaffee, Getränke und Mittagessen.
Infos anfordern
Kontaktinformation Essential Data Science Training GmbH
Essential Data Science Training GmbH
Essential Data Science Training GmbH

Essential Data Science Training GmbH
Essential Data Science Training GmbH bietet individuelle Inhouse-Kurse, offene Kurse, projektbezogenes Mentoring und Coaching bzw. Projektüberprüfungen (z.B. in Form von Use-Case Workshops) im Bereich Machine Learning, Data Science und Statistik. Das Kursangebot beinhaltet dabei sowohl theoretische Kurse, die auf die...
IT-Weiterbildung leicht gemacht
Virtuelle Workshops und IT-Fachtrainings von Experten für Profis.