Data Mining im Umfeld Technischer Prozesse

- Wege zur Industriellen Künstlichen Intelligenz -

Vorlesung mit vollständig ausgeführten Programmierbeispielen in Python und Fokus auf der praktischen Anwendung von Methoden. 


Die nächste Vorlesung findet als Blockveranstaltung im Sommersemester 2024 an der RWTH Aachen statt. Alle Termin liegen jeweils Donnerstags und Freitags im Juli. 

Data Mining for Industrial Processes

- The Path towards Industrial Artificial Intelligence -

Lectures with complete Live-Programming sessions in Python, focussing on the practical application of methods. 


The next lecture series starts in the summer semester 2024 at the RWTH Aachen, Thursdays and Fridays throughout Juli.

Vorlesungsplan

For English lecture plan, please scroll down...

04.07.2024, 10 Uhr
"Daten" + "Vorverarbeitung und Explorative Analyse"

  • Einführung in das Arbeiten mit Daten
  • Daten und Modelle
  • Geschichtlicher Rückblick 
  • Einheite und Skalen
  • Besonderheiten von Daten im Bezug auf technische Prozesse
  • Grundlagen der Statistik und Stochastik
  • Einführung und erste Programmierbeispiele in Python
  • Kausalität vs. Korrelation
  • Mathematische Transformationen: Fourier, Wavelets und Histogramme
  • Falten und Filtern
  • Merkmalsextraktions mit Fokus auf Domain Knowledge

05.07.2024, 10 Uhr
"Lernen - Teil 1"

  • Was ist Lernen?, Theorie des Lernens von Piaget
  • Unterscheidung verschiedener Arten des Lernens und Übertragung auf den Computer
  • Spielen als Lernvorgang    
  • Evolutionäre Algorithmen
  • Maschinelles Lernen und Einordnung des Begriffs im Kontext von künstlicher Intelligenz
  • Unüberwachtes vs. Überwachtes vs. Verstärkendes Lernen
  • Klassifikation vs. Regression
  • Neuronale Netze und ihre Grundlagen
  • Entscheidungsbäume mit Information Gain und Gini Koeffizient
  • K-Means und Agglomeratives Lernen
  • Autoencoder

05.07.2024, 10 Uhr
"Lernen - Teil 2"

  • Gates und Long-Shortterm-Memory (LSTM)Mixture-Density Netzwerke
  • Variational Autoencoder
  • t-SNE und UMAP
  • Self-Organising Map
  • Multi-Agenten Systeme, Digitale Konditionierung, Bestärkung
  • Lernen von Strategie und Lösung
  • Generative Transformer, GPT
  • Deep Learning und Shallow Learning
  • Bilderkennung mittels OpenCV und Klassifkationsnetzen
  • Image Mining

12.07.2024, 10 Uhr
"Von Big Data, Smart Date und Agenten bis hin zur ersten künstlichen Intelligenz"

  • Was ist Big Data? 
  • Moderne Datenbankarchitekturen und Warehouse-Strategien
  • Arbeiten mit Datenbanken in Python
  • Implementation der Lernverfahrverfahren auf Datenbanken
  • SQL vs. NoSQL, Apache Parquet und Python Pickle
  • Lambda-Architektur zur Integration von Data Mining im Streaming
  • MQTT und Kafka
  • Sensor Mining und Sensor Fusion
  • Was ist künstliche Intelligenz? 
  • Exkurs in die Philosophie: Erkenntnis, Objekte, Instanzen und Realität
  • Digitale Zwillinge und Cyber-Physische Systeme
  • Anwendungen von digitalen Zwillingen in der Industrie
  • Der lernende Rasenmäherroboter

18.07.2024, 10 Uhr
"Physikalisch-Informiertes Data Mining mittels KI"

  • Data Mining mittels physics-informed machine learning: Netze, Entscheidungsbäume mit Zugriff auf Expertenwissen
  • Stochastisches Lernen
  • Störungstheorie und Sensitivitätsanalyse 
  • Prozesskorridore
  • Taxonomie und Ontologien
  • Erklärbarkeit und Vertrauen
  • Lernen auf extrem kleinen Datensätzen
  • Denkprozesse in Maschinen
  • Anwendungen in der Cybersecurity
  • Daten in der Blockchain
  • Zukünftige Veränderung des industriellen Umfelds durch KI 
  • Ethische Aspekte moderner Algorithmen und Auswirkung auf die Gesellschaft

Live-Programming - Theorie - Anwendung

Die Vorlesung kombiniert Vortrag und Live-Programming. Dabei wird, beginnend in einem leeren Codefile die Anwendung eines Verfahrens direkt am Beispiel diskutiert. Auf Wunsch können Studenten während der Live-Programming Abschnitte den Code direkt auf ihrem Rechner als Übung mit entwickeln und direkt ausführen. 

Alle gezeigten Codebeispiele werden den Studenten als Sammlung zur Verfügung gestellt.

Die Inhalte des Machine Learning Teils der Vorlesung stehen als Buch zur Verfügung, welches auch über die RWTH Bibliothek ausleihbar sein wird.

Plan of the lectures

04.07.2024, 10 Uhr
"Data" + "Preparation and Exploratory Analysis

  • Introduction to data and its history
  • Data and models, black-box, grey-box, white-box concepts
  • Units and scales
  • Special aspects of industrial data
  • Introduction to Statistics and Stochastics
  • Introduction to Python; explains the language, so that live-programming can be followed well
  • Causality vs. Correlation
  • Mathematical transformations of interest for data mining: Fourier, Wavelets, Laplace
  • Convolution
  • Feature extraction with focus on domain knowledge

05.07.2024, 10 Uhr
"Learning - Part 1"

  • What is learning? Review of works from Piaget
  • Comparison of different forms of human learning
  • Games as learning strategy
  • Evolutionary algorithms
  • Machine learning
  • Supervised / Unsupervised / Reinforcement paradigms
  • Classification vs. Regression
  • Neural Networks, including full introduction of theory
  • Decision trees and random forests, Entropy and Gini approaches
  • K-Means and Agglomerative Learning
  • Autoencoder

05.07.2024, 10 Uhr
"Learning - Part 2"

  • Gates and Long-Shortterm-Memory (LSTM)Mixture-Density Nets
  • Variational Autoencoder
  • t-SNE and UMAP
  • Self-Organising Map
  • Multi-Agent Systems and Autonomous Agents
  • Learning of strategies and rules
  • Generative Transformer, GPT
  • Deep Learning vs. Shallow Learning
  • Image detection and object detection via OpenCV and classification nets
  • Image mining

12.07.2024, 10 Uhr
"From Big Data, Smart Data and Agents towards a first, simplistic artificial intelligence "

  • What is Big Data? Definition and examples 
  • Modern database architectures and warehouse strategies
  • SQL vs. NoSQL
  • Working with databases in Python: CouchDB and MongoDB
  • Implementing Data Mining on those database architectures
  • Lambda-Architecture according to N. Marz
  • MQTT and Kafka
  • Sensor Mining and Sensor Fusion
  • What is artificial intelligence?
  • Excourse to philosophy: Ideas, Objects, Instances and Reality
  • Digital Twins and Cyber-Physical Systems
  • Applications of digital twins in industry
  • The smart lawn-mower robot

18.07.2024, 10 Uhr
"Physics-Informed Data Mining using AI"

  • Data Mining applying physics-informed machine learning: Neural Networks, Decision Trees and Expert Knowledge
  • Neural Networks that learn from equations not from data
  • Learning on extremely small sets of data
  • Stochastic Learning
  • Perturbation theory for probing data mining models; sensitivity analysis
  • Process corridors: Using conditional probabilities and Bayes for steering the industrial process
  • Taxonomies, Ontologies and Micro-ontologies
  • Explainability and Trust in Algorithms
  • Thinking processes of machines
  • Applications of Data Mining in Cyber-Security
  • Data in Blockchains
  • Impact of AI on Industrial Processes
  • Ethical aspects of AI, ML and Data Mining on Society

Live-Programming - Theory - Application


The lecture combines direct presentation via slides and live-programming. The latter typically begins with an empty file of code and shows the students how to fully code a minimum example of a given procedure using a clear example. At wish, students can also code in parallel on their own computers and observe the results. 

All  lecture slides and code examples will be available for the students.