cas-pml/SL/notizen/L1_Notizen.md

# Notizen SL Lektion 1

>Thema: Einführung Überwachtes Lernen
>Datum: 07.05.2026
>Dozentin: Violeta Vogel

## Kurzpräsentationen

>Thema: MLOps, ModelOps, Modelllebenszyklus, ML-Engineering

- Hierarchie:
    - **ML-Engineering** ist die Bauarbeit
    - **MLOps** die Betriebsdisziplin für ML
    - **ModelOps** der Governance-Schirm über alle Modelltypen
    - der **Modelllebenszyklus** ist das Objekt, das alle drei managen

## Geschäftsverständnis

- 80-85% von allen ML-Modellen schaffen es nicht über den PoC Status hinaus, warum?
    - Fehler in Modellen werden nicht früh genug erkannt
    - Bspw. Kreditkartenanalyse PostFinance
- Immer erst schauen welche Probleme sind überhaupt vorhanden?
    - GenAI ist nid immer die optimale Lösung
    - Oft reicht einfache Statistik
        - ist es ein Klassifikationsproblem, Clusteringproblem oder Visualisierungsproblem?
- Was braucht ein Unternehmen?
    1. Geschäftsziele festlegen
        - des eigenen Bias bewusst sein
        - was will man erreichen?
        - Kosten/Nutzen definieren
    2. Situationsanalyse
    3. Data-Mining Ziele festlegen
    4. Projektplan erstellen

## Datenverständnis

>Welche Daten haben wir? Welche benötigen wir? Sind die Daten sauber?

1. Ausgangsdaten sammeln
    - notewendige Daten beschaffen
2. Daten beschreiben
    - Dokumentieren der Oberflächeneigenschaften, Datenformat, Anzahl der Datensätze
3. Daten erkunden
    - Visualisierungen erstellen
4. Datenqualität Überprüfen

## Datenaufbereitung

>Wie organisieren wir Daten für die Modellierung

1. Daten auswählen
    - bestimmen welche Datensätze verwendet werden
2. Datenbereinigung
    - Ist aufwändig und wichtig, genug Zeit investieren!
3. Daten erstellen
    - Neue attribute ableiten
4. Daten integrieren
    - Neue Datensätze erstellen durch eventuelles Kombinieren
5. Daten formatieren
    - Bei bedarf umformatieren um bspw. mathematische Operationen durchzuführen

## Modellentwicklung

>Welche Modellierungstechniken sollten wir anwenden?

1. Modellierungstechniken auswählen
    - Algorithmus ausprobieren
2. Testdesign erstellen
    - Trainings, Test und Validierungsdatensätze auswählen
3. Modell erstellen
    - Ist je nach Modell ziemlich automatisiert
    - Infrastruktur kann hier zum Problem werden
4. Bewerten des Modells
    - Oft konkurieren mehrere Modelle miteinander
    - Testdesign interpretieren, das ist nicht trivial

## Modellbewertung

>Welches Modell erfüllt die Geschäftsziele am besten?

1. Ergebnisse auswerten
    - Erfüllen die Modelle die Kriterien für den Geschäftserfolg?
    - Darf das Modell für das Unternehmen freigegeben werden?
2. Überprüfungsprozess
    - Ergebnisse genau anschauen!
    - Gegebenenfalls Fehler korrigiern
3. Nächste Schritte Festlegen
    - weitere Iterationen anfangen
    - Folgeprojekte lancieren

## Einsatz

>Wie erhalten die Interessengruppen Zugriff auf die Ergebnisse?

1. Bereitstellungsplan
    - Plan für die Bereitstellung des Modells
2. Überwachung und Wartung
    - Plan ertellen um Probleme während der Betriebsphase zu vermeiden
3. Abschlussbericht erstellen
4. Projektrückblick

## Techstack für Unternehmen

- Daten
    - Quellsystem -> Landeplatz -> Funktionen für ML
    - Landeplatz für Daten
- ML-Infrastruktur
    - Python
    - Git
- Kundenanwendgunen
    - Datenvisualisierung
- Infrastruktur
    - Entwicklung
    - Test
    - Integration
    - Betrieb (Prod)
- Trennung zwischen Datenhaltung und ML-Infra wichtig!

## MLOps

- Maschinelles Lernen (ML) und Operations (Ops)
- Automatisierung, Agilität und Zusammenarbeit

## DevOps

- Build, Plan, Code, Deploy -> Loop
- Automatisieren, Monitoren, IaC, Microsservices
- Anti-Pattern im Bereich des ML:
    - Nur ein Produktionsmodell bauen welches ein Problem "perfekt" Lösen soll
    - Skalierbarer und umsichtiger Ansatz wählen

## MLOps vs DevOps

Todo: Refactor

>Ein ML-System ist ein Softwaresystem,
>und Softwaresysteme funktionieren
>effizient und zuverlässig, wenn
>DevOps- und Data-Engineering-Best-
>Practices angewendet werden.

>Eines der Hauptprobleme, die Projekte
>im Bereich des maschinellen Lernens
>behindern, ist die fehlende
>Notwendigkeit einer soliden
>Grundlage aus DevOps,
>Datenautomatisierung,
>Plattformautomatisierung und
>schließlich echter ML-
>Automatisierung.


 | Aspekt | MLOps | DevOps |
 | ------ | ----- | ------ |
 | Foku   | ML-Operationen und Modelle | Softwareentwicklung und IT-Betrieb |
 | Zweck  | Optimieren ML-Workflows, Bereitsstellung un Betrieb | Optimierung von Softwareentwicklung, Bereitstellung un Betrieb |
 | Hauptkomponenten       | Datenpipelines, Modellregister, Überwachung | Code-Repos, CI/CD-Pipelines, Infrastruktur |
 | Datenverarbeitung      | Behandelt ML-Spezifische Daten  |  Verwaltet Code und anwendungsbezogene Daten  |
 | Hauptherausvorderung       | Modelldrift, Datenverzerrung, Modellerklärbarkeit      | Kontinuierliche Integration, Infrastrukturmanagement |
 | Kernziel       | Verbesserung der Bereitstellung und Verwaltung von ML-Modellen  | Beschleunigen Sie die Softwarebereitstellung und -zuverlässigkeit |
 | Kernaktivität       | Modelltraining, Validierung, Überwachung |        |
 | Zusammmenarbeit       |       |        |
 | Hauptvorteil       |       |        |


## Gestaltungsprinzipien

- Verantwortung übernehmen
    - Ressourcen gut verteilen um Produktivität zu steigern
- Schutz gewährleisten
    - Sicherheitskontrollen für Algorithmen und Endpunkte
- Ermöglichen von Ausfallsicherheit
    - Fehlertoleranz und Wiederherstellbarkeit
- Ermöglichen von Wiederverwendbarkeit
    - Modelle wiederverwenden

## Rollenverteilung

- Fachexperten
- Datenwissenschaftler
- Dateningenieure
- Softwareingenieure
- DevOps
- Modellrisikomanager / Auditoren
- Architekten für ML

## Anwendungsfall für KI finden

- Ziele der Projekte
    - darf nicht abstrakt bleiben
    - kontreter Anwendungsfall
    - Schlechtes Beispiel: Steigerung des Gesamtumsatzes
    - Gutes Beispiel: Kaufempfehlung auf Basis von Produkten die zusammen gekauft wurden
        - Ziel: Bestellmenge pro Kunde um X% erhöhen
        - Mittel: Empfehlungssystem (Recommendation System)

- Kategorien von KI-Anwendungen
    1. Intelligent Prognosen und Datenanlysen zur Unterstützung verschiedener Entscheidungen
    2. Innovative Prozess- oder Serviceautomatisierung zur Kostensenkung und Produktivitätssteigerung
    3. Neue Produkte und Dienstleistungen, die einen zusätzlichen Wert generieren
    4. Einfachere oder bessere Benutzererfahrung und autonome Systeme

### Beispiele

- Verbesserung der Genauigkeit der Treibstoffberechnung bei Airlines um das Mitführen von zusätzlichem Treibstoff zu vermeiden
- Bis zu ~35% des Umsatzes von Amazon stammt aus KI-gestützten Empfehlungen
- Netflix schätzt den Umsatz seiner personalisierten Empfehlung auf ~1 Milliarde Dollar

## 12 häufigste Anwendungsfälle für KI

1. Produkteempfehlungen
2. Chatbots
3. Marketing und Inhalte
4. Kundenstimmungsanalyse
5. Absatzprognose
6. Preisoptimierung
7. Cybersicherheit
8. Betrugsvorhersage
9. Ressourcenoptimierung
10. Bedarfsprognose
11. Gesundheitspflege
12. Vorausschauende Wartung