chore: add campain 2 session 1 nachmittag

2026-05-07 16:13:10 +02:00
parent b490d11a80
commit 17ba7e6376
1 changed files with 206 additions and 0 deletions
@@ -14,3 +14,209 @@
    - **ModelOps** der Governance-Schirm über alle Modelltypen
    - der **Modelllebenszyklus** ist das Objekt, das alle drei managen

+## Geschäftsverständnis
+
+- 80-85% von allen ML-Modellen schaffen es nicht über den PoC Status hinaus, warum?
+    - Fehler in Modellen werden nicht früh genug erkannt
+    - Bspw. Kreditkartenanalyse PostFinance
+- Immer erst schauen welche Probleme sind überhaupt vorhanden?
+    - GenAI ist nid immer die optimale Lösung
+    - Oft reicht einfache Statistik
+        - ist es ein Klassifikationsproblem, Clusteringproblem oder Visualisierungsproblem?
+- Was braucht ein Unternehmen?
+    1. Geschäftsziele festlegen
+        - des eigenen Bias bewusst sein
+        - was will man erreichen?
+        - Kosten/Nutzen definieren
+    2. Situationsanalyse
+    3. Data-Mining Ziele festlegen
+    4. Projektplan erstellen
+
+## Datenverständnis
+
+>Welche Daten haben wir? Welche benötigen wir? Sind die Daten sauber?
+
+1. Ausgangsdaten sammeln
+    - notewendige Daten beschaffen
+2. Daten beschreiben
+    - Dokumentieren der Oberflächeneigenschaften, Datenformat, Anzahl der Datensätze
+3. Daten erkunden
+    - Visualisierungen erstellen
+4. Datenqualität Überprüfen
+
+## Datenaufbereitung
+
+>Wie organisieren wir Daten für die Modellierung
+
+1. Daten auswählen
+    - bestimmen welche Datensätze verwendet werden
+2. Datenbereinigung
+    - Ist aufwändig und wichtig, genug Zeit investieren!
+3. Daten erstellen
+    - Neue attribute ableiten
+4. Daten integrieren
+    - Neue Datensätze erstellen durch eventuelles Kombinieren
+5. Daten formatieren
+    - Bei bedarf umformatieren um bspw. mathematische Operationen durchzuführen
+
+## Modellentwicklung
+
+>Welche Modellierungstechniken sollten wir anwenden?
+
+1. Modellierungstechniken auswählen
+    - Algorithmus ausprobieren
+2. Testdesign erstellen
+    - Trainings, Test und Validierungsdatensätze auswählen 
+3. Modell erstellen
+    - Ist je nach Modell ziemlich automatisiert
+    - Infrastruktur kann hier zum Problem werden
+4. Bewerten des Modells
+    - Oft konkurieren mehrere Modelle miteinander
+    - Testdesign interpretieren, das ist nicht trivial
+
+## Modellbewertung
+
+>Welches Modell erfüllt die Geschäftsziele am besten?
+
+1. Ergebnisse auswerten
+    - Erfüllen die Modelle die Kriterien für den Geschäftserfolg?
+    - Darf das Modell für das Unternehmen freigegeben werden?
+2. Überprüfungsprozess
+    - Ergebnisse genau anschauen!
+    - Gegebenenfalls Fehler korrigiern
+3. Nächste Schritte Festlegen
+    - weitere Iterationen anfangen
+    - Folgeprojekte lancieren
+
+## Einsatz
+
+>Wie erhalten die Interessengruppen Zugriff auf die Ergebnisse?
+
+1. Bereitstellungsplan
+    - Plan für die Bereitstellung des Modells
+2. Überwachung und Wartung
+    - Plan ertellen um Probleme während der Betriebsphase zu vermeiden
+3. Abschlussbericht erstellen
+4. Projektrückblick
+
+## Techstack für Unternehmen
+
+- Daten
+    - Quellsystem -> Landeplatz -> Funktionen für ML
+    - Landeplatz für Daten
+- ML-Infrastruktur
+    - Python
+    - Git
+- Kundenanwendgunen
+    - Datenvisualisierung
+- Infrastruktur
+    - Entwicklung
+    - Test
+    - Integration
+    - Betrieb (Prod)
+- Trennung zwischen Datenhaltung und ML-Infra wichtig! 
+
+## MLOps
+
+- Maschinelles Lernen (ML) und Operations (Ops)
+- Automatisierung, Agilität und Zusammenarbeit
+
+## DevOps
+
+- Build, Plan, Code, Deploy -> Loop
+- Automatisieren, Monitoren, IaC, Microsservices
+- Anti-Pattern im Bereich des ML: 
+    - Nur ein Produktionsmodell bauen welches ein Problem "perfekt" Lösen soll
+    - Skalierbarer und umsichtiger Ansatz wählen
+
+## MLOps vs DevOps
+
+Todo: Refactor
+
+>Ein ML-System ist ein Softwaresystem,
+>und Softwaresysteme funktionieren
+>effizient und zuverlässig, wenn
+>DevOps- und Data-Engineering-Best-
+>Practices angewendet werden.
+
+>Eines der Hauptprobleme, die Projekte
+>im Bereich des maschinellen Lernens
+>behindern, ist die fehlende
+>Notwendigkeit einer soliden
+>Grundlage aus DevOps,
+>Datenautomatisierung,
+>Plattformautomatisierung und
+>schließlich echter ML-
+>Automatisierung.
+
+
+ | Aspekt | MLOps | DevOps |
+ | ------ | ----- | ------ |
+ | Foku   | ML-Operationen und Modelle | Softwareentwicklung und IT-Betrieb |
+ | Zweck  | Optimieren ML-Workflows, Bereitsstellung un Betrieb | Optimierung von Softwareentwicklung, Bereitstellung un Betrieb |
+ | Hauptkomponenten       | Datenpipelines, Modellregister, Überwachung | Code-Repos, CI/CD-Pipelines, Infrastruktur |
+ | Datenverarbeitung      | Behandelt ML-Spezifische Daten  |  Verwaltet Code und anwendungsbezogene Daten  |
+ | Hauptherausvorderung       | Modelldrift, Datenverzerrung, Modellerklärbarkeit      | Kontinuierliche Integration, Infrastrukturmanagement |
+ | Kernziel       | Verbesserung der Bereitstellung und Verwaltung von ML-Modellen  | Beschleunigen Sie die Softwarebereitstellung und -zuverlässigkeit |
+ | Kernaktivität       | Modelltraining, Validierung, Überwachung |        |
+ | Zusammmenarbeit       |       |        |
+ | Hauptvorteil       |       |        |
+
+
+## Gestaltungsprinzipien
+
+- Verantwortung übernehmen
+    - Ressourcen gut verteilen um Produktivität zu steigern
+- Schutz gewährleisten
+    - Sicherheitskontrollen für Algorithmen und Endpunkte
+- Ermöglichen von Ausfallsicherheit
+    - Fehlertoleranz und Wiederherstellbarkeit
+- Ermöglichen von Wiederverwendbarkeit
+    - Modelle wiederverwenden
+
+## Rollenverteilung
+
+- Fachexperten
+- Datenwissenschaftler
+- Dateningenieure
+- Softwareingenieure
+- DevOps
+- Modellrisikomanager / Auditoren
+- Architekten für ML
+
+## Anwendungsfall für KI finden
+
+- Ziele der Projekte
+    - darf nicht abstrakt bleiben
+    - kontreter Anwendungsfall
+    - Schlechtes Beispiel: Steigerung des Gesamtumsatzes
+    - Gutes Beispiel: Kaufempfehlung auf Basis von Produkten die zusammen gekauft wurden
+        - Ziel: Bestellmenge pro Kunde um X% erhöhen
+        - Mittel: Empfehlungssystem (Recommendation System)
+
+- Kategorien von KI-Anwendungen
+    1. Intelligent Prognosen und Datenanlysen zur Unterstützung verschiedener Entscheidungen
+    2. Innovative Prozess- oder Serviceautomatisierung zur Kostensenkung und Produktivitätssteigerung
+    3. Neue Produkte und Dienstleistungen, die einen zusätzlichen Wert generieren
+    4. Einfachere oder bessere Benutzererfahrung und autonome Systeme
+
+### Beispiele
+
+- Verbesserung der Genauigkeit der Treibstoffberechnung bei Airlines um das Mitführen von zusätzlichem Treibstoff zu vermeiden
+- Bis zu ~35% des Umsatzes von Amazon stammt aus KI-gestützten Empfehlungen
+- Netflix schätzt den Umsatz seiner personalisierten Empfehlung auf ~1 Milliarde Dollar
+
+## 12 häufigste Anwendungsfälle für KI
+
+1. Produkteempfehlungen
+2. Chatbots
+3. Marketing und Inhalte
+4. Kundenstimmungsanalyse
+5. Absatzprognose
+6. Preisoptimierung
+7. Cybersicherheit
+8. Betrugsvorhersage
+9. Ressourcenoptimierung
+10. Bedarfsprognose
+11. Gesundheitspflege
+12. Vorausschauende Wartung