From 17ba7e6376f63ad08cc9ed1e53e7c19a980bad9c Mon Sep 17 00:00:00 2001 From: aaron Date: Thu, 7 May 2026 16:13:10 +0200 Subject: [PATCH] chore: add campain 2 session 1 nachmittag --- SL/notizen/L1_Notizen.md | 206 +++++++++++++++++++++++++++++++++++++++ 1 file changed, 206 insertions(+) diff --git a/SL/notizen/L1_Notizen.md b/SL/notizen/L1_Notizen.md index 3fb769b..d1eb981 100644 --- a/SL/notizen/L1_Notizen.md +++ b/SL/notizen/L1_Notizen.md @@ -14,3 +14,209 @@ - **ModelOps** der Governance-Schirm über alle Modelltypen - der **Modelllebenszyklus** ist das Objekt, das alle drei managen +## Geschäftsverständnis + +- 80-85% von allen ML-Modellen schaffen es nicht über den PoC Status hinaus, warum? + - Fehler in Modellen werden nicht früh genug erkannt + - Bspw. Kreditkartenanalyse PostFinance +- Immer erst schauen welche Probleme sind überhaupt vorhanden? + - GenAI ist nid immer die optimale Lösung + - Oft reicht einfache Statistik + - ist es ein Klassifikationsproblem, Clusteringproblem oder Visualisierungsproblem? +- Was braucht ein Unternehmen? + 1. Geschäftsziele festlegen + - des eigenen Bias bewusst sein + - was will man erreichen? + - Kosten/Nutzen definieren + 2. Situationsanalyse + 3. Data-Mining Ziele festlegen + 4. Projektplan erstellen + +## Datenverständnis + +>Welche Daten haben wir? Welche benötigen wir? Sind die Daten sauber? + +1. Ausgangsdaten sammeln + - notewendige Daten beschaffen +2. Daten beschreiben + - Dokumentieren der Oberflächeneigenschaften, Datenformat, Anzahl der Datensätze +3. Daten erkunden + - Visualisierungen erstellen +4. Datenqualität Überprüfen + +## Datenaufbereitung + +>Wie organisieren wir Daten für die Modellierung + +1. Daten auswählen + - bestimmen welche Datensätze verwendet werden +2. Datenbereinigung + - Ist aufwändig und wichtig, genug Zeit investieren! +3. Daten erstellen + - Neue attribute ableiten +4. Daten integrieren + - Neue Datensätze erstellen durch eventuelles Kombinieren +5. Daten formatieren + - Bei bedarf umformatieren um bspw. mathematische Operationen durchzuführen + +## Modellentwicklung + +>Welche Modellierungstechniken sollten wir anwenden? + +1. Modellierungstechniken auswählen + - Algorithmus ausprobieren +2. Testdesign erstellen + - Trainings, Test und Validierungsdatensätze auswählen +3. Modell erstellen + - Ist je nach Modell ziemlich automatisiert + - Infrastruktur kann hier zum Problem werden +4. Bewerten des Modells + - Oft konkurieren mehrere Modelle miteinander + - Testdesign interpretieren, das ist nicht trivial + +## Modellbewertung + +>Welches Modell erfüllt die Geschäftsziele am besten? + +1. Ergebnisse auswerten + - Erfüllen die Modelle die Kriterien für den Geschäftserfolg? + - Darf das Modell für das Unternehmen freigegeben werden? +2. Überprüfungsprozess + - Ergebnisse genau anschauen! + - Gegebenenfalls Fehler korrigiern +3. Nächste Schritte Festlegen + - weitere Iterationen anfangen + - Folgeprojekte lancieren + +## Einsatz + +>Wie erhalten die Interessengruppen Zugriff auf die Ergebnisse? + +1. Bereitstellungsplan + - Plan für die Bereitstellung des Modells +2. Überwachung und Wartung + - Plan ertellen um Probleme während der Betriebsphase zu vermeiden +3. Abschlussbericht erstellen +4. Projektrückblick + +## Techstack für Unternehmen + +- Daten + - Quellsystem -> Landeplatz -> Funktionen für ML + - Landeplatz für Daten +- ML-Infrastruktur + - Python + - Git +- Kundenanwendgunen + - Datenvisualisierung +- Infrastruktur + - Entwicklung + - Test + - Integration + - Betrieb (Prod) +- Trennung zwischen Datenhaltung und ML-Infra wichtig! + +## MLOps + +- Maschinelles Lernen (ML) und Operations (Ops) +- Automatisierung, Agilität und Zusammenarbeit + +## DevOps + +- Build, Plan, Code, Deploy -> Loop +- Automatisieren, Monitoren, IaC, Microsservices +- Anti-Pattern im Bereich des ML: + - Nur ein Produktionsmodell bauen welches ein Problem "perfekt" Lösen soll + - Skalierbarer und umsichtiger Ansatz wählen + +## MLOps vs DevOps + +Todo: Refactor + +>Ein ML-System ist ein Softwaresystem, +>und Softwaresysteme funktionieren +>effizient und zuverlässig, wenn +>DevOps- und Data-Engineering-Best- +>Practices angewendet werden. + +>Eines der Hauptprobleme, die Projekte +>im Bereich des maschinellen Lernens +>behindern, ist die fehlende +>Notwendigkeit einer soliden +>Grundlage aus DevOps, +>Datenautomatisierung, +>Plattformautomatisierung und +>schließlich echter ML- +>Automatisierung. + + + | Aspekt | MLOps | DevOps | + | ------ | ----- | ------ | + | Foku | ML-Operationen und Modelle | Softwareentwicklung und IT-Betrieb | + | Zweck | Optimieren ML-Workflows, Bereitsstellung un Betrieb | Optimierung von Softwareentwicklung, Bereitstellung un Betrieb | + | Hauptkomponenten | Datenpipelines, Modellregister, Überwachung | Code-Repos, CI/CD-Pipelines, Infrastruktur | + | Datenverarbeitung | Behandelt ML-Spezifische Daten | Verwaltet Code und anwendungsbezogene Daten | + | Hauptherausvorderung | Modelldrift, Datenverzerrung, Modellerklärbarkeit | Kontinuierliche Integration, Infrastrukturmanagement | + | Kernziel | Verbesserung der Bereitstellung und Verwaltung von ML-Modellen | Beschleunigen Sie die Softwarebereitstellung und -zuverlässigkeit | + | Kernaktivität | Modelltraining, Validierung, Überwachung | | + | Zusammmenarbeit | | | + | Hauptvorteil | | | + + +## Gestaltungsprinzipien + +- Verantwortung übernehmen + - Ressourcen gut verteilen um Produktivität zu steigern +- Schutz gewährleisten + - Sicherheitskontrollen für Algorithmen und Endpunkte +- Ermöglichen von Ausfallsicherheit + - Fehlertoleranz und Wiederherstellbarkeit +- Ermöglichen von Wiederverwendbarkeit + - Modelle wiederverwenden + +## Rollenverteilung + +- Fachexperten +- Datenwissenschaftler +- Dateningenieure +- Softwareingenieure +- DevOps +- Modellrisikomanager / Auditoren +- Architekten für ML + +## Anwendungsfall für KI finden + +- Ziele der Projekte + - darf nicht abstrakt bleiben + - kontreter Anwendungsfall + - Schlechtes Beispiel: Steigerung des Gesamtumsatzes + - Gutes Beispiel: Kaufempfehlung auf Basis von Produkten die zusammen gekauft wurden + - Ziel: Bestellmenge pro Kunde um X% erhöhen + - Mittel: Empfehlungssystem (Recommendation System) + +- Kategorien von KI-Anwendungen + 1. Intelligent Prognosen und Datenanlysen zur Unterstützung verschiedener Entscheidungen + 2. Innovative Prozess- oder Serviceautomatisierung zur Kostensenkung und Produktivitätssteigerung + 3. Neue Produkte und Dienstleistungen, die einen zusätzlichen Wert generieren + 4. Einfachere oder bessere Benutzererfahrung und autonome Systeme + +### Beispiele + +- Verbesserung der Genauigkeit der Treibstoffberechnung bei Airlines um das Mitführen von zusätzlichem Treibstoff zu vermeiden +- Bis zu ~35% des Umsatzes von Amazon stammt aus KI-gestützten Empfehlungen +- Netflix schätzt den Umsatz seiner personalisierten Empfehlung auf ~1 Milliarde Dollar + +## 12 häufigste Anwendungsfälle für KI + +1. Produkteempfehlungen +2. Chatbots +3. Marketing und Inhalte +4. Kundenstimmungsanalyse +5. Absatzprognose +6. Preisoptimierung +7. Cybersicherheit +8. Betrugsvorhersage +9. Ressourcenoptimierung +10. Bedarfsprognose +11. Gesundheitspflege +12. Vorausschauende Wartung