feature: update readme, add more output to ml-pipeline

This commit is contained in:
2026-05-28 14:39:00 +02:00
parent e397f031cc
commit 1410c6c990
2 changed files with 60 additions and 8 deletions
+2
View File
@@ -27,6 +27,7 @@ def inspect(df: pd.DataFrame) -> None:
def e1_remove_observations(df: pd.DataFrame) -> pd.DataFrame:
"""E1: Ausreisser und fehlerhafte Beobachtungen entfernen."""
df.info()
before = len(df)
df = df[df.Price < 8000000] # nur Werte bis 8000000 berücksichtigen
df = df[
@@ -134,6 +135,7 @@ def e41_construct(df: pd.DataFrame) -> pd.DataFrame:
def e42_clean_names(df: pd.DataFrame) -> pd.DataFrame:
"""E4.2: Unerlaubte Zeichen in Spaltennamen durch _ ersetzen."""
df.columns = df.columns.str.replace(r"[^a-zA-Z0-9_]", "_", regex=True)
df.info()
return df
if __name__ == "__main__":