Data Analyst at HÄRTHA GROUP GmbH (2024-10 – Present)
- Teilprojektleitung eines kNN-basierten KI-Systems in Kooperation mit dem Fraunhofer IPA an 13 Standorten in DE, NL und IT, wodurch die Auftragserstellung von bis zu 4 Tagen auf unter 20 Minuten reduziert wurde
- Aufbau einer globalen Data-Governance-Strategie nach DAMA DMBOK mit Power BI Quality Monitoring für 13 internationale Standorte
- ERP-Datenharmonisierung (AMS) über 7 deutsche Standorte – Reduktion von Fehlerquoten in Ofen- und Lieferprozessen
Data Analyst at Deutsche Telekom AG (2022-03 – 2024-09)
- Entwicklung von Power BI Dashboards für rund 20 Führungskräfte auf VP & C-Level zur datenbasierten Steuerung von Community-KPIs und Produktentscheidungen
- Analyse der Telekom Ideenschmiede mit rund 18.800 Teilnehmern und 410 Projekten zur Identifikation von Kundenwünschen als Grundlage für Produktentscheidungen
- Harmonisierung von Daten aus MS SQL Server, der Innosabi-Plattform und Excel zu einer einheitlichen KPI-Datenbasis für das Power BI Reporting
Intern Digital Innovation at Detecon International GmbH (2021-02 – 2022-02)
- Konzeption und Prototypenentwicklung industrieller XR-Setups für After-Sales-Forecasting im Automotive-Umfeld für VW und Cariad
- Mitarbeit am Aufbau eines 5G-Campus-Netzes für den Hamburger Hafen sowie Entwicklung von 3D-Scan-Prototypen für Facility-Management-Anwendungen
Data Scientist at Rath Capital AG (2024)
- Entwicklung und produktiver Einsatz eines Python-basierten Mietpreisvorhersagemodells (RandomForestRegressor) zur automatisierten Preisschätzung bei der Exposé-Erstellung – mittlere Vorhersageabweichung von 22 Euro (MAE)
- Feature Engineering und Preprocessing über 28 Merkmale auf Basis von rund 4.000 realen sowie 1.500 synthetisch generierten Datensätzen mit Pandas, NumPy und scikit-learn
Data Scientist at SAEGER & CIE. Zinshaus Investments GmbH (2023)
- Entwicklung und produktiver Einsatz eines Python-basierten Empfehlungssystems für rund 10.000 Filme auf Basis von TF-IDF Vektorisierung und Cosine Similarity – Ausgabe der Top-N ähnlichsten Filme per Titeleingabe
- Feature Engineering auf Basis von 15-20 Merkmalen (Genre, Keywords, Cast, Director, Beschreibung) sowie Vektorisierung unstrukturierter Textdaten mit TF-IDF und Datenbereinigung mit Pandas
- Qualitative Validierung der Empfehlungen durch plausibilitätsbasierte Testabfragen sowie iterative Optimierung der TF-IDF Feature-Gewichtung zur Reduktion von Fehlmatches
Data Scientist at Webedia GmbH (2021)
- Entwicklung und produktiver Einsatz eines Python-basierten Empfehlungssystems für rund 10.000 Filme auf Basis von TF-IDF Vektorisierung und Cosine Similarity – Ausgabe der Top-N ähnlichsten Filme per Titeleingabe
- Feature Engineering auf Basis von 15-20 Merkmalen (Genre, Keywords, Cast, Director, Beschreibung) sowie Vektorisierung unstrukturierter Textdaten mit TF-IDF und Datenbereinigung mit Pandas
- Qualitative Validierung der Empfehlungen durch plausibilitätsbasierte Testabfragen sowie iterative Optimierung der TF-IDF Feature-Gewichtung zur Reduktion von Fehlmatches
Consultant / Data Strategy & Quality Engineering at Rath Capital AG (2024)
- Konzeption einer Data-Governance- und Datenqualitäts-Roadmap zur Weiterentwicklung der Datenreife eines Finanzdienstleisters als externer Consultant
- Analyse und Aufbereitung heterogener Datenquellen mit SQL und Python sowie Entwicklung automatisierter Pipelines zur Datenbereinigung und Qualitätssicherung
- Weiterentwicklung der Datenarchitektur zur Etablierung einer Single Source of Truth für C-Level-Reporting
- Erhebung und Konsolidierung fachlicher Anforderungen mit Stakeholdern aus Fachbereichen und IT sowie Überführung in skalierbare technische Lösungen und Data-Maturity-Roadmap nach DAMA DMBOK und DCAM
- Konzeption einer Lakehouse-Architektur (AWS) inkl. Datenlineage-Strategie mit OpenLineage zur Schaffung transparenter Datenflüsse