Mohamed HANNANI, AI Engineer
PROFIL
AI Engineer mit 4+ Jahren Erfahrung im Aufbau produktiver KI- und ML-Systeme, davon die letzten zwei Jahre mit Fokus auf LLMs und Agenten. Ich entwerfe und liefere durchgängig: Integrationsmuster, Retrieval, Modellauswahl, Kosten- und Latenzoptimierung, Observability und Sicherheitsmechanismen für zuverlässigen Produktivbetrieb. Zuletzt habe ich Empfio im Alleingang aufgebaut — eine produktive KI-Agenten-Plattform für Sprache, WhatsApp, Web-Chat, Telegram und SMS mit Multi-LLM-Routing, RAG, MCP-konformer Tool-Schnittstelle und vollständiger Observability. Übernehme gerne End-to-End-Verantwortung von der Idee bis zum Rollout und arbeite gut mit Produkt-, Engineering- und nicht-technischen Teams zusammen.
BERUFSERFAHRUNG
KI/ML-Berater
Nov 2024 - Feb 2026, Siegen-Wittgenstein, Deutschland
Healthcare Manufaktur GmbH
- Aufbau und Operationalisierung von LangChain-Agenten-Pipelines mit Qdrant-Vektorspeicher in 200+ Gesundheitseinrichtungen — Dokumentenabruf, Q&A und strukturierte Extraktion — Reduktion des manuellen Aufwands um 40%.
- Definition wiederverwendbarer Muster für LLM-Integration (Prompt-Design, RAG, strukturierte Extraktion, Modell-Routing) und fundierte Modellauswahl auf Basis von Kosten-Performance-Abwägungen und Inferenzlatenz.
- Aufbau interaktiver KPI-Dashboards (D3.js, React), die nicht-technische Stakeholder befähigten, operative Kennzahlen selbst abzufragen — 60% weniger Ad-hoc-Reporting-Anfragen.
- Bereitstellung von AWS-Infrastruktur (EC2, Lambda, S3) mit Terraform und CI/CD, Orchestrierung von 50+ Docker-Containern mit Zero-Downtime-Deployments und den erforderlichen Sicherheitsvorkehrungen für eine regulierte Branche.
- Eigenständige Identifikation und Priorisierung von KI-Chancen — Bewertung des Geschäftsnutzens, Vorschlag an Stakeholder und Lieferung bis in den produktiven Einsatz.
Data Scientist & KI-Forscher
Nov 2023 - Okt 2024, Siegen, Deutschland
Universität Siegen
- Aufbau von LLM-Reasoning-Pipelines (GPT-4, Claude, LLaMA 2) für automatisierte In-Context-Maschinenübersetzung — Prompt-Engineering, Chain-of-Thought, retrieval-basierter Kontext — 25% BLEU-Verbesserung gegenüber Baseline.
- Entwurf von Evaluationsrahmen zum systematischen Vergleich von Prompts, Kontexten und Modellen — subjektive LLM-Entscheidungen wurden messbar.
ML Engineer & Data Scientist
Mär 2022 - Jul 2023, Casablanca, Marokko
Indatacore
- Leitung eines 3-köpfigen Teams beim Aufbau modularer, wiederverwendbarer ML-Inferenzdienste für 156+ Dokumenttypen — Wiederverwendbare Komponenten reduzierten den Integrationsaufwand pro neuem Format um 30%.
- Architektur RESTful API-Dienste (Flask) zur Anbindung von ML-Inferenzsystemen an nachgelagerte Geschäftsprozesse — 10.000+ monatliche Transaktionen, strukturiertes Logging, 99,2% Verfügbarkeit. Deployment auf AWS mit Docker und Kubernetes.
PROJEKTE
Empfio — Produktive KI-Agenten-Plattform (Solo)
In ~3 Monaten im Alleingang aufgebaut: eine produktive KI-Agenten-Plattform, die als KI-Empfang für Dienstleistungsunternehmen fungiert. Autonome Agenten über Sprache, WhatsApp, Web-Chat, Telegram und SMS — Erstkontakt, Intent-Klassifizierung, Terminbuchung, Kundenzahlungen (Stripe Connect), Follow-ups und Eskalation an Menschen bei Bedarf. Multi-LLM-Routing (GPT-4o, Claude, Groq, Ollama) mit Circuit-Breaker pro Organisation, MCP-konformer Tool-Registry, RAG mit Vektorabruf und Topic-gesteuerter Verhaltenskonfiguration (neue Branche = Konfiguration, kein neuer Code). Vollständige Observability via Langfuse, Prometheus und OpenTelemetry GenAI-Semconv. Aufgebaut auf FastAPI-async-Services, PostgreSQL, Redis, Celery, LiveKit, Next.js.
ECO Analyzer — Gesundheits-Intelligenz-Plattform
Aufbau einer Analytics-Plattform über die deutschen ASV-Gesundheitsdaten (Ambulante Spezialfachärztliche Versorgung) — 18.977+ Ärzte, 247 Spezialistenteams, 688 Städte. Interaktive Geo-Karte (Leaflet, PostGIS) mit Netzwerkanalyse, plus ein KI-Copilot (GPT-4), der natürlichsprachliche Anfragen auf den Datensatz erlaubt — ein wiederverwendbares Retrieval-Muster über Teams und Anwendungsfälle hinweg. 8 unabhängig deploybare Microservices (FastAPI, Node.js) über PostgreSQL + PostGIS und Redis.
AUSBILDUNG
Master in Data Science
Universität Cadi Ayyad
2020 – 2022 • Marrakesch, Marokko
Bachelor in Informatik
Universität Cadi Ayyad
2017 – 2020 • Marrakesch, Marokko
FÄHIGKEITEN
- KI-Agenten & LLMs: Multi-Agenten-Orchestrierung, Tool Calling, RAG, retrieval-basierter Wissenszugriff, Prompt-Design, Context Engineering, strukturierte Extraktion, Evaluation
- Produktive KI: Multi-LLM-Routing, Circuit-Breaker pro Provider, kostenbewusste Modellauswahl, Token-Optimierung, fail-closed Sicherheitsvorkehrungen
- Backend: Python (Expert), FastAPI, async-Muster, RESTful & event-getriebene APIs, verteilte Systeme, SQLAlchemy
- Cloud & Infra: AWS (EC2, S3, Lambda), Docker, Kubernetes, Terraform, CI/CD (GitHub Actions)
- Daten & Retrieval: PostgreSQL, Qdrant, ChromaDB, Redis, Elasticsearch, Pandas
- Observability: Langfuse, Prometheus, OpenTelemetry GenAI-Semconv, Evaluationsrahmen
- Frontend: Next.js, React, TypeScript, D3.js — Operator-Dashboards und internes Tooling
- Bereichsübergreifend: Zusammenarbeit mit Produkt-, Engineering-, Security- und nicht-technischen Stakeholdern end-to-end