🇬🇧

Mohamed HANNANI, LLM Engineer

PROFIL

AI Engineer mit 4+ Jahren Erfahrung im Aufbau produktionsreifer Systeme — von RAG-Pipelines und LLM-Agenten bis hin zu Echtzeit-Voice-KI. Eigenständige Entwicklung einer Multi-Service-SaaS (FastAPI, LangGraph, PostgreSQL, Next.js) für Live-Kundenkommunikation über 5 Kanäle. Stark in Python, asynchronen Architekturen und der Umsetzung von KI-Prototypen bis zur Produktion.

BERUFSERFAHRUNG

AI/ML Consultant

Nov 2024 - Feb 2026, Siegen-Wittgenstein, Deutschland

Healthcare Manufaktur GmbH

  • Entwicklung und Bereitstellung von produktionsreifen RAG-Pipelines mit LangChain, Qdrant-Vektordatenbank und Claude/OpenAI-APIs für das Abrufen von Gesundheitsdokumenten und intelligente Frage-Antwort-Systeme, Verbesserung der Effizienz des Informationszugriffs um 40%.
  • Entwicklung eines Healthcare-Chatbots mit Elasticsearch-gestütztem Retrieval, Sentence-Transformers-Embeddings und kontextbewusster Generierung, Verarbeitung von 1000+ täglichen Benutzeranfragen mit 95% Benutzerzufriedenheit.
  • Aufbau automatisierter Web-Scraping-Pipelines mit Playwright und BeautifulSoup4 für Datenextraktion und Vektordatenbank-Ingestion, Reduzierung der manuellen Dateneingabe um 85%.
  • Entwicklung von Geospatial-Mapping-Anwendungen mit Leaflet, Deck.gl und PostGIS zur Visualisierung von Krankenhausnetzwerken und pharmazeutischer Gebietsanalyse über 200+ Gesundheitseinrichtungen.
  • Gestaltung interaktiver Dashboards mit D3.js, React Flow und benutzerdefinierten Komponenten für Echtzeit-Gesundheits-KPI-Überwachung und Executive-Entscheidungsunterstützung.
  • Verwaltung der AWS EC2-Infrastruktur mit Orchestrierung von 50+ Docker-Containern mit CI/CD-Pipelines, Health-Monitoring und Zero-Downtime-Deployments.
RAGLangChainQdrantClaude APIElasticsearchVector DatabasesD3.jsReact FlowAWS EC2DockerFastAPI

Data Scientist & KI-Forscher

Nov 2023 - Okt 2024, Siegen, Deutschland

Universität Siegen

  • Entwicklung von In-Context-Machine-Translation-Systemen mit LLMs (GPT-4, Claude Opus, LLaMA 2) für generische Text- und Untertitelübersetzung, Erzielung einer 25%igen BLEU-Score-Verbesserung gegenüber Baseline-Transformer-Modellen.
LLMsMachine TranslationBERTFine-tuningLangChainPrompt EngineeringSentiment AnalysisFastAPI

ML Engineer & Data Scientist

Mär 2022 - Juli 2023, Casablanca, Marokko

Indatacore

  • Leitung eines 3-köpfigen ML-Teams zur Bereitstellung modernster OCR- und Informationsextraktionsmodelle für die Sky Onboarding™-Plattform, Reduzierung der Dokumentenverarbeitungszeit um 30% und Verbesserung der Genauigkeit um 15% über 156+ Dokumenttypen.
  • Bereitstellung skalierbarer ML-Modelle für Sky ID™-Identitätsverifizierung mit Docker und Kubernetes auf AWS, Implementierung eines A/B-Testing-Frameworks zur Optimierung der Modellleistung und Erzielung von 99,2% Uptime.
  • Entwicklung eines Signaturerkennungs- und Extraktionssystems für Sky Signature™ mit Object-Detection-Modellen (YOLO, Faster R-CNN), Verarbeitung von Bankschecks und Verträgen mit 97% Präzision über 62+ Scheckformate.
  • Aufbau einer Produktions-OCR-Pipeline mit Flask-API und Tesseract/PaddleOCR-Integration für Bankscheck-Validierung, Erzielung von 95% Genauigkeit und Eliminierung der manuellen Verifizierung für 10.000+ monatliche Transaktionen.
  • Entwicklung eines automatisierten Informationsextraktionssystems mit Transformer-Modellen und benutzerdefinierten NER-Pipelines für Rechnungsverarbeitung, Erzielung von 98% Genauigkeit und Verbesserung der Datenverarbeitungseffizienz um 70%.
MLOpsAWSDockerKubernetesPyTorchTensorFlowTransformersOCRFlaskFastAPIETLData PipelineA/B Testing

PROJEKTE

Empfio — KI-gestützte Terminbuchungs-SaaS

Produktive KI-SaaS für automatisierte Kundenkommunikation und Terminbuchung rund um die Uhr über WhatsApp, SMS, Web-Chat und Voice — eigenständig von Null bis zum Launch entwickelt. Architektur mit 6 vernetzten Services: FastAPI-Backend (15+ DDD-Domains, async PostgreSQL, Redis, Celery), LangGraph-KI-Agent mit Multi-LLM-Unterstützung (GPT-4o, Claude), Echtzeit-Voice-Pipeline mit ~500ms Antwortzeit, Next.js 14 Dashboard (8 Sprachen) und Stripe-Billing mit API-gesteuerter Feature-Registry.

PythonFastAPILangGraphPostgreSQLRedisDockerNext.jsTypeScriptPydanticStripeEchtzeit-Voice-KIMulti-LLM

ECO Analyzer – KI-gestützte Healthcare-Analytics-Plattform

Konzeption und Entwicklung einer skalierbaren Healthcare-Analytics-Plattform zur Analyse deutscher ASV-Daten (Ambulante spezialfachärztliche Versorgung). Aufbau einer modularen Microservices-Architektur mit FastAPI, Node.js, PostgreSQL + PostGIS und Redis zur Analyse von 18.000+ Ärzten und 200+ ASV-Teams deutschlandweit. Implementierung von geospatialer Datenanalyse, Netzwerk- und Kollaborationsvisualisierung sowie KI-gestützten Insights (GPT-4 / Claude) über interaktive Dashboards mit Next.js, D3.js und Leaflet. Fokus auf Performance, Sicherheit und Skalierbarkeit in einem regulierten Healthcare-Umfeld.

Healthcare AnalyticsMicroservicesFastAPINode.jsPostgreSQLPostGISNext.jsKI-IntegrationGeodatenanalyseEnterprise Architektur

Deutsch Tutor - KI-gestützter WhatsApp Vokabeltrainer

Entwicklung eines KI-basierten WhatsApp-Lernsystems zur strukturierten Wortanalyse mittels Wortzerlegung (Präfix, Stamm, Suffix). Implementierung eines asynchronen FastAPI-Backends mit PostgreSQL (SQLAlchemy 2.0 async) und OpenClaw-Integration zur Echtzeit-Nachrichtenverarbeitung. Nutzung der Claude API für dynamische linguistische Analyse. Implementierung des SM-2 Spaced-Repetition-Algorithmus, personalisierter Vokabelverwaltung, Quiz-Logik und Webhook-basierter Nachrichtenrouten. Containerisierung mit Docker sowie Datenbankschemaverwaltung über Alembic für wartbare, skalierbare Systemarchitektur.

PythonFastAPIPostgreSQLAsyncIOOpenClawClaude APIWebhooksDockerSpaced RepetitionLLM Integration

AUSBILDUNG

Master in Data Science

Universität Cadi Ayad

2020 – 2022Marrakesch, Marokko

Bachelor in Informatik

Universität Cadi Ayad

2017 – 2020Marrakesch, Marokko

FÄHIGKEITEN

  • Large Language Models (LLMs): GPT, Claude, BERT, LLaMA, Fine-tuning, Prompt Engineering
  • Retrieval Augmented Generation (RAG): LangChain, LlamaIndex, Vektordatenbanken (Qdrant, ChromaDB, Pinecone)
  • Agentic AI & Multi-Agenten-Systeme: OpenClaw, Agent-Orchestrierung, WebSocket-Protokolle, Tool-Integration
  • Knowledge Graphs: Neo4j, Graph-Datenbanken, Semantische Beziehungen, Wissensrepräsentation
  • Machine Learning & Deep Learning: PyTorch, TensorFlow, Scikit-learn, Keras, Transformers
  • MLOps & Deployment: Docker, Kubernetes, AWS (EC2, S3, Lambda), FastAPI, Model-Monitoring, CI/CD
  • Programmierung: Python (Experte), SQL, Bash, REST APIs, Async/Await, SQLAlchemy
  • Data Engineering: Apache Spark, Kafka, ETL-Pipelines, PostgreSQL, MongoDB, Elasticsearch
  • NLP & Computer Vision: Sentence Transformers, OCR, Sentiment-Analyse, Maschinelle Übersetzung
  • Web-Technologien: React, D3.js, Playwright, BeautifulSoup4, Leaflet, Deck.gl, PostGIS

CERTIFICATES

Generative AI with Large Language Models - Coursera (Aug 2023 - July 2023)
Natural Language Processing with Attention Models - Coursera (June 2021 - Aug 2021)
Machine Learning - Coursera (Apr 2021 - June 2021)
Apply Generative Adversarial Networks - Coursera (May 2021 - July 2021)

SPRACHEN

German: B1
English: C1
French: C1