B2B — Automation & Build
RAG für interne Dokumente
Durchsuchbare, KI-gestützte Wissensdatenbank über Ihre internen Dokumente. Mitarbeitende stellen Fragen, das System antwortet mit Quellenangaben aus Ihren eigenen Daten.
Eine durchsuchbare Wissensdatenbank über Ihre eigenen Dokumente — Verträge, Handbücher, Onboarding-Material, technische Dokumentation. Mitarbeitende stellen Fragen in natürlicher Sprache, das System antwortet mit Quellenangaben.
Was RAG technisch ist
Retrieval-Augmented Generation: ein Sprachmodell wird mit relevanten Auszügen aus Ihren Dokumenten gefüttert, bevor es antwortet. Das Modell halluziniert nicht aus dem Trainingswissen, sondern beantwortet Fragen anhand der Dokumente, die Sie ihm zur Verfügung stellen — und gibt die Quelle jeder Aussage an.
Use Cases
- Onboarding neuer Mitarbeiter: Fragen zu Prozessen, Tools und Zuständigkeiten ohne ständiges Stören der Kollegen
- Compliance-Suche: “Welche unserer Verträge enthalten Klausel X?”
- Technische Dokumentation: “Wie konfiguriere ich Modul Y unserer Software?”
- Vertragssuche: Auffinden relevanter Klauseln in einem Vertragsbestand
Stack-Optionen
- LangChain oder LlamaIndex als Orchestrierung
- Qdrant oder Postgres mit pgvector als Vektor-Datenbank
- OpenWebUI als Frontend für die meisten Fälle, oder ein custom Frontend bei besonderen Anforderungen
- Optional: das Sprachmodell läuft on-premise (siehe On-Premise LLM Deployment), so dass auch der RAG-Prozess Ihr Netzwerk nicht verlässt
Was enthalten ist
- Dokumentenanalyse (Formate, Volumen, Struktur)
- Embedding-Pipeline mit angemessener Chunking-Strategie für Ihre Dokumenttypen
- Vektor-Datenbank-Setup auf Ihrer Infrastruktur
- Frontend-Setup mit Authentifizierung
- Zugriffsrechte-Modell — nicht jeder soll alles sehen
- Onboarding für Endanwender (Prompt-Beispiele, Best Practices)
- Schriftliche Betriebsdokumentation
Was nicht enthalten ist
Dokumenten-Bereinigung. Wir gehen davon aus, dass Ihre Quellen mindestens in einem strukturierten oder durchsuchbaren Format vorliegen (PDF, Markdown, Word, Confluence). Bei einer reinen Sammlung gescannter Faxe brauchen wir vorher einen separaten OCR-Schritt — sprechen wir gesondert.
Liefertermin
4–6 Wochen je nach Volumen und Komplexität.
Best Practices, die wir mitliefern
- Quellenangaben verpflichtend bei jeder Antwort
- Halluzinations-Mitigation durch strikte Kontext-Bindung
- Regelmäßige Reindexierung neuer Dokumente
- Logging zur späteren Auswertung tatsächlicher Nutzungsmuster