Zum Inhalt springen
Mainframe

B2B — Automation & Build

RAG für interne Dokumente

Durchsuchbare, KI-gestützte Wissensdatenbank über Ihre internen Dokumente. Mitarbeitende stellen Fragen, das System antwortet mit Quellenangaben aus Ihren eigenen Daten.

Eine durchsuchbare Wissensdatenbank über Ihre eigenen Dokumente — Verträge, Handbücher, Onboarding-Material, technische Dokumentation. Mitarbeitende stellen Fragen in natürlicher Sprache, das System antwortet mit Quellenangaben.

Was RAG technisch ist

Retrieval-Augmented Generation: ein Sprachmodell wird mit relevanten Auszügen aus Ihren Dokumenten gefüttert, bevor es antwortet. Das Modell halluziniert nicht aus dem Trainingswissen, sondern beantwortet Fragen anhand der Dokumente, die Sie ihm zur Verfügung stellen — und gibt die Quelle jeder Aussage an.

Use Cases

  • Onboarding neuer Mitarbeiter: Fragen zu Prozessen, Tools und Zuständigkeiten ohne ständiges Stören der Kollegen
  • Compliance-Suche: “Welche unserer Verträge enthalten Klausel X?”
  • Technische Dokumentation: “Wie konfiguriere ich Modul Y unserer Software?”
  • Vertragssuche: Auffinden relevanter Klauseln in einem Vertragsbestand

Stack-Optionen

  • LangChain oder LlamaIndex als Orchestrierung
  • Qdrant oder Postgres mit pgvector als Vektor-Datenbank
  • OpenWebUI als Frontend für die meisten Fälle, oder ein custom Frontend bei besonderen Anforderungen
  • Optional: das Sprachmodell läuft on-premise (siehe On-Premise LLM Deployment), so dass auch der RAG-Prozess Ihr Netzwerk nicht verlässt

Was enthalten ist

  • Dokumentenanalyse (Formate, Volumen, Struktur)
  • Embedding-Pipeline mit angemessener Chunking-Strategie für Ihre Dokumenttypen
  • Vektor-Datenbank-Setup auf Ihrer Infrastruktur
  • Frontend-Setup mit Authentifizierung
  • Zugriffsrechte-Modell — nicht jeder soll alles sehen
  • Onboarding für Endanwender (Prompt-Beispiele, Best Practices)
  • Schriftliche Betriebsdokumentation

Was nicht enthalten ist

Dokumenten-Bereinigung. Wir gehen davon aus, dass Ihre Quellen mindestens in einem strukturierten oder durchsuchbaren Format vorliegen (PDF, Markdown, Word, Confluence). Bei einer reinen Sammlung gescannter Faxe brauchen wir vorher einen separaten OCR-Schritt — sprechen wir gesondert.

Liefertermin

4–6 Wochen je nach Volumen und Komplexität.

Best Practices, die wir mitliefern

  • Quellenangaben verpflichtend bei jeder Antwort
  • Hallu­zi­na­tions-Mitigation durch strikte Kontext-Bindung
  • Regelmäßige Reindexierung neuer Dokumente
  • Logging zur späteren Auswertung tatsächlicher Nutzungsmuster