Was ist RAG?
RAG (Retrieval-Augmented Generation) ist eine Architektur für KI-Anwendungen, die ein Large Language Model (LLM) mit einer externen Wissensbasis kombiniert. Statt sich nur auf das Trainingswissen des Modells zu verlassen, werden relevante Dokumente zur Laufzeit abgerufen und als Kontext bereitgestellt.
Funktionsweise
Eine RAG-Pipeline besteht aus drei Schritten:
- Indexierung: Dokumente (PDFs, Wikis, Datenbanken) werden in Textfragmente zerlegt und als Vektoren in einer Vektordatenbank gespeichert
- Retrieval: Bei einer Nutzeranfrage werden die semantisch relevantesten Textfragmente aus der Datenbank abgerufen
- Generation: Das LLM generiert eine Antwort auf Basis der Anfrage und der abgerufenen Kontextdokumente
Warum RAG?
Klassische LLMs haben Einschränkungen:
- Veraltetes Wissen: Trainingsdaten haben einen Stichtag
- Halluzinationen: Das Modell kann plausibel klingende, aber falsche Antworten generieren
- Kein Unternehmenswissen: Interne Dokumente sind dem Modell nicht bekannt
RAG löst diese Probleme, indem es dem Modell aktuelle, verifizierbare Quelldokumente als Kontext mitgibt.
Komponenten einer RAG-Architektur
| Komponente | Funktion |
|---|---|
| Embedding-Modell | Wandelt Text in numerische Vektoren um |
| Vektordatenbank | Speichert und durchsucht Vektoren (z.B. Qdrant, Pinecone, Weaviate) |
| LLM | Generiert Antworten auf Basis von Kontext (z.B. OpenAI, Claude, Llama) |
| Orchestrierung | Steuert den Ablauf (z.B. LangChain, LangGraph) |
Einsatzgebiete
- Interne Dokumentensuche: Mitarbeiter fragen ein KI-System zu internen Richtlinien, Handbüchern oder Protokollen
- Kundensupport: Chatbots beantworten Fragen basierend auf Produktdokumentation
- Wissensmanagement: Zugriff auf verteiltes Unternehmenswissen über eine zentrale Schnittstelle
- Compliance: Automatisierte Beantwortung regulatorischer Anfragen mit Quellenangabe
Vorteile
- Faktenbasiert: Antworten stützen sich auf konkrete Quelldokumente
- Aktuell: Neue Dokumente werden sofort in den Index aufgenommen
- Nachvollziehbar: Quellen können dem Nutzer angezeigt werden
- Datenschutzkonform: Unternehmensdaten bleiben intern – DSGVO-konform umsetzbar