Wissensinjektion & Indizierung
Die mehrstufige Ingestion-Pipeline (Fetch, Extract, Chunk, Embed, Index) mit partiellem Reprocess, Versioning und Sensitive-Content Handling.
Was ist dieses Feature?
Die Ingestion-Pipeline bringt Dokumente, Webseiten und Tools in die Wissensbasis: Fetch, Extract, Chunk, Embed, Index. Dieser Deep Dive erklärt Schritte, Fehlerbehandlung und Teilarbeit.
Warum es wichtig ist
Genauigkeit hängt von aktuellen, korrekt verarbeiteten Inhalten ab. Teilreprocess spart Zeit und Kosten.
Wie es funktioniert (ohne Jargon)
Stationen: Fetch → Extract → Chunk → Embed → Index. Fehler werden geloggt; Operatoren können nur die betroffene Stage neu ausführen.
Roadmap
1. Version-Tracking & Partial-Reprocess API (3 Wochen)
2. Migration zu dediziertem Vektor-DB (2 Monate)