Was ist Late Chunking?
Für Unternehmen, die auf KI-Sichtbarkeit setzen, ist Late Chunking relevant, weil es die Qualität der Quellen-Zuordnung in KI-Antworten verbessert. Wenn ein RAG-System Ihre Inhalte besser im Kontext versteht, steigt die Wahrscheinlichkeit, dass Ihre Website als Quelle zitiert wird. Das Konzept verbindet sich direkt mit GEO und Content-Optimierung für KI.
Late Chunking ist eine fortschrittliche Technik im Bereich Retrieval-Augmented Generation (RAG), die ein fundamentales Problem der KI-Quellenauswahl löst. Beim klassischen Chunking wird ein Text zuerst in Abschnitte zerlegt und dann werden für jeden Abschnitt Embeddings berechnet. Das Problem: Der globale Kontext geht verloren. Ein Absatz, der „sie” statt des Firmennamens verwendet, verliert beim isolierten Embedding seine Bedeutung.
Late Chunking dreht die Reihenfolge um: Zuerst wird der gesamte Text als Einheit durch das Sprachmodell verarbeitet, wobei jedes Token den vollständigen Dokumentkontext berücksichtigt. Erst danach wird der Text in Chunks zerlegt. Das Ergebnis: Jeder Chunk behält das „Wissen” über den Gesamtkontext — Pronomen, Rückverweise und thematische Zusammenhänge bleiben erhalten.
Für Ihre Content-Strategie hat Late Chunking zwei Implikationen. Erstens: Auch wenn KI-Systeme zunehmend Late Chunking einsetzen, bleibt semantische Vollständigkeit wichtig — nicht alle Systeme nutzen diese Technik. Zweitens: Late Chunking belohnt gut strukturierte Texte mit klarer thematischer Gliederung. Wenn Ihr Text logisch aufgebaut ist, profitiert er am meisten von dieser Technik. Kombinieren Sie deshalb die Prinzipien der Chunk-Level Optimization mit einer durchdachten Gesamtstruktur.
Über den Autor
Christian SynoradzkiSEO-Freelancer
Mehr als 20 Jahre Erfahrung im digitalen Marketing. Fairer Stundensatz, keine Vertragsbindung, direkter Ansprechpartner.