vector store: QI'ntel De'lIj qaw

vector store: QI'ntel De'lIj qaw

vector store: bIH (Bedeutung) Sumbogh Soj nej, vaj De'lIj documenta Sov QI'ntel — jaj Hoch documentum naQ DangeHbe'nIS. RAG, embedding, Qdrant je.

mu'mey rammoH'a'?→ mu'tay'Daq yISam

QI'ntel DaneH 'e' DaHar: 80-paghmey statut Sov. pagh Soj chenmoHmeH ngoq. pagh Hap-ngu' (Kalorientabellen) — asecla DapojmoHmeH.

(Du willst, dass eine KI deine 80-seitige Satzung kennt. Oder Rezepte. Oder die Kalorientabellen für deinen Ernährungs-Assistenten.)

mIw QIb: Hoch QInDaq yIqon. Qap — 'ach documentum tInqu'choH, machina taghwI' lIj, 'ej patlh Hoch wagh.

(Naive Lösung: alles in den Chat kopieren. Klappt — bis das Dokument zu groß wird, das Modell den Anfang vergisst und jede Anfrage teuer wird.)

mIw QaQ pong: vector store. 'ej pong qatlh law', yajchu'meH QatlhHa' law'.

(Die elegante Lösung heißt Vektorstore — und ist leichter zu verstehen, als der Name klingt.)

QI'ntel qaw pagh

(Das Grundproblem: KI hat kein Gedächtnis)

QI'ntel: SoH Sovbe'. QIn chu' Hoch — taghDaq tagh. De' yIqon 'e' DalaH 'ach Sep mach (context window), 'ej jaj Hoch documentum naQ DangeHchugh — rur: paq Hoch boqHa' Daqengbogh wa' paq neH DalaDmeH.

(Die KI weiß nichts über dich. Jeder neue Chat startet bei null. Du kannst Kontext einfügen, aber der Platz ist klein — und ein ganzes Dokument jedes Mal mitzuschicken ist, als schlepptest du die ganze Bibliothek mit, um eine Seite nachzuschlagen.)

vaj mIw poQlu': QI'ntelvaD Doch lugh neH yInob. vector store: Dochvam ta'.

(Es braucht also einen Weg, der KI nur das Richtige zu geben. Genau das macht der Vektorstore.)

qech: bIH mojDI' mI'mey

(Die Idee: Bedeutung wird zu Zahlen)

De'wI': mu'mey yajbe', mI'mey neH yaj. vaj vector store ghItlh Hoch mI'mey tIq mojmoH — embedding (insertio) ponglu'. nguq: bIH (Bedeutung) luqaw mI'meyvam, mu'Ho'Du' pagh.

(Der Computer versteht keine Wörter, nur Zahlen. Also wandelt der Vektorstore jeden Text in eine lange Zahlenreihe um — ein „Embedding". Der Clou: diese Zahlen fangen die Bedeutung ein, nicht die Buchstaben.)

ghItlh bIH rurbogh: mI'mey rur, Sum. "targh" "loSjajbogh" je: Sum. "targh" "tlhIH HuchHom QIn" je: Hop.

(Texte mit ähnlicher Bedeutung bekommen ähnliche Zahlen und liegen nah beieinander. „Hund" und „Vierbeiner": nah. „Hund" und „Steuererklärung": fern.)

paq pa' yIqaw: paqmey alphabet pagh — qech rurbogh boqlu'. So' Hoch boq, titel pIm 'ach. mu' pe'vIl Danejbe', bIH Danej.

(Stell dir eine Bibliothek vor: Bücher nicht alphabetisch, sondern nach Thema gruppiert. Du suchst nicht das exakte Stichwort, sondern den Sinn.)

mI'mey: SoH yIghur

(Ein Rechenbeispiel zum Selbstrechnen)

DaH technical law'choH — 'ach yIHaj 'eH: Hoch chen boq je (mal und plus) neH, calculator lo'laH Hoch. DaqIporghchugh yISIQ; mI'mey pagh yajlu' qech.

(Jetzt wird's etwas technischer — aber keine Sorge: am Ende nur Mal und Plus, das jeder Taschenrechner kann. Wer mag, überspringt es; das Prinzip versteht man auch ohne die Zahlen.)

vagh bIH-patlh (Bedeutungs-Dimensionen) wIlo': vutpu', Soj-QaQ, qeq, jan, Huch. ghItlh Hoch: patlh Hoch mI' Suq, qabbe'chugh nIv.

(Wir nehmen fünf Bedeutungs-Dimensionen: Kochen, Ernährung, Fitness, Ausrüstung, Geld. Jeder Text bekommt pro Dimension eine Zahl, höher je besser es passt.)

cha' documenta:

vutpu'Soj-QaQqeqjanHuch
Dok A — Soj calor-puS34001
Dok B — HoS qeq, taghwI'pu'vaD01421

vagh mI'vam: documentum vector. directionDaj neH wInoHmeH (mu' law'qu' pagh wInoHbe'), vector Hoch tIqDaj 1 wIchoHmoH — "normieren" ponglu'. tIq pIH wIboqHa':

(Diese fünf Zahlen sind der Vektor des Dokuments. Um nur die Richtung zu vergleichen (nicht wer mehr Wörter hat), bringen wir jeden Vektor auf Länge 1 — „normieren". Man teilt durch die eigene Länge:)

  • A tIq = √(3² + 4² + 1²) = √26 ≈ 5.10 → A ≈ (0.59, 0.78, 0, 0, 0.20)
  • B tIq = √(1² + 4² + 2² + 1²) = √22 ≈ 4.69 → B ≈ (0, 0.21, 0.85, 0.43, 0.21)

nej DaH. ghellIj vector (normatum) moj je, patlh nuq SIQ. tIq 1 Hoch ghaj vaj cosine similarity: skalarprodukt neH — bini boq, Hoch chel. mI' 1 Sum: rurqu'; mI' 0 Sum: rurbe'.

(Jetzt die Suche. Auch deine Anfrage wird ein (normierter) Vektor, je nach betonten Dimensionen. Da alle Länge 1 haben, ist die Kosinus-Ähnlichkeit nur das Skalarprodukt: paarweise multiplizieren, alles addieren. Nahe 1 = sehr ähnlich, nahe 0 = unähnlich.)

qatlh cosine? pup 'ej ghovlu'laH: cosine tIn 'oH — vectormey joj 'ang mach, vaj rur'a' Daq luSamchoH. latlh similarity-mey tu'lu' je, 'ach cosine: motlh.

(Warum Kosinus? Er ist einfach und anschaulich: ein großer Kosinus bedeutet einen kleinen Winkel zwischen den Vektoren — sie zeigen fast in dieselbe Richtung. Es gibt auch andere Ähnlichkeitsmaße, aber der Kosinus ist der Klassiker.)

ghel "Soj calor-puS vut" = (1, 1, 0, 0, 0), normatum (0.71, 0.71, 0, 0, 0):

  • A je: 0.59 · 0.71 + 0.78 · 0.71 = 0.97
  • B je: 0.21 · 0.71 = 0.15

Dok A Qap. loS ghelmey:

ghel (pondera)· A· BQap
"Soj calor-puS vut" (1,1,0,0,0)0.970.15Dok A
"chay' jIqeq?" (0,0,1,0,0)0.000.85Dok B
"Soj-QaQ, Huch puS" (0,1,0,0,1)0.690.30Dok A
"qeqvaD Soj-QaQ" (0,1,1,0,0)0.550.75Dok B

Qav Daq potlh: "Soj-QaQ" neH Dok A wIv — 'ach "qeq" HoS law', Dok B jIH, vaj B Qap. store: mu' nejbe', bIH naQ noH.

(Die letzte Zeile ist interessant: „Ernährung" allein spräche für Dok A — aber „Training" zieht stärker, also gewinnt B. Der Store matcht keine Stichwörter, er wägt die ganze Bedeutung.)

'ej Dochvam naQ: boq chen je neH. maH cha' documenta, vagh patlh, calculator wIlo'; De'wI': SaD SaD documenta, SaD patlh, millisecond-Daq ta'. vera embedding-exemplaria: 500-4000 patlh, vagh pagh. qech rap taH.

(Und das ist alles: nur mal und plus. Wir: 2 Dokumente, 5 Dimensionen, Taschenrechner; der Server: Millionen Dokumente, Tausende Dimensionen, in Millisekunden. Echte Embedding-Modelle: 500–4000 Dimensionen statt fünf. Das Prinzip bleibt gleich.)

chay' tay'choH: RAG

(Wie das zusammenspielt: RAG)

pong tech: RAG — retrieval-augmented generation. Qatlh QumHa' 'ach bIH nIv: jang pa', De'lIj basisvo' (Wissensdatenbank) Soj lugh Suq QI'ntel.

(Fachbegriff: RAG. Klingt sperrig, heißt aber nur: bevor die KI antwortet, holt sie passende Häppchen aus deiner Wissensdatenbank.)

loS patlh:

  1. pe': documentumlIj 'orwI'mey machHom luchoplu' ("chunks").
  2. chel: 'orwI' Hoch mI' vestigium Suq 'ej vector storeDaq jaH.
  3. nej: ghel DaghelDI' mI' moj je — 'ej store: 'orwI'mey rurqu' nob.
  4. jang: 'orwI'vam puS neH, ghellIj je, machinavaD jaH.

(Vier Schritte: Zerlegen in Häppchen, Einbetten mit Zahlen-Fingerabdruck, Suchen der ähnlichsten Häppchen, Antworten nur mit diesen wenigen.)

usuDaq: wa' QaQ neH SuqHa'lu' — Qu' Sumchugh, wej-vagh QaQ Suqlu'. SaD SaD documenta tu'lu'DI', potlh natlhbe'. qech rap taH.

(In der Praxis holt man nicht nur den einen besten Treffer, sondern — je nach Anwendungsfall — die besten drei bis fünf. Bei Tausenden bis Millionen Dokumenten verhindert das, dass Wichtiges durchrutscht. Das Prinzip bleibt gleich.)

paq Hoch DangeHbe', pagh lugh neH jaH. Huch DaqIm 'ej jang certain — fontlIj nID, QI'ntel Soj DonHa'.

(Statt des ganzen Buchs geht nur die passende Seite raus. Spart Geld, macht die Antwort konkreter — sie stützt sich auf deine Quellen.)

'ej potlh: hallucinatio puS. mungDaj legh QI'ntelDI', ngebHa' puS chenmoH.

(Und wichtig: weniger Halluzinieren. Wenn die KI die richtige Stelle direkt vor sich hat, erfindet sie seltener etwas.)

nuq DaH poQlu'

(Was du konkret brauchst)

QaQ QIn: vector store yISuvHa' — yIchenmoHHa'. jan Sayqu' pe', chel, nej Hoch ta':

(Gute Nachricht: du baust den Vektorstore nicht selbst. Fertige Werkzeuge erledigen Zerlegen, Einbetten und Suchen.)

  • OpenWebUI: De'meyDaj basis (Wissensdatenbank) ngaS — PDF yIngeH, rIn.
  • Flowise: QI'ntel Qu'mey naQ DaboqlaH — ngoq pagh.
  • Qdrant: vector store 'oH 'e'; Docker-Daq QaQ qet, SoH DaSeH DaneHchugh.

(OpenWebUI hat eine Wissensdatenbank eingebaut. Flowise klickt ganze Abläufe zusammen, kein Code. Qdrant ist der Vektorstore selbst, läuft in Docker, wenn du selbst steuern willst.)

'ej Dochvam QaQqu': SoHDaq Hoch qet. De'meylIj De'wI'lIjvo' mejbe' — chal pagh, nuvpu' Hop pagh lulaDbogh. Hoch pegh: tob.

(Und das Schöne: alles läuft bei dir. Deine Dokumente verlassen deinen Rechner nicht — keine Cloud, kein Fremder liest mit. Für alles Vertrauliche ein echtes Argument.)

qun nI'Ha': chu'be' Hoch

QI'ntel mIw chu' rur'a'? ghobe'. textmey vectormey rur boqlu' 'ej spatiumDaq lanlu' — qechvam tIq law' blogvam laDwI'pu' qan law'. Vector Space Model mojpu', DIS 1960-1970. nejwI' patmey, paq-pol patmey je sic vangpu', 'ej DIS 2000 retlhDaq web-nejwI'pu' eventusmeyDaj principlevam lo'taH.

(Klingt nach brandneuer KI-Magie? Nein. Texte als Vektoren zu sortieren und in einen Raum zu legen ist älter als die meisten Leser dieses Blogs — das Vector Space Model entstand 1960–1970. Such- und Bibliothekssysteme arbeiteten schon so, und um 2000 nutzten Web-Suchmaschinen genau dieses Prinzip.)

vaj vector store chu'be'. chu' chay' mI'mey chenchoH. wa'Hu' mu'mey juDlu' neH, 'ej formulamey rur TF-IDF (SEODaq WDF*IDF ponglu') lo'lu': mu' qubqu'choH, documentumvamvaD potlhqu'choH. mu' ratiocinatio neH — bIH pagh.

(Also ist nicht der Vektorstore neu. Neu ist, wie die Zahlen entstehen. Früher zählte man nur Wörter und nutzte Formeln wie TF-IDF (im SEO WDFIDF genannt): je seltener ein Wort, desto wichtiger für dieses Dokument. Reine Buchhaltung — keine Bedeutung.)*

DaHjaj QI'ntel insertion ta'. ghojpu': "targh" "loSjajbogh" je tay', mu' rap qaSbe'pu'. wa'Hu' DuHbe'pu' — vaj qech qan ver cha'DIch SIQtaH.

(Heute übernimmt die KI das Embedding. Sie hat gelernt, dass „Hund" und „Vierbeiner" zusammengehören, ohne dass je dasselbe Wort fiel. Früher unmöglich — darum erlebt die alte Idee einen zweiten Frühling.)

ghorgh lI', ghorgh lI'be'

(Wann es sich lohnt — und wann nicht)

teH: ChatGPTvaD ghel nom — vector store poQbe'. lI'choH basis rapDaq reH DalaHchugh — notlIj, manual, documentatio, Soj QIn. Hoch tIn law' jaj Hoch DaQIjqa'meH.

(Ehrlich: für eine schnelle Frage an ChatGPT brauchst du keinen Vektorstore. Lohnt sich, wenn du immer gegen dieselbe Wissensbasis arbeitest — Notizen, Handbücher, Doku, Rezepte. Alles zu groß zum jedes-Mal-neu-Erklären.)

wa'logh lo'meH: tInqu'. qaw DachenmoHmeH SoH tlhejbogh: lugh.

(Für den einmaligen Gebrauch: Overkill. Für ein Gedächtnis, das mit dir wächst: genau richtig.)

chay' bItagh

(So fängst du an)

aditus QatlhHa': OpenWebUI. basis chenmoH, De'mey ngeH, machina SoHvaD qIm — latlh jan ta'. 'oH bIngDaq DajaHneHchugh: wa' Docker ngoQ — Qdrant yItagh, bIH-nejmeH Qu' yInuD.

(Einfachster Einstieg: OpenWebUI. Wissensdatenbank anlegen, Dokumente einfügen, eigenem Modell zuweisen — den Rest macht das Tool. Tiefer: Qdrant mit einem Docker-Befehl starten und das Suchen-nach-Bedeutung ausprobieren.)

QI'ntel SoH chenmoHmeH mIwmey — serie machHom taghvam. veb: Qdrant concrete wImuD — 'ej chay' chatbot moj, contentlIj Sovbogh.

(Das ist der Auftakt einer kleinen Serie übers Bauen eigener KI-Systeme. Als Nächstes: Qdrant konkret — und wie daraus ein Chatbot wird, der deine Inhalte kennt.)