Hoe werkt het?

Een taalmodel zoals ChatGPT of Claude is getraind op algemene data en "kent" jouw bedrijf niet. RAG lost dat op in vier stappen:

  1. Vraag: de gebruiker stelt een vraag.
  2. Retrieval (ophalen): het systeem zoekt de meest relevante passages in jouw bronnen, doorgaans via een vector store die op betekenis zoekt.
  3. Augmentation (aanvullen): die passages worden samen met de vraag aan het taalmodel meegegeven.
  4. Generation (genereren): het model formuleert een antwoord op basis van net die passages, en kan verwijzen naar de bron.
Zonder RAG gokt een taalmodel. Met RAG antwoordt het op basis van jouw echte informatie.

Waarvoor dient het?

RAG is de standaardaanpak zodra een AI moet antwoorden op basis van informatie die niet in zijn training zat:

Waarom heb je het nodig?

Een taalmodel op zich heeft twee problemen voor bedrijfsgebruik: het kent jouw specifieke informatie niet, en het kan overtuigend klinkende onzin verzinnen (een hallucinatie). RAG pakt beide aan: het model krijgt op het moment van de vraag jouw actuele, juiste feiten aangereikt, en baseert zijn antwoord daarop.

Het alternatief, een model helemaal hertrainen op jouw data (fine-tunen), is duur, traag en moet je herhalen telkens je informatie verandert. Met RAG update je gewoon de bronnen: nieuwe info is meteen beschikbaar, zonder het model opnieuw te trainen.

Hoe Sevendays dit gebruikt: onze website-assistent en interne assistenten draaien op RAG, bovenop een vector store met jouw content en bedrijfsdata op Europese infrastructuur. Zo brengt ons AI-platform al je bronnen samen en antwoordt de assistent accuraat, met bronvermelding. In onze voorbeelden zie je concrete toepassingen, en in de 5 fases van AI lees je waar dit past in je bredere AI-aanpak.

RAG of fine-tuning?

Kort: fine-tuning past het gedrag van het model zelf aan (toon, stijl, vaste taken). RAG voedt het model met actuele kennis op het moment van de vraag. Voor bedrijfsinformatie die regelmatig verandert is RAG meestal de betere en goedkopere keuze. De twee sluiten elkaar niet uit en worden soms gecombineerd.

Verwante begrippen