Website under construction feedback appreciated at [email protected]
← Terug naar blog
data-ai

AI-102 en RAG: wat het examen werkelijk toetst

Yair Knijn · · 5 min lezen

De AI-102 is in april 2025 ingrijpend bijgewerkt om generatieve AI en RAG-patronen als volwaardig examenonderdeel op te nemen. Het is niet meer uitsluitend een toets over Cognitive Services-configuratie: een aanzienlijk deel van de vragen gaat nu over hoe je productie-AI-systemen bouwt met Azure OpenAI, AI Foundry en retrieval-gebaseerde architecturen.

Let op: de AI-102 wordt per 30 juni 2026 teruggetrokken. Als je hem wil halen, moet je dat voor die datum doen. Er komt vermoedelijk een opvolger, maar die is nog niet officieel aangekondigd.

Wat RAG is en hoe het examen het behandelt

RAG staat voor Retrieval-Augmented Generation. De kern: in plaats van een taalmodel te laten antwoorden vanuit zijn trainingsdata, laat je het model antwoorden op basis van documenten die je real-time ophaalt. Dit is het standaardpatroon voor chatbots die bedrijfsdocumenten moeten kunnen raadplegen.

Het examen test RAG op drie niveaus:

Architectuurniveau. Je krijgt een scenario: “Een bedrijf wil een chatbot die vragen kan beantwoorden over hun interne kennisbank van 50.000 documenten. De antwoorden moeten altijd gebaseerd zijn op de interne documentatie, niet op algemene kennis van het model.” Welke componenten heb je nodig?

Het verwachte antwoord omvat: Azure AI Search als retrieval-component, Azure OpenAI als generatiecomponent, en een orchestratielaag (Prompt Flow of Semantic Kernel) die de twee verbindt.

Configuratieniveau. Hoe configureer je Azure AI Search voor RAG? Welke indexeringsopties zijn relevant? Dit zijn de concrete keuzes:

  • Vector search versus keyword search versus hybrid search: voor RAG is hybrid search doorgaans het beste resultaat bij semantische vragen
  • Chunking strategie: hoe groot zijn de tekstfragmenten die je in de index stopt? Te klein verliest context, te groot haalt irrelevante informatie op
  • Semantische ranking: de extra laag die AI Search toepast om de meest relevante chunks te prioriteren

Integratieniveau. Hoe verbind je retrieval met generatie in de prompt? De examenvraag gaat dan over system prompts, grounding instructies en hoe je de opgehaalde context in de prompt injecteert.

Concreet: wat je moet kennen over Azure AI Search voor RAG

Azure AI Search is het retrieval-component in vrijwel alle RAG-architecturen op het examen. De concepten die terugkomen:

Index versus indexer versus skillset. Een index is de opslagstructuur. Een indexer haalt data op uit een bron (blob storage, SQL, SharePoint) en vult de index. Een skillset is een keten van AI-bewerkingen die de indexer kan uitvoeren voor data erin gaat: tekst extraheren uit PDF’s, embeddings genereren, entiteiten herkennen.

Vectoropslag. Voor semantisch zoeken moet je tekst als embeddings opslaan (dichte vectoren van getallen die betekenis representeren). Je genereert die embeddings via Azure OpenAI’s embedding-modellen (text-embedding-ada-002 of nieuwere varianten) en slaat ze op in het vectorveld van je AI Search-index.

Hybrid search. Een combinatie van keyword-gebaseerd zoeken (BM25) en vectorgebaseerd zoeken. Uit oefenexamens en eigen ervaring merk je dat vragen over “wat is het beste zoektype voor semantische vragen in een juridische documentenset” vrijwel altijd hybrid search als antwoord hebben, met semantische re-ranking bovenop.

Wat je moet kennen over Azure OpenAI voor RAG

Deployment versus model. Op het examen maakt Microsoft onderscheid tussen het Azure OpenAI-account, het model en de deployment. Je kunt meerdere deployments van hetzelfde model hebben met verschillende quota of namen. Vragen over capaciteitslimieten en token-per-minuut-quota gaan over deployments, niet over modellen.

System prompt en grounding. Het examen heeft vragen over hoe je een taalmodel instrueert om alleen te antwoorden op basis van opgegeven context. De standaardformulering in een system prompt is: “Beantwoord de vraag alleen op basis van de volgende context. Als het antwoord niet in de context staat, zeg dan dat je het niet weet.” Dit klinkt triviaal, maar er zijn examenvragen die drie varianten van deze instructie aanbieden en vragen welke het beste beschermt tegen hallucinatie.

Temperatuur en top-p. Paraameters die de creativiteit van het model sturen. Voor RAG-toepassingen waarbij feitelijke nauwkeurigheid belangrijk is, wil je een lage temperatuur (0.0 tot 0.3). Het examen vraagt welke parameterinstelling het meest geschikt is voor een juridisch adviesbot versus een creatieve chatbot.

Prompt Flow en Semantic Kernel

Prompt Flow is het visuele orchestratie-instrument in Azure AI Foundry. Semantic Kernel is een SDK (beschikbaar in Python, C# en Java) voor het bouwen van AI-agents en orkestratiepipelines in code.

Het examen verwacht geen diep technische kennis van Semantic Kernel-code. Wel verwacht het dat je weet:

  • Wanneer je Prompt Flow gebruikt (visuele pipeline, low-code, experimenteren)
  • Wanneer je Semantic Kernel gebruikt (applicatiecode, productie, complexe orkestratie)
  • Wat een “plugin” is in de context van Semantic Kernel (een verzameling functies die het model kan aanroepen)

Hoe je oefent

De meest effectieve voorbereiding voor de RAG-onderdelen is niet meer documentatie lezen maar bouwen. Maak een werkende RAG-pipeline met Azure AI Search en Azure OpenAI. Dat hoeft niet groot: een kleine index van 10 tot 20 documenten is genoeg om de concepten te ervaren.

De gratis tier van Azure AI Search is beperkt maar voldoende voor oefenen. De Azure OpenAI-service vereist goedkeuring (aanvragen duurt 1 tot 2 werkdagen).

Als je geen Azure-omgeving hebt, zijn de Microsoft Learn-modules voor AI-102 grotendeels voorzien van sandbox-omgevingen. Die zijn trager dan je eigen omgeving maar vereisen geen eigen abonnement.

Bekijk onze AI-102 trainingspagina voor beschikbare cursussen en voorbereiding.

ai-102 examen-prep rag azure-openai generative-ai