MLOps zonder buzzwords: hoe begin je

MLOps heeft een buzzword-probleem. Presentaties op conferenties gaan over feature stores, model registries en real-time monitoring, terwijl de meeste teams nog steeds een Jupyter notebook als productiesysteem draaien. Dit artikel negeert de conferentie-agenda en kijkt naar wat teams in de praktijk nodig hebben.

Drie volwassenheidsniveaus

Google publiceerde jaren geleden een verdeling in drie niveaus. Die verdeling is nog steeds bruikbaar.

Level 0: notebook in productie. Een datascientist bouwt een model in een notebook, het wordt handmatig geëxporteerd en ergens gedeployd. Herhaling van het proces kost elke keer handwerk. Veel teams zitten hier, en voor een eerste model of een intern dashboard is dat prima.

Level 1: pipeline en CI/CD. Trainingsdata, feature-engineering en modeltraining zijn geautomatiseerd in een reproduceerbare pipeline. Een nieuwe datarun triggert automatisch een nieuwe trainingsrun. Modellen worden geregistreerd met versienummer. Dit niveau is voor de meeste teams het zinvolle eindpunt.

Level 2: feature store, model registry en monitoring. Features worden gedeeld tussen meerdere modellen vanuit een centrale store. Modeldrift wordt automatisch gedetecteerd. Modellen worden automatisch hertraind. Dit niveau heeft zin bij organisaties met tientallen modellen in productie en een dedicated ML-platform-team.

De meeste teams hoeven nooit verder dan level 1. Level 2 toevoegen zonder level 1 goed te beheersen is een recept voor onnodige complexiteit.

Tools die het waard zijn

MLflow is de solide keuze voor experiment tracking en model registry. Open source, werkt lokaal en in de cloud, integreert goed met Python. Als je nog niets gebruikt, begin hier.

DVC (Data Version Control) lost een specifiek probleem op: versiebeheer voor datasets en modelartifacts via Git-achtige commando’s. Handig als je reproductie van experimenten serieus neemt. Niet verplicht voor level 1, wel nuttig.

Evidently AI is de meest toegankelijke tool voor data- en modeldrift-monitoring. Je maakt er statistieken mee die je periodiek vergelijkt. Open source en goed gedocumenteerd. Als je wil beginnen met monitoring, begin hier.

Deze drie tools samen dekken het grootste deel van wat een level 1 MLOps-setup vraagt.

Tools waar je weg moet blijven

Een categorie verdient expliciete vermelding: volledig gemanagede ML-platformen van cloudproviders die alleen werken binnen hun eigen ecosysteem.

AWS SageMaker, Azure ML en Vertex AI zijn krachtige platforms, maar ze trekken je diep in hun eigen API’s en tooling. Als je later wil wisselen of tools wil combineren, zit je vast. Dat is een reden om bewust te kiezen en te weten wat je inlevert.

Hetzelfde geldt voor proprietary feature stores. De open source alternatieven (Feast, Hopsworks) zijn voor de meeste teams goed genoeg en voorkomen dat je een licentiecontract aangaat voor iets dat je misschien over twee jaar niet meer nodig hebt.

Hoe je begint

De praktische volgorde voor een team dat van level 0 naar level 1 wil:

Installeer MLflow en log je experimenten vanaf nu. Geen grote migratie, gewoon beginnen.
Zet je trainingscode om van notebook naar een Python-script dat je kunt aanroepen met parameters.
Bouw een eenvoudige CI-pipeline die dat script uitvoert bij een commit op de main branch.
Registreer het getrainde model in MLflow’s model registry.

Dat is het. Vier stappen. De rest is optimalisatie die je doet zodra je een concreet probleem tegenkomt.

Training en teams

MLOps-vaardigheden zitten op het snijvlak van data science en software engineering. De meeste data scientists missen de CI/CD-kant; de meeste engineers missen het ML-begrip. Een training die beide kanten combineert, levert meer op dan een cursus die zich beperkt tot tools.

Zoek je een MLOps-training voor je team? Bekijk het aanbod op ict-trainingen.com.

Begin klein. Level 1 lost al de meeste productie-problemen op die teams in de praktijk tegenkomen. Level 2 voeg je toe als de pijn groot genoeg is, niet omdat iemand op een conferentie zei dat je het nodig hebt.

MLOps zonder buzzwords: hoe begin je

Drie volwassenheidsniveaus

Tools die het waard zijn

Tools waar je weg moet blijven

Hoe je begint

Training en teams

Gerelateerde artikelen

DP-700: waar Microsoft Fabric en Databricks overlappen en botsen

AI-102 en RAG: wat het examen werkelijk toetst

AI-102: van AI-900 naar AI Engineer in vier weken