De kop is zelden het sterkste model

Wanneer een lab een nieuw model aankondigt en de pers ermee aan de haal gaat, zijn ondernemers geneigd aan te nemen dat de naam in de kop het meest capabele is wat beschikbaar is. Dat is meestal niet zo. De recente aandacht van Anthropic ging naar Sonnet 5, maar Sonnet 5 is de gebalanceerde middentier van de Claude-familie. Het vlaggenschip, de meest capabele tier, is Opus 4.8. Onder Sonnet zit Haiku, de snelle en goedkope tier, naast Fable 5, een gespecialiseerd lid van diezelfde familie. OpenAI levert dezelfde vorm: GPT-5.6 komt als Sol, het vlaggenschip, Terra, de gebalanceerde tier gepositioneerd op ongeveer de helft van de kosten van de vorige generatie bij vergelijkbare prestaties, en Luna, de snelle en goedkoopste tier.

Dit is nu de standaardstructuur bij elk serieus lab, en die bestaat met reden. Een enkel model kan niet tegelijk het sterkste, het goedkoopste en het snelste zijn. Daarom splitsen labs de familie op in tiers en laten ze kopers kiezen. De kop landt doorgaans op de release die het meest nieuwswaardig of het meest breed uitgerold is, en dat is vaak de middentier in plaats van het vlaggenschip. De pers lezen vertelt je wat er gelanceerd is. Het vertelt je niet welke tier in jouw bedrijf thuishoort.

Reserveer het vlaggenschip, draai de middentier, schaal de snelle tier

De vlaggenschiptier verdient zijn meerprijs bij echt lastige problemen: dichte juridische of financiele redenering, analyse in meerdere stappen waarbij een verkeerde aanname het resultaat onbruikbaar maakt, complexe code, en werk waarbij een fout duur is om later te ontdekken. Voor dat soort taken is betalen voor Opus 4.8 of Sol de goedkope keuze, omdat de kosten van een zwak antwoord die van het betere model in het niet doen vallen. Hier bezuinig je niet.

De middentier is waar het grootste deel van de dag daadwerkelijk draait. Sonnet 5 of Terra verzorgt het opstellen, samenvatten, klantantwoorden, onderzoekssynthese en de gestage stroom routinematig kenniswerk op een niveau dat de meeste teams niet van het vlaggenschip kunnen onderscheiden. De snelle tier neemt vervolgens de last met hoog volume en lage inzet over, de classificatie en tagging en bulkverwerking die duizenden keren per uur draait, waar snelheid en kosten per oproep meer tellen dan de laatste paar punten capaciteit. Stem de tier af op de taak en je geeft geld uit waar het het resultaat verandert.

Hoe een ondernemer echt zou moeten kiezen

Je hoeft geen versienummers bij te houden om deze beslissing goed te nemen. Je hebt een korte regel nodig. Vraag wat er gebeurt als het antwoord verkeerd is. Als een verkeerd antwoord duur is, traag te detecteren of moeilijk terug te draaien, stuur de taak dan naar het vlaggenschip. Als een verkeerd antwoord goedkoop te spotten en te herstellen is, dan is de middentier de juiste keuze en is de besparing reeel. Als de taak op groot volume draait en elke oproep lage inzet heeft, is de snelle tier daar precies voor gebouwd. Dezelfde logica geldt of je nu standaardiseert op de Claude-familie of de GPT-familie, want beide leveren dezelfde drie rollen.

De valkuil is kopen op naam. Alles standaardiseren op het vlaggenschip betekent dat je over duizenden routine-oproepen te veel betaalt voor capaciteit die nooit wordt gebruikt. Alles standaardiseren op het model in de koppen betekent dat je stilletjes de handvol lastige problemen onderbedient die het binnenhalen van AI uberhaupt rechtvaardigden. Geen van beide is een strategie. De ondernemers die dit goed doen, behandelen de tier als een bewuste keuze per werklast, op dezelfde manier waarop ze nooit de senior partner aan het fotokopieren zouden zetten of de fusie aan de stagiair zouden overlaten.