ArtsenkrantPremium

Onder de motorkap van ChatGPT

In het tijdperk van taalmodellen kan AI betekenisvolle teksten genereren, dankzij training op basis van enorme hoeveelheden tekst. In de geneeskunde kan dat zorgen voor gepersonaliseerde aanbevelingen.

Data center AI IA
© GettyImages

Generatieve artificiële intelligentie (AI), die chatbots zoals ChatGPT en beslissingsondersteunende systemen aanstuurt, werkt fundamenteel anders dan  'klassieke' zoekmachines zoals Google. Deze maken gebruik van trefwoorden en werken met eenvoudige lexicale matching. Het algoritme beperkt zich tot het vinden en classificeren van documenten die exact het ingevoerde trefwoord bevatten.

AI in Artsenkrant?

Ook in de geneeskunde is artificiële intelligentie niet meer weg te denken. Daarom verzorgt Dr. Carl Vanwelde voortaan een vaste rubriek voor Artsenkrant over dit onderwerp.
We zijn ons bewust van de ethische dilemma's en ecologische impact van bestaande AI-oplossingen, maar denken dat we AI niet kunnen negeren. Uw reacties zijn welkom bij de redactie (ak@pmg.be).
Artsenkrant & Carl Vanwelde

Taalmodellen

Als er vandaag sprake is van AI, gaat het vaak over large language models (LLM's) zoals ChatGPT. Als u deze gebruikt om informatie op te zoeken, gaan ze niet zomaar op zoek naar overeenkomstige trefwoorden. Ze kunnen de betekenis en bedoeling van de zoekopdracht 'begrijpen', inclusief nuances en context.

Die paradigmaverschuiving is gebaseerd op een specifieke aanpak en technische concepten. Ten eerste de creatie van een gigantisch en divers corpus aan data, waaronder teksten, afbeeldingen, wetenschappelijke artikelen, klinische rapporten, medische publicaties, boeken, enzovoort.

De kwaliteit en relevantie van de gegevens in dat trainingscorpus zijn cruciaal, omdat deze de enige 'kennis' van AI vormen.

De kwaliteit en relevantie van de gegevens in dat trainingscorpus zijn cruciaal, omdat ze de enige 'kennis' van AI vormen. Dit is ongetwijfeld de grootste beperking: AI is niet in staat om content te 'creëren' die niet eerder door menselijke intelligentie is gecreëerd. Een ander ethisch probleem is de oorsprong van de gegevens: helaas zijn deze soms zonder veel scrupules gekopieerd uit de catalogi van literaire of wetenschappelijke uitgevers, perswebsites, online encyclopedieën zoals Britannica en Wikipedia,...

Het gewicht van verbindingen

De volgende stap, het verwerken van dat trainingscorpus in een enorme digitale molen (een informele term voor deep learning), is net zo belangrijk. Elk woord, concept of afbeelding in het corpus wordt omgezet in een vector (een reeks getallen) die verbindingen toevoegt en naar andere termen verbindt. Deze verbindingen krijgen een bepaald gewicht toegekend op basis van de voorspelbaarheid van hun associatie.

Een voorbeeld? Neem het woord 'muis' en de primaire betekenissen ervan: een klein knaagdier, een aanwijsapparaat dat verbonden is met een computer, een deel van een duim, een informele term voor een jong meisje, snoepgoed dat op beschuit gegeten wordt. Niet al deze betekenissen zijn even frequent in het dagelijks gebruik. Ze zullen daarom een ander gewicht krijgen. 

AI zoekt niet naar een exact trefwoord; ze verkent het semantische landschap dat ze heeft opgebouwd.

Elk van deze betekenissen (knaagdier, computermuis, enz.) zal ook individueel verrijkt worden met andere verbindingen die de relaties tussen nabijheid en betekenis modelleren: het kleine knaagdier door verbindingen met de woorden veldmuis, rat, kat, val, kaas, enz. te noemen, terwijl de computermuis geassocieerd zal worden met de woorden pc, computer, draadloos, rechtsklikken, Bluetooth, RSO, ergonomie, enz.

Wanneer u nu het woord 'muis' in een vraag aan een chatbot zoals ChatGPT gebruikt,  zoekt de AI niet louter naar dat exacte trefwoord; ze verkent het semantische landschap dat ze heeft opgebouwd en schrijft het meest plausibele antwoord op basis van de trainingsgegevens en de gewogen verbindingen die aan elk van de termen zijn toegewezen. Concreet: als u een vraag stelt over beschuit met muisjes, 'weet' het model zo dat u het niet hebt over knaagdieren en computeraccessoires. Bij onduidelijkheid zal u eventueel gevraagd worden om de vraag te herformuleren of te verduidelijken, zodat de meest geschikte semantissche context gevonden wordt.

De samenstelling van het corpus en het daaropvolgende proces van deep learning berusten op de voorafgaande verwerking van talloze gegevens (teksten, afbeeldingen, geluiden) die eerst gesorteerd en gelabeld werden door mensen. Die onzichtbare en vaak onderbetaalde menselijke werkkracht is een voorwaarde voor zogenaamde "artificiële" intelligentie.

Een voorbeeld van klinische beslissingsondersteuning: longkanker

In de medische praktijk kunnen deze taalmodellen gebruikt worden ter ondersteuning van de diagnose. De gegevens en beeldvorming van de patiënt (radiologie, dermatologie, pathologie, cytologie, bacteriologie, enz.) kunnen worden vergeleken met cohorten van vergelijkbare patiënten en medische literatuur, om gepersonaliseerde klinische aanbevelingen op te stellen

Een goed voorbeeld van wat AI nu al kan bieden op het gebied van klinische beslissingsondersteuning is de behandeling van niet-kleincellige longkanker (NSCLC) om de therapeutische aanpak te personaliseren. Ongeacht de persoonlijke expertise van het zorgteam zal het moeilijk zijn om alle onderzoeksgegevens die over duizenden vergelijkbare gevallen zijn gepubliceerd, te synthetiseren.

AI grijpt hierbij in op het niveau van de invoer van patiëntgegevens zoals beeldvorming, biomarkers en resultaten van genomische sequentietests (bijv. EGFR-, ALK-, PD-L1-mutaties), maar ook hun voorgeschiedenis (leeftijd, comorbiditeiten, eerdere behandelingen). Vervolgens stelt AI een analyse voor van het beschikbare wereldwijde corpus en de miljoenen geanonimiseerde records, klinische onderzoeken en wetenschappelijke tijdschriftartikelen.

Door de beeldvorming, het moleculaire profiel en de klinische voorgeschiedenis van de patiënt te vergelijken met alle vergelijkbare gevallen in de kennisbank, stelt AI een lijst met mogelijke behandelingen voor. Deze behandelingen worden gerangschikt op basis van de meest recente klinische gegevens en de waarschijnlijkheid van succes (responspercentage, progressievrije overleving).

Aan uw toetsenbord: een praktische oefening
Genoeg theorie, nu is het uw beurt. Om oude zoekmodellen voor trefwoorden en een generatief AI-taalmodel te vergelijken, kiest u een traditionele zoekmachine zoals Yahoo en voert u de zoektermen aanbeveling, pomerol en cru classé in. Kijk wat er verschijnt.
Gebruik nu  Google en voer "hoe kies ik een grand cru classé uit de regio Pomerol?" in. Google heeft zijn eigen AI-model, Gemini, geïntegreerd. Daarom krijgt u bovenaan de zoekresultaten direct een beknopt antwoord. Dit is wat een ervaren wijnhandelaar of wijnkenner u zou vertellen.

Wat heb je nodig

Krijg GRATIS toegang tot het artikel
of
Proef ons gratis!Word één maand gratis premium partner en ontdek alle unieke voordelen die wij u te bieden hebben.
  • checkwekelijkse newsletter met nieuws uit uw vakbranche
  • checkdigitale toegang tot 35 vakbladen en financiële sectoroverzichten
  • checkuw bedrijfsnieuws op een selectie van vakwebsites
  • checkmaximale zichtbaarheid voor uw bedrijf
Heeft u al een abonnement? 
Geschreven door Dr. Carl Vanwelde23 oktober 2025

Meer weten over

Print Magazine

Recente Editie
09 september 2025

Nu lezen

Ontdek de nieuwste editie van ons magazine, boordevol inspirerende artikelen, diepgaande inzichten en prachtige visuals. Laat je meenemen op een reis door de meest actuele onderwerpen en verhalen die je niet wilt missen.

In dit magazine