Hoe werkt de methode?

Hoe het transcript wordt geanalyseerd.

Wat doet het taalmodel precies, waar kijkt het naar, en hoe komt het tot een score? Eén analysekaart volledig uitgelegd.

Het uitgangspunt

Geen orakel, wel een gestructureerd instrument.

Een vraag die vrijwel iedereen stelt die overweegt dit traject in te gaan: wat doet de AI eigenlijk? Vat hij gewoon mijn verhaal samen? Maakt hij een interpretatie op basis van wat hij ergens uit z'n training heeft? Het antwoord is nee, en het verschil tussen die nee en wat er wel gebeurt is het verschil tussen serieuze patroonherkenning en een leuke gimmick.

Het taalmodel werkt niet vrij. Het krijgt drie soorten input. Het transcript van het studio-interview, alleen de beurten van de geïnterviewde. De intakegegevens die context geven aan dat transcript. En een set van dertien analysekaarten plus een masterprompt die per stap precies voorschrijft wat er gedaan moet worden. De analyse is dus geen vrije interpretatie van wat het model van jou denkt, maar een herhaalbare procedure die op iedere geïnterviewde op dezelfde manier wordt toegepast.

Wat het model goed kan, is patronen herkennen in taal. Hoe vaak een leider in ik spreekt versus wij. Of een verhaal concrete personen en momenten bevat of in algemene principes blijft. Of een specifieke vraag werkelijk wordt verwerkt in het antwoord, of dat de leider terugvalt op een eerder geoefende formulering. Of metaforen consistent of incidenteel zijn. Het zijn precies dit soort observaties die in een vragenlijst over jezelf onzichtbaar blijven, en juist sterk uit een transcript te halen zijn.

Wat het model niet doet, en niet mag doen, is een diagnose stellen. Het rapport rondt iedere bevinding af met een ankervraag, niet met een conclusie. En de uitkomst gaat altijd langs Glenn voordat het debriefgesprek begint, zodat fragmenten worden gecontroleerd op zorgvuldigheid en context.

De procedure

Zeven stappen, voor elke dimensie opnieuw.

Voor iedere van de dertien dimensies volgt het model dezelfde procedure. Die staat expliciet in de masterprompt, in de bot-instructies onder iedere kaart, en in de scoringsrichtlijn die per kaart is uitgewerkt.

  1. Stap 1

    Kaart lezen

    De relevante analysekaart wordt volledig gelezen voordat er wordt gescoord. Iedere kaart bevat een kernvraag, een wetenschappelijke verankering, een set meetbare subfacetten met bijbehorende taalmarkers, een vijfpuntsscoringsrichtlijn, en een aparte sectie over hoe authentiek gedrag onderscheiden wordt van sociaal wenselijke presentatie. De kaart is de bron, niet de algemene kennis van het model.

  2. Stap 2

    Transcript doorzoeken

    Het transcript wordt doorzocht op passages die voor deze dimensie relevant zijn. Bij Besluitvorming gaat het om verhalen over keuzemomenten en handelen onder druk. Bij Luistervaardigheid om de momenten waarop de interviewer een onverwachte of uitdagende vraag stelt. Bij Authenticiteit om alle expliciete waardenuitingen en de bijbehorende gedragsbeschrijvingen.

  3. Stap 3

    Taalmarkers toepassen

    Per relevant fragment worden de taalmarkers uit de kaart toegepast. Welke woorden, structuren of patronen wijzen op een hoge score? Welke wijzen op een lage score? Hoe vaak komen ze voor, en hoe consistent zijn ze door het transcript heen?

  4. Stap 4

    Authenticiteitstoets

    De authenticiteitstoets wordt uitgevoerd. Gedraagt het patroon zich anders bij geoefend materiaal dan bij doorvragen? Verschilt de helderheid van succesverhalen met die van falensverhalen? Verandert het taalgebruik op het moment dat een vraag buiten het verwachte repertoire valt?

  5. Stap 5

    Score toekennen

    Een score op de vijfpuntsschaal wordt toegekend. De score is niet een gemiddelde van markers, maar een gewogen oordeel op basis van frequentie, consistentie en authenticiteit.

  6. Stap 6

    Fragmenten selecteren

    Minimaal twee onderbouwende fragmenten worden geselecteerd, bij voorkeur één sterk en één aandachtspunt. Elk fragment krijgt een tijdcode, zodat het in de opname is terug te vinden.

  7. Stap 7

    Hypothese formuleren

    De bevinding wordt geformuleerd als hypothese, met een korte ontwikkelreflectie en een afsluitende ankervraag voor het debriefgesprek.

Dit gebeurt voor elk van de dertien dimensies opnieuw. Pas daarna wordt het syntheseprofiel opgesteld dat de patronen over de dimensies heen verbindt.

Een concreet voorbeeld

De kaart Authenticiteit en Congruentie.

Om te laten zien hoe dit in de praktijk werkt, doorlopen we hieronder volledig hoe één van de dertien kaarten wordt toegepast. We kiezen voor Authenticiteit en Congruentie, omdat deze kaart de centrale spanning van het instrument het zuiverst illustreert: het verschil tussen wat een leider over zichzelf zegt en wat zij of hij feitelijk laat zien in beschrijvingen van eigen gedrag.

Wat de kaart meet

De kernvraag is eenvoudig: zijn de uitgedragen waarden consistent met het beschreven gedrag in concrete situaties? Iedere leider zegt waardenuitspraken in een interview. Voor mij is openheid heel belangrijk. Ik geloof in mensen ruimte geven. Ik ben iemand die het team voorop zet. De kaart meet niet of die uitspraken oprecht zijn bedoeld. De kaart meet of de gedragsverhalen die later in het gesprek volgen die uitspraken ondersteunen of ondergraven.

De kaart valt uiteen in vier subfacetten. Zelfkennis en zelfbewustzijn: worden zowel sterke als zwakke kanten benoemd, of blijft de zelfbeschrijving uitsluitend positief? Waarden-gedrag congruentie: worden waarden gekoppeld aan concrete momenten waarin ze de leider iets hebben gekost, of blijven ze declaratief? Narratieve coherentie: is er een herkenbare rode draad door het gesprek heen, of valt het verhaal in fragmenten uiteen? Spontaniteit versus sociale wenselijkheid: is er aarzeling, zelfcorrectie en ongemak bij moeilijke vragen, of zijn de antwoorden te glad en te compleet?

De taalmarkers waar het model naar kijkt

Voor elk subfacet bevat de kaart concrete signalen die op een hoge of lage score wijzen. Bij Waarden-gedrag congruentie, om bij dat ene subfacet te blijven, ziet het model er als volgt naar.

Hoge score: een waarde wordt benoemd én gekoppeld aan een concrete situatie waarin die waarde aantoonbaar gedrag heeft gestuurd, vaak inclusief een moment waarop de leider er iets door verloren heeft. Ik vind transparantie heel belangrijk. Vorig jaar hadden we een tegenvallend kwartaal en ik heb dat in een teamoverleg eerlijk opengelegd, terwijl onze externe communicatie nog op een positieve toon stond. Dat heeft me bij de directie een lastig gesprek gekost. Hier zit de waarde, het concrete moment, en het zichtbaar verlies.

Lage score: een waarde wordt declaratief benoemd zonder dat er gedrag aan vasthangt, of het bijbehorende gedragsverhaal staat in conflict met de uitgedragen waarde. Voor mij is openheid een kernwaarde. Daar bouw ik mijn hele leiderschap op. Punt. Daarna komt er geen verhaal dat dit toont. Of er volgt een verhaal waarin de leider beschrijft hoe hij of zij een conflict heeft afgehandeld door het in eigen kring te houden, zonder die spanning te erkennen.

Een nog scherper signaal is wat in de kaart de temporele marker heet. Ik bij successen en wij of het bij mislukkingen is een van de sterkste incongruentiepatronen. Het is een patroon dat zich nauwelijks bewust laat sturen, en juist daarom analytisch waardevol. Een leider die zegt dat hij het team altijd op de eerste plaats zet, maar in het succesverhaal over een productlancering consistent in ik spreekt en in het verhaal over een mislukte reorganisatie consistent overschakelt op we hadden niet voorzien dat, laat in de pronoun-keuze meer zien dan in het waardenstatement zelf.

De authenticiteitstoets

Iedere kaart bevat een aparte sectie waarin het verschil tussen authentiek gedrag en sociale wenselijkheid wordt uitgewerkt. Bij Authenticiteit en Congruentie zijn vier signalen het sterkst.

  • Specificiteit. Authentieke verhalen bevatten concrete personen, momenten en gevolgen. Sociaal wenselijke verhalen bestaan uit principes en algemene observaties.
  • Consistentie onder druk. Een geoefend antwoord blijft soepel zolang het binnen het voorbereide terrein blijft. Bij doorvragen op een onverwacht punt valt de structuur weg, en verschuift de leider naar abstractie of jargon.
  • Eigenaarschap bij falen. Authentieke faalverhalen bevatten een beschrijving van eigen aandeel zonder dat het direct wordt opgelost in een nette les. Sociaal wenselijke faalverhalen eindigen vrijwel altijd in een succesvolle leerstap, vaak binnen één alinea.
  • Verdraagzaamheid voor stilte. Authentieke kwetsbaarheid laat een ongemakkelijk moment ongemakkelijk. Sociaal wenselijke kwetsbaarheid relativeert direct, of voegt een kwinkslag toe.

Hoe een score tot stand komt

Stel dat het model in een transcript de volgende twee fragmenten heeft gemarkeerd. Beide gaan over een moment waarop de leider werd geconfronteerd met een conflict in het team. Voor de leesbaarheid in onderstaande tabel zijn ze ingekort.

Fragment Tijdcode Label
Ik vind het belangrijk dat mensen tegen mij durven in te gaan. Vorig jaar zat ik in een directieoverleg waar ik mijn voorstel had uitgewerkt, en mijn financieel directeur zei dat ze het inhoudelijk niet steunde. Dat raakte me, want ik had er weken aan gewerkt. Ik heb een dag rondgelopen met irritatie. Toen heb ik haar opgezocht en gevraagd of ze de bezwaren nog eens uit kon leggen. Twee weken later hebben we een aangepaste versie ingediend en die was beter. Maar ik heb ook moeten erkennen dat ik in eerste instantie vooral wilde dat ze me steunde, niet dat ze meedacht. 0:23:14 Sterk
Openheid is voor mij een kernwaarde. Ik geloof er heilig in dat je als leider veiligheid moet creëren waarin mensen alles kunnen zeggen. Dat probeer ik elke dag uit te dragen. Mijn team weet dat ik altijd benaderbaar ben. 0:38:42 Aandacht

Wat het model bij het eerste fragment opmerkt: de waarde mensen tegen mij in laten gaan wordt verankerd in een concreet moment, met een concrete persoon, een concreet eigen gevoel (irritatie), een tijdsverloop (een dag rondlopen) en een eigen aandeel dat eerlijk wordt benoemd (ik wilde vooral dat ze me steunde). Dat laatste is het cruciale signaal: de leider beschrijft niet alleen wat er is gebeurd, maar erkent een minder fraai aandeel van zichzelf in het verhaal. Dit voldoet aan alle vier signalen van de authenticiteitstoets: specificiteit, consistentie ook bij ongemakkelijk materiaal, eigenaarschap, en verdraagzaamheid voor het ongemak in het verhaal zelf.

Wat het model bij het tweede fragment opmerkt: de waarde openheid wordt declaratief benoemd. Er staat een algemeen principe (veiligheid creëren waarin mensen alles kunnen zeggen) en een algemene actie (dat probeer ik elke dag uit te dragen), maar geen enkel concreet moment, geen specifieke persoon, geen situatie waarin die waarde de leider iets heeft gekost. De zin mijn team weet dat ik altijd benaderbaar ben is bovendien een claim over wat het team denkt, niet een observatie van wat het team toont. Dit is een herkenbaar patroon van waardenverankering zonder gedragsanker.

Op basis van deze twee fragmenten alleen kan nog geen totaalscore worden gegeven, maar er ontstaat een hypothese. Bij doorvragen op concrete situaties laat de leider sterke congruentie zien (eerste fragment); bij open vragen die ruimte laten voor abstractie verschuift hij naar declaratieve waardentaal (tweede fragment). Dat patroon vraagt vervolgens om bevestiging of ontkenning in andere passages van het transcript. Komt het vaker voor dat hij sterk is op concrete vragen en zwakker op abstracte? Verschuift hij bij vragen over falen weer terug naar concrete eigenaarstaal, of valt hij dan opnieuw in algemeenheden? Pas als het patroon over meerdere passages heen consistent is, wordt het in de eindrapportage als onderbouwde score opgenomen.

In dit hypothetische geval zou de uitkomst kunnen zijn: een score van vier op vijf op Authenticiteit en Congruentie, met als gespreksvraag voor de debrief de observatie dat de leider zijn beste werk laat zien op concrete vragen en bij abstracte vragen terugvalt op declaratieve taal. Niet een oordeel, maar een patroon dat in het debriefgesprek getoetst wordt aan de eigen herkenning van de leider.

De controlelaag

De rol van de mens in dit proces.

Een belangrijk punt om hier over te zeggen: het taalmodel levert een conceptanalyse, geen eindrapport. Voordat het rapport naar de geïnterviewde gaat, wordt het gecontroleerd. Kloppen de geselecteerde fragmenten met de context waaruit ze zijn genomen? Zijn de tijdcodes correct? Is er recht gedaan aan een nuance die het model uit de context heeft losgeknipt? Zit er een passage in die analytisch interessant lijkt, maar in het bredere gesprek anders ligt?

Deze controlestap is geen formaliteit. Het is de plek waar de combinatie van een gestructureerde taalanalyse en menselijk oordeel haar werk doet. Het model is sterk in patroonherkenning over duizenden woorden tegelijk, maar zwakker in het wegen van sociale en culturele context. De interviewer kent de geïnterviewde, kent het gesprek dat is gevoerd, en kent de toon waarin bepaalde uitspraken zijn gedaan. Die controlelaag voorkomt dat een patroon dat technisch klopt maar in praktische zin scheef ligt, het rapport haalt.

Pas na deze kwaliteitscontrole wordt het rapport opgemaakt en aan de geïnterviewde verstuurd. En pas in het debriefgesprek wordt de uiteindelijke betekenis van de patronen samen vastgesteld. Het taalmodel is daarmee niet de auteur van het oordeel, maar het instrument waarmee een groot transcript op een herhaalbare en wetenschappelijk verankerde manier wordt ontleed.

Het verschil

Waarom dit anders is dan veel andere AI-toepassingen.

Dat lijkt een detail, maar het is wezenlijk. Veel AI-toepassingen vragen het taalmodel om een open inschatting: wat denk jij van deze leider. Dat type vraag levert een antwoord op dat klinkt alsof het ergens vandaan komt, maar in werkelijkheid een mengeling is van trainingsdata, prompt en toeval. De uitkomst is moeilijk te toetsen, niet herhaalbaar, en kwetsbaar voor het cliché dat het model toevallig boven brengt.

Het Leiderschapsinterview werkt expliciet anders. Het taalmodel mag niet zelfstandig oordelen. Het volgt voor iedere dimensie een vaste procedure, raadpleegt een vaste kennisbase, gebruikt vaste taalmarkers, scoort op een vaste schaal, en levert verplicht onderbouwende fragmenten met tijdcode. Iedere uitspraak in het rapport is herleidbaar naar het transcript en naar de kaart waaruit de meting komt. Dat maakt het model controleerbaar, en dat is de voorwaarde om het serieus te kunnen gebruiken.

De claim is dus niet dat AI iets over je heeft begrepen. De claim is dat een gestructureerde, wetenschappelijk verankerde analyseprocedure is uitgevoerd op een rijk transcript, met een mens die de uitkomst checkt en met jou als degene die het patroon herkent of niet herkent. Dat is wat dit instrument is, en alles eromheen is een poging om die kern zo zorgvuldig mogelijk uit te voeren.

Verder lezen

Bekijk de dertien analysekaarten.

Welke patronen meten we in welke laag, en op welk wetenschappelijk onderzoek rust elke kaart?

Naar de dertien kaarten