Waarom kwam Willem van Oranje in opstand tegen de Spanjaarden? Hoe kijkt Cleopatra terug op haar leven? En wat vindt Napoleon van zijn nalatenschap? Vragen die je jezelf kunt stellen, maar waar geschiedenisboeken maar mondjesmaat antwoord opgeven. En dan moet je ook nog eens dikke pillen doorlezen. Daar is natuurlijk niets mis mee, maar als je echt in gesprek wilt met historische figuren om ze dit soort vragen te stellen dan gaat dat niet lukken met een boek.
De creativiteit van AI
Gelukkig is er nu AI, en in het bijzonder generatieve AI. We kunnen taalmodellen als GPT-4.1 of Claude Sonnet de opdracht geven zich in te leven in een historisch personage en antwoord geven alsof ze dit personage zijn, compleet met hun karaktertrekken. En dat is precies het idee van de podcast Tussen droom en data: de interviewer voert een gesprek met Willem van Oranje, Cleopatra of Napoleon.
Uiteraard zijn de mogelijkheden eindeloos: dubbelinterviews zijn mogelijk (Cleopatra en Julius Caesar tegelijk interviewen) of juist de rollen omdraaien en jezelf laten interviewen door Ischa Meijer bijvoorbeeld. Als je zelf creatieve ideeën hebt, hoor ik het graag! Laat ze achter via het formulier.
Technische toelichting voor liefhebbers
Hieronder een plaatje dat ongeveer de workflow weergeeft van een podcast-interview met een historisch figuur.

Nadat een vraag gesteld is wordt een speech-to-text model aan het werk gezet via Replicate. Daarna beantwoord een large language model (LLM), in dit geval GPT-4.1 van OpenAI, de vraag alsof de LLM echt Willem van Oranje is (in dit voorbeeld). Vervolgens zet een text-to-speech model van Resemble AI het antwoord om met de stem van Willem, bij benadering natuurlijk want we weten niet zijn echte stem.
Een potentieel probleem is dat een LLM niet alles kan weten: zijn (? waarom kiezen we toch vaak voor een mannelijke vorm?) kennis beperkt zich tot wat er in de parameters van het model zelf zit en soms verzint hij ook dingen, het zogenaamde hallinuceren. Om dat op te lossen heb ik er een lusje met Perplexity aan toegevoegd. Op basis van de vraag gaat Perplexity zoeken naar bronnen en die worden als input aan GPT-4.1 meegegeven, want die maakt er dan een creatief antwoord van. Perplexity is dus de onderzoeker en GPT-4.1 de verteller.
Nog technischere toelichting van modelkeuzes
- speech-to-text: incredibly-fast-whisper (via Replicate, open source model van OpenAI). Dit is gewoon een supersnel transcriptiemodel dat goede resultaten geeft en via Replicate spotgoedkoop is.
- feiten: sonar-pro van Perplexity. Bij mijn weten is Perplexity ongeëvenaard als het om bronnen zoeken gaat. Gecombineerd met een redelijke geprijsde API is dit mijn model als het om feiten zoeken gaat.
- creativiteit: GPT-4.1 van OpenAI. Met pijn in het hart, omdat ik wel een Claude fan boy ben, heb ik nu voor GPT-4.1 gekozen. Claude Sonnet 3.7 gaf gewoon hele lange antwoorden die soms wel erg afdwaalden. GPT-4.1 geeft natuurlijker antwoord alsof het bijna een echt gesprek is, hoewel er zeker nog ruimte voor verbetering is. En GPT-4.1 is een stuk bondiger dan Claude.
- text-to-speech: voice design via Resemble AI. De workflow tijdens de opnames is met GPT-4o-mini-tts van wederom OpenAI. Dat is omdat ik een beperkt aantal minuten per maand de API van Resemble kan gebruiken. En soms moeten vragen/afleveringen gewoon opnieuw en dan is het zonde van het minutenbudget dat ik heb. De reden om voor productie Resemble te kiezen is omdat GPT-4o-mini-tts te instabiel is: de stem verandert teveel, niet alleen tussen de antwoorden maar ook tijdens het antwoord. Daarnaast valt de voice design van Resemble beter te prompten. ElevenLabs heb ik ook overwogen, maar die zijn helemaal duur.
