Een productietool voor AI-voices met nauwkeurige timing, cues en SRT-ondersteuning
TTSSyncApp is een tool voor het genereren van AI-voice-overs waarbij timing en synchronisatie centraal staan. De applicatie is ontwikkeld voor video’s, cursussen en andere producties waar gesproken tekst moet aansluiten op beeld of tijdcodes.
In plaats van één lange tekst kan de tool ook werken met cues: tekstblokken gekoppeld aan tijdsintervallen. Dit voorkomt timing-drift en maakt gerichte aanpassingen eenvoudig.
TTSSyncApp gebruikt Azure Text-to-Speech en biedt toegang tot honderden AI-stemmen in verschillende talen. Wanneer een stem in een bepaalde regio niet beschikbaar is, kan automatisch of handmatig een andere regio worden gekozen.
De tool is ontworpen om te werken met tijdsblokken met tekst. Cues kunnen handmatig worden aangemaakt of automatisch worden geladen vanuit een .srt-bestand.
Daarnaast is er een vrije modus voor lange teksten zonder cues, bijvoorbeeld voor proefluisteren of experimenten met stemmen.
Van elke tekst — per cue of als geheel — kan een audiobestand worden gegenereerd. De output is een WAV-bestand, geschikt voor verdere verwerking in video- en audiobewerkingssoftware.
-->
Tijdens het produceren van lessen merkte ik dat TTS pas echt “productiewaardig” wordt als je de input strak organiseert: korte cues, logisch ritme, consistente lengte. TTSSyncApp is ontstaan om dat proces te automatiseren en herhaalbaar te maken, zodat ik sneller kan produceren met minder synchronisatiegedoe.