Chip 05/2026: AI Whisper sice pochází od OpenAI, stojí ale tak trochu ve stínu známějšího ChatGPT. Jedná se o open-source model pro rozpoznávání mluvené řeči. Trénink je založen na rozsáhlém a rozmanitém datovém souboru obsahujícím 680 000 hodin vícejazyčných anotovaných dat z internetu.
Podle OpenAI vede tento přístup k vysoké odolnosti vůči přízvukům, šumu v pozadí a odborné terminologii, takže Whisper dobře rozpoznává řeč i na hlučných místech a při více mluvčích. Whisper je k dispozici v různých velikostech a lze jej provozovat lokálně na vlastním počítači. Díky tomu se žádné hlasové údaje nedostanou zpět na servery OpenAI. To dává smysl, protože hlasové nahrávky obsahují biometrické údaje: na rozdíl od hesla si svůj hlas nemůžete resetovat.
Whisper rozumí 99 jazykům včetně češtiny a dokáže převést anglický i cizojazyčný zvukový záznam na anglický text a také přepsat neanglický zvukový záznam, například exportovat španělskou skladbu jako španělský text. Díky přepisu lze obsah zvukového nebo video souboru prohledávat. Jak přesně to funguje a jak si Whisper nainstalovat do svého počítače se dozvíte v Chipu 5/2026.
Další témata Chipu 05/2026
Koupit časopis Chip
Chip je možné číst v tištěné nebo v digitální podobě na mobilech, tabletech a počítačích.