Přejít k hlavnímu obsahu

Přepis řeči pomocí aplikace Whisper

Pavel Trousil 19.04.2026
AI
Zdroj: Firefly

Whisper je model umělé inteligence, který rozpoznává řeč a převádí ji do textové podoby. Díky tomu lze hudební skladby, nahrávky ze schůzek, diktáty nebo podcasty během chvilky převést do textové podoby nebo přeložit.

Chip 05/2026: AI Whisper sice pochází od OpenAI, stojí ale tak trochu ve stínu známějšího ChatGPT. Jedná se o open-source model pro rozpoznávání mluvené řeči. Trénink je založen na rozsáhlém a rozmanitém datovém souboru obsahujícím 680 000 hodin vícejazyčných anotovaných dat z internetu. 

Podle OpenAI vede tento přístup k vysoké odolnosti vůči přízvukům, šumu v pozadí a odborné terminologii, takže Whisper dobře rozpoznává řeč i na hlučných místech a při více mluvčích. Whisper je k dispozici v různých velikostech a lze jej provozovat lokálně na vlastním počítači. Díky tomu se žádné hlasové údaje nedostanou zpět na servery OpenAI. To dává smysl, protože hlasové nahrávky obsahují biometrické údaje: na rozdíl od hesla si svůj hlas nemůžete resetovat. 

Whisper rozumí 99 jazykům včetně češtiny a dokáže převést anglický i cizojazyčný zvukový záznam na anglický text a také přepsat neanglický zvukový záznam, například exportovat španělskou skladbu jako španělský text. Díky přepisu lze obsah zvukového nebo video souboru prohledávat. Jak přesně to funguje a jak si Whisper nainstalovat do svého počítače se dozvíte v Chipu 5/2026.
Další témata Chipu 05/2026


Máte k článku připomínku? Napište nám

Mohlo by se vám líbit








Všechny nejnovější zprávy

doporučujeme


bezpečnost

Tipy a triky