Přejít k hlavnímu obsahu
Novinky

Doba automaticky přepisové lidské řeči se přiblížila

redakce 01.03.2010

Texty v češtině lze vytvářet i diktováním do mikrofonu. Alternativa k psaní na klávesnici již asi dva roky usnadňuje práci všem, kteří vytvářejí delší texty s pomocí NewtonDictate, systému pro rozpoznávání hlasu a přepis lidské řeči do textové podoby v češtině. Vyvinula ho společnost Newton Technologies společně s týmem vědců na Technické univerzitě v Liberci se záměrem, že své primární zákazníky najde zejména v oblasti soudnictví a advokacie, státní správy, zdravotnictví či médií, což se v praxi potvrzuje.

Teprve současný pokrok v oblasti vývoje procesorů a souvisejícího hardwaru však umožňuje plně využívat potenciál systému a zvýšit jeho účinnost. „Mezi přesností 85 a 90 procent sice na papíře není významný rozdíl, ale v praxi je podstatný. Až přesnost na úrovni 90–95 % totiž povyšuje systém NewtonDictate nad schopnosti profesionální zapisovatelky.“ uvedl Petr Herian, generální ředitel Newton Technologies.
Nové procesory Intel Core, které společnost Intel uvedla na trh v lednu 2010, pomáhají zvýšit rychlost celého počítače a tím i hlasového systému NewtonDictate. Zatímco u předchozích konfigurací počítače bylo v nastavení aplikace nezbytné předem definovat, zda bude mluvčím muž nebo žena či rozdělovat slovníky pro jednotlivé obory, s novými procesory z řady Core toto odpadá. V praxi to znamená, že s novými procesory se u systému NewtonDictate ještě více zkracuje prodleva mezi řečí a jejím zápisem, přičemž není třeba nijak omezovat software. Slovník, který v současnosti obsahuje půl milionu slov a je neustále doplňován, tak může narůst – v případě potřeby – i na dvojnásobek.
Dosažení „svatého grálu“ všech výzkumníků v oblasti rozpoznávání řeči, jímž je spolehlivý přepis hovorové řeči, kterou běžně slyšíme kolem nás, se dá podle Petra Heriana očekávat v horizontu 3–5 let. Dosažení tohoto milníku stojí v cestě například podmínka, že při diktování na mikrofon musí mluvčí v současnosti svůj hlas přece jen stylizovat a zřetelně vyslovovat, aby byl přepis úspěšný. V budoucnu se zvýší šance na potlačení všech rušivých prvků prostředí, akustických a fonetických vlivů či nejednoznačného kontextu. Procesory na této dobrodružné cestě objevů určitě sehrají klíčovou roli.

Chronologie významných dat v oboru rozpoznávání řeči a vývoje systému NewtonDictate

  • březen 1993 Intel Pentium, první procesor pro PC zvládající multimédia, předzvěst dnešních PC.
  • 1994 Na Technické univerzitě v Liberci se dává dohromady tým vědců v oboru rozpoznávání řeči pod vedením profesora Jana Nouzy.
  • 2005 Tým vědců z Liberce představuje první funkční prototyp systému na diktování plynulou řečí v češtině.
  • 2006 Společnost Newton Media zahajuje spolupráci s týmem profesora Nouzy. Zatímco vědci z Liberce poskytují vlastní „engine“ pro přepis řeči, vkladem společnosti Newton Media je hlasový korpus.
  • květen 2008 Na Právnické fakultě Masarykovy univerzity v Brně je obhájena první diplomová práce nadiktovaná hlasem.
  • červenec 2006 Intel představuje výkonné procesory Core
  • srpen 2008 České soudy testují rozdílné hlasové systémy, NewtonDictate s oborovým slovníkem uspěje ve výběrovém řízení vyhlášeném Ministerstvem spravedlnosti ČR.
  • leden 2009 Nasazení 1600 licencí systému NewtonDictate na soudech a státních zastupitelstvích.
  • leden 2010 Intel představuje novou řadu inteligentních procesorů Intel Core, které jsou schopné zvyšovat výkon celého počítače a současně spořit energii. Spolehlivost NewtonDictate běžícího na hardwaru s těmito procesory se pohybuje nad úrovní 95 %.
  • 2011 Uvedení nové architektury čipů Sandy Bridge, která opět posune hranice výkonu počítačů a umožní ještě plynulejší rozpoznávání řeči.

Máte k článku připomínku? Napište nám

Sdílet článek

Mohlo by se vám líbit








Všechny nejnovější zprávy

doporučujeme


články odjinud