Galerie: Technologie převádí myšlenky na řeč: pacienti díky ní znovu mluví

Další fotogalerie

Ajťák radí: Těchto 5 aplikací ze svého mobilu hned vymažte, nejsou vám k ničemu

Máte ve svém mobilním telefonu málo paměti? Ukážeme vám, které aplikace můžete b...

Silný konkurent pro Warzone? První dojmy z battle royale Battlefieldu RedSec

Společnost EA vypustila nový battle royale režim pro úspěšný Battlefield 6. Ten ...

TOP 7 novinek na víkend: Tyhle filmy a seriály vás na Halloween přikovají k televizi

Na streamovací platformy v Česku dorazila další várka skvělých seriálů a filmů, ...

Ajťák radí: Pět programů pro vaše Windows – jsou zdarma a budou se vám hodit

Každý uživatel Windows má své oblíbené programy, se kterými rád pracuje a které ...

Platby v obchodě už nikdy nebudou stejné: Přichází nová technologie NFC 15

Bezkontaktní placení využívá v Česku pravidelně více než polovina populace, ale ...

Technologie převádí myšlenky na řeč: pacienti díky ní znovu mluví

Pavel Trousil 03.07.2025

Vědci z Kalifornské univerzity v Davisu dosáhli významného pokroku v oblasti mozkových implantátů. Vyvinuli zařízení, které dokáže téměř okamžitě převádět mozkové signály přímo na řeč. Na rozdíl od předchozích systémů, které překládaly myšlenky pouze do textu na obrazovce, tato technologie vytváří skutečné zvuky a slova.

Pacient T15 získává zpět hlas

Dosavadní mozkové implantáty měly několik zásadních omezení. Fungovaly pomalu, často s velkým zpožděním, a byly omezené na předem definovaný slovník. Navíc nedokázaly zachytit jemnosti mluveného projevu jako je intonace nebo rytmus řeči. Nový systém tyto problémy překonává tím, že se zaměřuje na tvorbu zvuků namísto výběru slov.

Testování nové technologie probíhalo s 46letým mužem označovaným jako T15, který trpí amyotrofickou laterální sklerózou (ALS). Toto onemocnění postupně paralyzuje svaly včetně těch, které ovládají řeč. T15 byl již těžce ochrnutý a když se pokoušel mluvit, bylo možné porozumět jen asi pěti procentům jeho slov.

Do mozkové oblasti odpovědné za ovládání svalů hlasového traktu mu bylo implantováno 256 mikroelektrod. Tyto elektrody snímají aktivitu jednotlivých neuronů s nejvyšším možným rozlišením. Signály z mozku jsou pak zpracovávány umělou inteligencí, která je převádí na řečové charakteristiky jako je výška hlasu nebo znělost.

Syntéza hlasu z mozkové aktivity u pacienta s ALS: a) Neuroprotéza mozek-hlas. Neurální signály ze čtyř implantovaných elektrod byly dekódovány v reálném čase a přímo syntetizovaly hlas. b) Umístění elektrod v levé hemisféře mozku a typické neurální signály z každé elektrody. c) Proces syntézy hlasu: napětí byla vzorkována při 30 kHz, extrakce příznaků z 1ms segmentů, následné zpracování v 10ms intervalech. Transformer dekodér převedl neurální příznaky na parametry řeči (pitch, hlas), které vocoder použil k syntéze zvuku. d) Trénink: kvůli nemožnosti přirozené řeči pacienta T15 vytvořili syntetickou řeč z textových podnětů a sladili ji s neurální aktivitou na úrovni slabik. e) Výsledek: syntetizovaná řeč z neurálních dat s vysokou věrností odpovídala cílové řeči. Shrnutí: Systém umožňuje pacientům s ALS přímo ovládat syntézu hlasu pomocí mozkové aktivity v reálném čase.

Technologie s minimálním zpožděním

Hlavním úspěchem výzkumníků bylo dosažení nízkého zpoždění - pouhých 10 milisekund mezi mozkovým signálem a výstupním zvukem. To znamená prakticky okamžitý převod myšlenek na řeč. Systém používá speciální algoritmus zvaný vokodér, který syntetizuje řeč tak, aby zněla podobně hlasu, který měl pacient T15 před onemocněním.

Díky tomuto přístupu může pacient říct cokoliv, včetně slov, která nejsou ve slovníku, nebo různých citoslovcí jako „hmm“. Dokáže dokonce modulovat intonaci pro vyjádření otázek nebo zazpívat krátkou melodii. Tato flexibilita představuje rozdíl oproti předchozím systémům omezeným na předem definované výrazy.

Mohlo by vás zajímat

Neuralink úspěšně implantoval mozkový čip druhému pacientovi

Novinky

Slibné výsledky s prostorem pro zlepšení

První testy prokázaly významný pokrok. Když posluchači měli vybrat správnou větu ze šesti možností na základě syntetizované řeči, úspěšnost byla stoprocentní. Ovšem při obtížnějším testu, kdy měli přepsat syntetizovaná slova bez nápovědy, byla chybovost stále 43,75 procenta. I to však představuje obrovské zlepšení oproti původní řeči T15, kde chybovost dosahovala více než 96 procent.

Výzkumníci vidí současný systém především jako důkaz, že jdou správnou cestou. Pro běžnou komunikaci ale ještě není systém dostatečně spolehlivý. Vědci věří, že použití většího počtu elektrod by mohlo výrazně zlepšit přesnost - místo současných 256 elektrod by budoucí systémy mohly využívat tisíce senzorů.

Několik společností již připravuje klinické studie pokročilejších systémů. Startup Paradromics například vyvíjí systém s 1600 elektrodami speciálně určený pro syntézu řeči a již žádá o povolení úřadů. Tyto studie by měly probíhat na Kalifornské univerzitě v Davisu pod vedením týmu, který vytvořil současný průlomový systém.

Zdroj: Nature, Researchgate, arichlife, Ars Technica

Článek obsahuje prvky vygenerované AI