Pacient T15 získává zpět hlas
Dosavadní mozkové implantáty měly několik zásadních omezení. Fungovaly pomalu, často s velkým zpožděním, a byly omezené na předem definovaný slovník. Navíc nedokázaly zachytit jemnosti mluveného projevu jako je intonace nebo rytmus řeči. Nový systém tyto problémy překonává tím, že se zaměřuje na tvorbu zvuků namísto výběru slov.
Testování nové technologie probíhalo s 46letým mužem označovaným jako T15, který trpí amyotrofickou laterální sklerózou (ALS). Toto onemocnění postupně paralyzuje svaly včetně těch, které ovládají řeč. T15 byl již těžce ochrnutý a když se pokoušel mluvit, bylo možné porozumět jen asi pěti procentům jeho slov.
Do mozkové oblasti odpovědné za ovládání svalů hlasového traktu mu bylo implantováno 256 mikroelektrod. Tyto elektrody snímají aktivitu jednotlivých neuronů s nejvyšším možným rozlišením. Signály z mozku jsou pak zpracovávány umělou inteligencí, která je převádí na řečové charakteristiky jako je výška hlasu nebo znělost.

Technologie s minimálním zpožděním
Hlavním úspěchem výzkumníků bylo dosažení nízkého zpoždění - pouhých 10 milisekund mezi mozkovým signálem a výstupním zvukem. To znamená prakticky okamžitý převod myšlenek na řeč. Systém používá speciální algoritmus zvaný vokodér, který syntetizuje řeč tak, aby zněla podobně hlasu, který měl pacient T15 před onemocněním.
Díky tomuto přístupu může pacient říct cokoliv, včetně slov, která nejsou ve slovníku, nebo různých citoslovcí jako „hmm“. Dokáže dokonce modulovat intonaci pro vyjádření otázek nebo zazpívat krátkou melodii. Tato flexibilita představuje rozdíl oproti předchozím systémům omezeným na předem definované výrazy.
Slibné výsledky s prostorem pro zlepšení
První testy prokázaly významný pokrok. Když posluchači měli vybrat správnou větu ze šesti možností na základě syntetizované řeči, úspěšnost byla stoprocentní. Ovšem při obtížnějším testu, kdy měli přepsat syntetizovaná slova bez nápovědy, byla chybovost stále 43,75 procenta. I to však představuje obrovské zlepšení oproti původní řeči T15, kde chybovost dosahovala více než 96 procent.
Výzkumníci vidí současný systém především jako důkaz, že jdou správnou cestou. Pro běžnou komunikaci ale ještě není systém dostatečně spolehlivý. Vědci věří, že použití většího počtu elektrod by mohlo výrazně zlepšit přesnost - místo současných 256 elektrod by budoucí systémy mohly využívat tisíce senzorů.
Několik společností již připravuje klinické studie pokročilejších systémů. Startup Paradromics například vyvíjí systém s 1600 elektrodami speciálně určený pro syntézu řeči a již žádá o povolení úřadů. Tyto studie by měly probíhat na Kalifornské univerzitě v Davisu pod vedením týmu, který vytvořil současný průlomový systém.
Zdroj: Nature, Researchgate, arichlife, Ars Technica
Článek obsahuje prvky vygenerované AI