Přejít k hlavnímu obsahu

Úžasná AI: aplikace od Microsoftu popíše zrakově postiženým okolí

Pavel Trousil 06.12.2023
info ikonka
Zdroj: Vygenerováno v Midjourney

S aplikací Seeing AI od Microsoftu zvládne fotoaparát mobilního telefonu mnohem víc než jen pořizovat videa a fotografie. Aplikace totiž dokáže číst text, rozpoznávat předměty v okolí a dokonce identifikovat osoby a odhadnout jejich věk. Je určena především na pomoc nevidomým a slabozrakým. Bohužel v češtině funguje jen omezeně.

Kapitoly článku

Aplikace Microsoftu "Seeing AI" dokáže pro zrakově postižené popsat okolí. Výzkumný projekt byl vyvinut speciálně pro nevidomé a slabozraké lidi a využívá možností umělé inteligence, aby jim zpřístupnil vizuální svět a popsal osoby, přečetl texty a upozornil na předměty v jejich okolí.

Mobilní aplikace "Seeing AI" je pro telefony iPhone k dispozici už od jara 2019, ale od té doby se neustále vyvíjí. V minulých dnech byla v obchodě Google Play poprvé zdarma ke stažení také verze pro Android.
 

Seeing AI
info ikonka
Zdroj: Screenshot z aplikace Seeing AI, redakce
Aplikace Seeing AI toho zvládne opravdu hodně. Umí prozkoumat okolí, přečíst text, čárové kódy a popsat co je kolem.

"Seeing AI" lze využít v mnoha každodenních situacích. Můžete si například nechat předčítat krátké texty (cedule, poznámky) i celé dokumenty nebo při nakupování skenovat čárové kódy, abyste získali více informací o výrobku.

Seeing AI
info ikonka
Zdroj: Screenshot z aplikace Seeing AI, redakce
Na prvním snímku je rozhraní aplikace, kde je možné vybrat jednu z funkcí. Objekty v interiéru rozpozná opravdu dobře.

Aplikace v současné době rozpoznává následující (podle popisu výrobce):

  • Krátký text: přečte text nahlas, jakmile se objeví před kamerou.
  • Dokument: text se zobrazí na obrazovce a aplikace poskytuje zvukovou asistenci při snímání tištěné stránky a rozpoznává text spolu s jeho původním formátováním. Text si můžete nechat přečíst. 
  • Produkt: vydává zvukové efekty, aby se vám podařilo správně zaměřit fotoaparát na čárové kódy. Podle nich pak produkt identifikuje a napíše a řekne, o jaký jde. Dokáže pak dohledat další informace na internetu.


 

Seeing AI
info ikonka
Zdroj: Screenshot z aplikace Seeing AI, redakce
Take v exteriéru si vede velmi dobře a správně popíše okolí.
  • Osoba: Rozpozná přátele a popíše lidi ve vašem okolí včetně jejich emocí.
  • Scéna: Experimentální funkce pro popis scény kolem vás.
  • Měna: Rozpoznává bankovky a jejich měnu při placení v hotovosti. Bohužel česká měna v seznamu není. 
  • Barva: Popíše barvu na kterou je zaměřen fotoaparát.
  • Světlé: Vytváří akustický tón, který odpovídá jasu ve vašem okolí
     
Seeing AI
info ikonka
Zdroj: Screenshot z aplikace Seeing AI, redakce
Může také uživatele pomocí zvuků nasměrovat k čárovému kódu, naskenovat ho a podle něj vyhledat informace o zboží. Může také prozkoumat už uložené obrázky, nebo obrázky z jiných aplikací a popsat je.

Obrázky z jiných aplikací: pokud máte v telefonu nějaký obrázek či fotografii, nebo vám přijde třeba poštou, stačí klepnout na "Sdílet" a "Rozpoznat pomocí Seeing AI" a obrázky z e-mailů, fotografií, Twitteru a dalších si můžete nechat aplikací popsat.

"Seeing AI" funguje prostřednictvím umělé inteligence založené na cloudu. Neustálým používáním se shromažďuje velké množství dat, která by měla umožnit další zlepšování aplikace v průběhu času.
 

Seeing AI
info ikonka
Zdroj: Screenshot z aplikace Seeing AI, redakce
Bohužel mezi podporovanými jazyky není čeština. Aplikace je sice schopna dobře naskenovat a rozpoznat český text, ale přečte ho s anglickou výslovností. S anglickou výslovností také popisuje okolí a obsah obrázků. Chtělo by to použít jiný jazykový modul. Nepodporuje také českou měnu.

Bohužel s češtinou si aplikace neporadí. Dobře rozpozná text a přepíše ho na displeji, ale přečte ho s anglickou výslovností. U barev to lze ještě rozluštit, ale takto přečtený delší text se bohužel rozpoznat moc nedá. Přitom v nastavení aplikace to vypadá, že by bylo možné vybrat jiný modul pro převod textu na řeč. To se nám ale nepodařilo. Pokud by bylo možné přepnout na modul od Googlu s podporou češtiny, byla by aplikace skutečně užitečná i pro česky mluvící uživatele. 

Přesto je to zajímavá aplikace, kterou lze použít například jako skener s OCR a pro rozpoznávání obsahu obrázků. Za vyzkoušení určitě stojí.

Zdroj: Microsoft, Apple, Google Play


Máte k článku připomínku? Napište nám

Sdílet článek

Mohlo by se vám líbit








Všechny nejnovější zprávy

doporučujeme