Vyzkoušeli jsme to na vlastní kůži. Šest nejrozšířenějších a zdarma dostupných nástrojů – Gemini, ChatGPT, Copilot, Claude, DeepSeek a Perplexity – dostalo za úkol projít čtyři různé konzumační lístky, na každém řada položek a u každé z nich čárky označující počet kusů.
Nic mimořádného. Přesně ten typ papíru, který vám číšník předloží ke konci večera, když chcete mít předem představu, kolik to tentokrát vyjde. A výsledky? Ani jeden nástroj neobstál stoprocentně.
Jak AI vlastně „vidí" obrázek
Aby bylo jasné, o co se vlastně jedná, stojí za to krátce vysvětlit, jak moderní AI s obrázky pracuje. Když jí pošlete fotku, neprojde ji jednoduše jako skener. Model nejprve udělá celkový průzkum - určí základní kontext záběru.
Pak rozloží obraz na vrstvy, oddělí popředí od pozadí a identifikuje objekty a jejich vztahy. Následuje detailní analýza: textury, barvy, osvětlení, symboly. Pokud je na obrázku text, spustí se OCR – optické rozpoznávání znaků. Nakonec to vše model propojí a pokusí se odpovědět na váš dotaz. Na papíře to zní spolehlivě. V praxi to ovšem naráží na limity, které nejsou hned vidět.
Lístek jako test
Konzumační lístek je na první pohled jednoduchý dokument. Primitivní tabulka s názvy nápojů a jídel, vedle každé položky sloupec čárek. Nebo jen čárky, když je jasné o co jde. Čárky jsou ale malé, blízko u sebe, řada z nich podobná jako vejce vejci. Někdy se dokonce překrývají.
Večer, při horším světle, unaveni po celém dni, se často pletou a splývají. Od čeho tu máme AI? Stačí lístek vyfotit, předhodit ji umělé inteligenci a požádat, ať spočítá útratu za vás. Pro AI by to přece neměl být žádný problém - nebo aspoň se to tak zdá.
Opak je ale pravdou. Modely sice většinou bez problémů přečetly názvy položek a jejich ceny, ale sečíst správně počty čárek jim dělalo velké potíže. Chybovaly přitom různými způsoby – někdy čárky přehlédly, jindy je naopak přepočítaly. U hustěji zaplněných lístků se chyby násobily. Výsledný součet se pak od skutečné útraty lišil v řádu desítek korun, v mnoha případech i o stovky korun. A někdy prostě AI ani nebyla schopna pochopit, o co nám šlo.
Kdo si vedl nejlépe?
Ne stoprocentně, ale v testu se dařilo Gemini od Google. V prvním příkladu se sekla jen o jednu čárku u položky „55“. Čárek tam není šest, ale jen pět. Takže celkovou útratu vypočítala na 886 Kč i když správně to mělo být 831.
V druhém příkladu, a to poměrně náročném, si vedla výborně. Všechny mezisoučty i celkový výsledek na jedničku. Takhle kdyby to šlo vždycky.
Ve třetím příkladu jsme si mysleli, že se některá AI zeptá na celkem nejasnou položku u čárek. Ani Gemini se nezeptala a odpověděla, že na lístku je celkem 13 čárek. No není. Je jich 15. Řádek pod tím už AI zcela ignorovala. Poslední příklad, počítání čárek, opět na jedničku.
Co ti ostatní?
Umělá inteligence ChatGPT zadání pochopila, ale prošla se dvěma chybami. První konzumační lístek spočítala na 737 Kč i když správně je to 831. Ve druhém případě jedna chyba a celkový výsledek 1009 Kč namísto správných 1062. Ale jako kvalifikovaný odhad to stačí.
Ve třetím případě spočítala 14 čárek místo patnácti a druhou řadu opět zcela ignorovala. Poslední test – počítání čárek – zvládla bez problémů. Osm čárek.
Copilot také zadání správně pochopil. V některých případech udělal pěknou tabulku a spletl se jen o čárku či dvě. Takže v prvním příkladě vypočetl celkovou útratu na 743 Kč (správně je to 831 Kč).
Ve druhém příkladu se špatně zorientoval a nerozlišil ceny a počty. Po slovním vysvětlení už to bylo lepší a celkovou útratu ocenil na 1 118 Kč místo 1 062 Kč. Čárka sem, čárka tam. Třetí příklad se nepovedl vůbec. Místo útraty se jako výsledek objevil nesmyslný vzorec se zlomky. Jak na tohle AI přišla? V posledním pak nesmyslně napočítal 18 čárek místo osmi.
Umělá inteligence Perplexity v tomto zadání selhala. DeepSeek se na tyto úlohy také nehodí. První příklad sice s chybami prošel, ale při počítání čárek jen sdělil, že žádný text nebyl extrahován.
Claude (Sonnet 4.6) není špatný. Pochopil, spočítal a mnohdy sám uznal, že čárky vidí jen přibližně. Takže výsledek nebyl špatný, ale ani v jenom případě správný. První lístek spočítal na 941 Kč místo 831 Kč, druhý na 1 168 Kč místo 1 068 Kč, ve třetím „viděl“ 14-15 čárek a ve čtvrtém deset čárek místo osmi.
Proč to AI dělá tak špatně
Přesný počet drobných čárek vedle sebe patří k věcem, kde strojové vidění stále chybuje. Není to náhoda. Modely jsou trénovány na obrovském množství různorodých dat, ale hustý rastr drobných identických značek – jako právě sloupce čárek na konzumačním lístku – představuje specifický problém. Podobně jako lidský mozek může být zmaten moiré efektem nebo optickou iluzí, AI modely mohou v takových situacích počítat nespolehlivě.
K tomu přistupuje kvalita fotografie. Snímek pořízený telefonem ve večerním světle restaurace je daleko od ideálu. Rozmazání, odlesk, šum v obrazu – to vše skrytě degraduje přesnost OCR a zároveň ztěžuje spolehlivé napočítání čárek.
Paradoxně přitom tytéž nástroje zvládají úlohy, které by se lidskému oku zdály mnohem obtížnější. Rozpoznají druh rostliny z rozmazané fotky, popíšou styl architektonického detailu nebo odhadnou, o jakou emoci jde na portrétu. Ale čárky na konzumačním lístku? To je jiná disciplína.
Mohlo by vás zajímat
Pozná AI dílo jiné AI? Google Gemini nově dokáže odhalovat obrázky vytvořené umělou inteligencí
Trochu filozofie na závěr: automyčka a cesta pěšky
AI selhání u konzumačního lístku připomíná jiný, dnes už klasický příklad. Chatbotům se zadá otázka: „Automyčka je čtyřicet metrů od mého domu. Chci umýt auto. Mám tam jít pěšky, nebo jet autem?" Správná odpověď je samozřejmě jet autem – jinak ho neumyjete. Řada modelů ale odpoví, že je výhodné jít pěšky, protože vzdálenost je malá. Zapomene, že se auto musí k myčce nějak dostat.
Jde o ukázkový případ takzvaného zdravého rozumu, který AI stále chybí. Modely jsou výjimečně dobré v oblastech, kde existuje velké množství trénovacích dat a jasně definované vzory. Jakmile ale narazí na situaci, která vyžaduje prostý selský úsudek, mohou totálně selhat.
Spolehnutí zatím není
Výsledky testu nejsou důvodem k poplašným závěrům. AI se rychle vyvíjí a dnešní slabiny nemusí být slabinami za rok. Ostatně ještě nedávno neuměly tyto nástroje ani přibližně rozeznat text v obrázku – dnes to zvládají poměrně dobře. Přesné počítání drobných grafických prvků je technický problém, který půjde pravděpodobně vyřešit.
Ale zatím: než se v restauraci budete spoléhat na AI asistenta, raději si čárky přepočítejte sami. Nebo požádejte číšníka. Jemu se čárky nepletou - alespoň doufejme.
Zdroj: redakce, Cybernews
Tak se AI ukaž. Zadání znělo jednoduše - "Spočítej útratu".
Vygenerováno v Gemini, redakce
Další tři konzumační lístky, se kterými si měla umělá inteligence poradit. V posledním případě zněl úkol "Spočítej čárky".
redakce Chip
ChatGPT v této disciplíně podává poměrně dobré výsledky, ale opět na ní není spoleh.
screenshot, redakce
PŘEJÍT DO GALERIE
(8 FOTOGRAFIÍ)