Klasická cesta nestačí
Moorův zákon, který desetiletí určoval tempo vývoje procesorů, ztrácí dech. Výrobci čipů narážejí na fyzikální limity křemíku a každé zlepšení výkonu znamená technické problémy a vysoké investice. Právě proto některé firmy hledají zcela nové přístupy.
Mezi nimi je i firma Neurophos z texaského Austinu, která vsadila na optiku. Firma vyvíjí takzvanou optickou procesorovou jednotku (OPU), která místo elektronů pracuje se světlem. Podle jejich tvrzení by měla dosáhnout výkonu 470 petaFLOPS při výpočtech s nízkou přesností FP4 a INT4. To je přibližně desetinásobek toho, co nabízejí nejnovější čipy Rubin od Nvidie. A to vše při stejné spotřebě.
Chce to menší tranzistory
Šéf Neurophos Patrick Bowen vysvětluje, že tradiční optické komponenty mají zásadní problém. Jsou příliš velké. Standardní optický tranzistor vyráběný současnými křemíkovými továrnami měří zhruba dva milimetry. Na čip se jich prostě nevejde tolik, aby dokázaly konkurovat klasickým tranzistorům.
Neurophos ale vyvinul metamateriálové optické modulátory v měřítku mikrometrů, které jsou podle firmy asi desetitisíckrát menší než současné protějšky. První čip s těmito komponenty získali v květnu a ukázal, že technologie funguje se standardním výrobním procesem CMOS. To znamená, že by výroba byla možná v již existujících továrnách.
Jeden obří tenzorový procesor
Z těchto miniaturních optických tranzistorů Neurophos postavil optickou verzi tenzorového jádra, tedy specializované jednotky pro maticové výpočty, které jsou srdcem dnešních AI akcelerátorů. Zatímco běžné GPU obsahují desítky nebo stovky relativně malých tenzorových jader o velikosti maximálně 256×256 výpočetních prvků, Neurophos má na čipu jediné obří jádro o rozměrech 1000×1000 prvků.
To samo o sobě zabírá asi 25 čtverečních milimetrů. Zbytek čipu zabírá podpůrná architektura jako vektorové jednotky a paměť SRAM. Ty musí toto jediné, ale extrémně výkonné jádro zásobovat daty. Klíčová je přitom frekvence. Optické jádro běží na 56 gigahertzech, což je řádově víc než u běžných GPU. A protože samotné násobení matic probíhá opticky, spotřebovává energie jen převod mezi digitálním a analogovým signálem.
První výroba začne v roce 2028
První procesor s kódovým označením Tulkas T100 má mít 768 GB vysokorychlostní paměti HBM a při plném zatížení spotřebovat 1 až 2 kilowatty. To jsou zatím pouze cíle, nikoli realita. Čip je stále ve vývoji a do sériové výroby má jít až v polovině roku 2028. I tehdy firma neplánuje masovou produkci, ale spíš tisíce kusů.
Nasazení vidí Neurophos v takzvané prefill fázi zpracování velkých jazykových modelů. To je výpočetně náročná část, kdy se zpracovávají vstupní tokeny, než model začne generovat odpověď. Na podobný úkol vyvíjí Nvidia svůj akcelerátor Rubin CPX. Bowen si představuje, že by jeden rack s 256 čipy Tulkas mohl pracovat společně s rackem Nvidie NVL576. Na druhou fázi, tedy samotné generování textu, se firma chce zaměřit až později.
Do nápadu investoval Bill Gates
Na důkaz toho, že jejich nápady fungují, firma pracuje na demonstračním čipu. Právě ten má potvrdit deklarované výpočetní výkony a spotřebu energie.
Na jeho vývoj právě získala 110 milionů dolarů, tedy zhruba 2,5 miliardy korun. Investiční kolo série A vedl fond Gates Frontier, který patří Billu Gatesovi. Mezi investory se objevil i venture fond Microsoftu M12, dále Carbon Direct, Aramco Ventures, Bosch Ventures a další.
Marc Tremblay z Microsoftu, který má na starosti infrastrukturu pro AI, k tomu řekl, že moderní inference modelů umělé inteligence vyžaduje obrovské množství energie a výpočetního výkonu. Podle něj je potřeba průlom srovnatelný s pokrokem, který zaznamenaly samotné AI modely.
Od neviditelných plášťů k AI čipům
Zajímavá je cesta, kterou technologie prošla. Před dvaceti lety profesor David R. Smith z Duke University použil metamateriály k vytvoření skutečného pláště neviditelnosti. Ten sice nefungoval jako ten z Harryho Pottera, ale ukázal možnosti pokročilé materiálové vědy v oblasti elektromagnetismu.
Neurophos je spin-off právě z Duke University a inkubátoru Metacept, který Smith vede. Metamateriálové modulátory, které firma vyvinula, staví na tomto výzkumu.
Neurophos vstupuje na trh ovládaný firmou Nvidia, nejhodnotnější veřejně obchodovanou firmou na světě. Další společnosti jako Lightmatter také pracují na fotonice, i když některé přešly spíš na propojovací systémy. Bowen je ale přesvědčený, že metamateriálové modulátory poskytují dostatečnou konkurenční výhodu. Podle něj všichni ostatní, včetně Nvidie, pokračují v evoluční cestě vázané na pokrok výrobce TSMC. Ten v průměru zlepšuje energetickou účinnost svých výrobních uzlů o 15 procent každé dva roky.
Zdroj: Neurophos, The Register, TC, Datacenter dynamics, Gizmochina, Techspot