Menu

CORTEX – A15: výkon (nejen) na cesty

CORTEX – A15: výkon (nejen) na cesty

Spousta tabletů a smartphonů brzy dostane do vínku silnější CPU postavené na nové architektuře. ARM Cortex­A15 téměř zdvojnásobí výpočetní výkon těchto přístrojů.
      MARKUS MANDAU  

Od smartphonů a tabletů se očekává, že videa přehrají plynule a programy spustí okamžitě. K tomu potřebují výkonný procesor, který právě mnoho tabletů s OS Android – ať už verze 3, nebo 4 – postrádá a kvůli čemuž se tyto přístroje při exekuci náročnějších úloh často nezdravě zadýchávají. Jedná se o hromadný jev, neboť drtivá většina mobilních procesorů od výrobců jako Apple, nVidia či Samsung je postavena na stejné, licencované architektuře od ARM Limited – společnosti, která má v této oblasti prakticky monopol. Během posledních dvou let se design mobilních CPU v podstatě neměnil, jen se zvyšoval počet jader a drtivá většina byla postavena na návrhu Cortex­A9.
Nároky na mobilní zařízení však vzrostly především kvůli displejům s vyšším rozlišením, přehrávání HD filmů a výpočetně náročnějším hrám. ARM proto přišlo s novým designem, Cortex­ ­A15 je uzpůsoben k uspokojení těchto požadavků. Většina výrobců hodlá stavět své budoucí procesory právě na tomto designu. ARM v něm odstranilo několik úzkých hrdel známých z A9. Snižování framerate při přehrávání náročnějších videí by mělo být minulostí, neboť operace s plovoucí desetinou čárkou jsou integrovány přímo v pipeline A15 (viz schéma na protější straně). V A9 byla tato vymoženost pouze volitelná a někteří výrobci ji do svých čipů nezahrnuli (například nVidia do svého modelu Tegra 2), což se projevovalo již zmiňovaným poklesem framerate.

Delší pipeline

Pipeline je srdcem každé procesorové architektury a pomáhá během jediného taktu simultánně zpracovávat několik suboperací. Čím více je pipeline zaplněna, tím rychleji zpracovává procesor programový kód. Pipeline architektura A15 má až 24 stupňů, zatímco u A9 to bylo maximálně 12 stupňů. Toto má svůj smysl, neboť A15 je navržena pro vyšší taktovací frekvence až do 2,5 GHz a dokáže tak v praxi výrazně zrychlit běh programů i přehrávání videa.
Výrazným hybatelem tohoto zrychlení bude také přechod ze 40nm výrobního procesu na 28nm, jehož bychom se měli dočkat ještě letos. Díky menším rozměrům tak budou výrobci moci zvýšit taktovací frekvenci čipů, aniž by zároveň zvýšili také odpadní teplo. Pipeline rozhoduje i o tom, kolik operací – od nahrání a dekódování až po spuštění – musí instrukce absolvovat. Má­li CPU pracovat maximálně efektivně s delší pipeline, je mu třeba zadat ke zpracování co nejvíce instrukcí. Jelikož má pipeline Cortex­A15 minimálně 15 stupňů, znamená to, že jeho kapacitu naplníme při provádění 15 různých instrukcí na takt. Zároveň lze vykonávat až osm paralelních aritmetických operací. Při zpracovávání těchto instrukcí je využíváno vždy jiného stupně pipeline.
Společnost ARM vyvinula A15 jako vysoce výkonný procesor. Produkovaný 40nanometrovou výrobní technologií stále využívá stejně energie jako předchůdce A9 (28nm výrobní technologie). ARM výrobcům procesorů v rámci vyšší úspornosti doporučuje využít principu „big. LITTLE“, což znamená spojit dohromady dvě silná jádra s architekturou A15 se dvěma slabšími. Jádra A15 by pak byla využívána pouze při výpočetně náročných operacích, v opačném případě by zůstala vypnutá. Tak se prodlouží životnost baterie.

Pro notebooky a servery

S taktovací frekvencí až 2,5 gigahertzu není výpočetní výkon procesorové architektury Cortex­A15 omezen jen na využití ve smartphonech a tabletech. Jeho výhoda tkví ve velmi nízké spotřebě, která činí nějakých 1 až 1,6 wattu na jádro. To je dáno i tím, že ARM procesory jsou chlazeny pasivně. S procesorem A15 tak notebook poběží na jedno nabití přibližně stejně dlouho jako tablet, což je o několik hodin více než s CPU od Intelu či AMD. Analogicky lze hovořit o úsporných serverech, které vykonávají výpočetně méně náročné úlohy. V takovém případě přijde vhod, že technologie paměťového řadiče (LPAE) umožňuje adresovat až 1 TB operační paměti a počítá pro ni s podporou korekce chyb, což využijete právě u ECC (Error Correction Code) pamětí využívaných v serverech. Šířka sběrnice je 128 bitů, což je dostatečné pro rychlý přenos dat mezi jednotlivými jádry. Navíc Cortex­A15 disponuje hardwarovou podporou virtualizace – i to se může hodit.
       autor@chip.cz

SROVNÁNÍ: A9 VERSUS A15
Většina mobilních zařízení dnes staví na procesorové architektuře a procesorech A9. Budoucí tablety a smartphony poběží na architektuře Cortex­A15 a novějších.

PLÁN PROCESORU CORTEX A15
V téměř všech tabletech a smartphonech má návrh architektury CPU – ARM – na svědomí společnost ARM Limited. Licenci na využívání této architektury si posléze kupují výrobci, jako jsou Samsung a nVidia. Nyní nastal čas pro upgrade na novou platformu ARM A15, která nahrazuje stávající A9, na níž jsou postaveny současné procesory, jež jsou použity například i v přístrojích iPhone a iPad.

NOVÉ PROCESORY
CPU Qualcomm Snapdragon S4 je prvním procesorem postaveným na architektuře A15 a nachází se kupříkladu v novém smartphonu HTC One S. V druhé polovině letošního roku budou následovat OMAP 5 od Texas Instruments a Exynos 5250 vyvíjený Samsungem. NVidia plánuje uvedení čipu Tegra 4 až na rok 2013 a Apple chystá využití svého připravovaného čtyřjádrového CPU A6 až v nové generaci iPadů a iPhonů.

ARCHITEKTURA
S příchodem nové architektury ARM se taktovací frekvence čipů Cortex­A15 zvýšila z 1,5 až na maximálních 2,5 GHz. To vyžaduje delší a pružnější pipeline pro zpracování instrukcí. Délka pipeline posléze určuje, kolik operací lze vykonat během hodinového cyklu. Takto to funguje:

RYCHLEJŠÍ NAČTENÍ INSTRUKCÍ
V první části pipeline jsou instrukce zpracovávány „in­order“, tj. v pořadí, ve kterém jsou přijaty. Dekodér rozdělí delší instrukce do kratších úseků. Na rozdíl od A9 umí A15 zároveň poslat ke zpracování místo dvou tři paralelní instrukce. Architektura má dvoustupňovou L­cache, přičemž první stupeň má 32 bitů pro data a 32 bitů pro instrukce. L2 pak může dosahovat kapacity až 4 MB.

PARALELNÍ VÝPOČTY
Výhodou architektury A15 je to, že umí zpracovávat instrukce i „out­of­order“. To znamená, že procesor může měnit pořadí zpracovávaných instrukcí v rámci dosažení maximální efektivity. Zároveň lze vykonávat až osm paralelních aritmetických operací, což je dvojnásobek oproti A9. Operace s plovoucí desetinou čárkou jsou integrované v architektuře A15 a zajišťují tak dvojnásobnou kapacitu.