Nová generace umělé inteligence pro generování obrázků od OpenAI přináší něco, co vývojáři dlouho jen slibovali: možnost vytvářet smysluplné a vizuálně přesné produkce. GPT-4o už tedy nevytváří jen abstraktní scény, na kterých je umělost ještě stále vidět, ale generuje snímky , které mají dobrou výpovědní hodnotu.
Novinkou je přesnost zpracování zadaného textu. Vývojáři tvrdí, že AI nyní mnohem lépe rozumí kontextu a dokáže tak vygenerovat nejen vizuálně přitažlivé obrázky, ale takové, které lépe odpovídají zadání.
Vzhledem k tomu, že generování obrázků je integrováno do GPT-4o, mohou být výstupy zdokonalovány a doplňovány o detaily v přirozené konverzaci chatu. A umělá inteligence dokáže zpracovávat obrázky a text ve stejném duchu a ve stejné kvalitě. Když je například navržena postava do videohry, její vzhled zůstává konzistentní ve více iteracích. Uživatel ji tak může zdokonalovat a experimentovat.
we are launching a new thing today—images in chatgpt!
— Sam Altman (@sama) March 25, 2025
two things to say about it:
1. it's an incredible technology/product. i remember seeing some of the first images come out of this model and having a hard time they were really made by AI. we think people will love it, and we…
Žádné tabu, žádné zábrany
Uživatelé nové verze si už stačili všimnout jedné zajímavé vlastnosti – nový systém se nebojí kontroverzních témat. Díky minimálním omezením můžete vytvářet obrázky celebrit, politiků, a dokonce i jejich karikatury.

Sam Altman, šéf OpenAI, ostatně sám připustil, že nástroj umožňuje vytvářet „opravdu úžasné věci", které mohou některé lidi i pohoršit. A uživatelé toho s nadšením využívají – sociální sítě jsou plné obrázků veřejně známých osobností.
Jak to funguje?
Za vylepšením stojí nový tréninkový postup. Model byl podle tvůrců vycvičen na souboru obrázků s texty a chápe tak vizuální kontext novým způsobem. Výsledkem je přirozená „vizuální plynulost". Umělá inteligence tak už nepracuje jen s izolovanými daty, ale vnímá jejich vzájemné souvislosti.
Generování obrázků pomocí GPT-4o je nyní dostupné předplatitelům v ChatGPT a Sora. Sora je produkt OpenAI pro generování videí pomocí umělé inteligence. Podle OpenAI bude tato funkce brzy k dispozici i uživatelům ChatGPT Plus a dokonce i neplatícím uživatelům.

Výzva: Realistická podmořská scéna s delfíny proplouvajícími okny opuštěného vagonu metra s přesně nasimulovanými bublinami a detailním prouděním vody.
Vygenerováno v OpenAI GPT-4o
Výzva: Realistická fotografie koně cválajícího zprava doleva po rozlehlé klidné hladině oceánu, která přesně zobrazuje šplouchání, odrazy a jemné vlnky pod kopyty. Přehánějte pohyby koně, ale vše ostatní by mělo být klidné, tiché, aby vynikl kontrast se silou koně. čistá kompozice, filmová. Široká, panoramatická kompozice ukazující vzdálený horizont. Atmosférická perspektiva vytvářející hloubku. zvětšená tak, aby se kůň zdál nepatrný ve srovnání s obrovským oceánem.
Vygenerováno v OpenAI GPT-4oČlánek obsahuje prvky vygenerované AI