Další inovace v oblasti AI – rychlý přehled zásadních novinek
Technologičtí giganti OpenAI, Microsoft, Meta a Apple přinášejí na trh další inovace v oblasti umělé inteligence. Od pokročilých chatbotů a nástrojů pro generování videí až po finanční asistenty a virtuální avatary, tyto novinky slibují zefektivnit práci a otevřít nové možnosti pro byznys i osobní použití. Řada z těchto technologií ještě není venku a proto jejich kvalitu zatím známe pouze zprostředkovaně. Pojďme se podívat na některé z nich.
Nová verze ChatGPT-4o
OpenAI, přední společnost v oblasti umělé inteligence, představila novou verzi svého populárního chatbota ChatGPT, a to zcela zdarma. Tato vylepšená varianta přináší řadu revolučních funkcí, které posouvají AI na další úroveň. Jednou z klíčových novinek je schopnost vést hlasové konverzace v reálném čase, a to s lidsky působící rychlostí odezvy pouhých 320 milisekund. Kromě hlasu dokáže ChatGPT-4o také analyzovat obrázky a videa, které mu uživatel poskytne, a vést o nich smysluplný dialog. ChatGPT-4o tak může sloužit jako konverzační partner, který vám např. pomůže procvičovat cizí jazyk. Dokáže vymyslet personalizované cvičení, vysvětlit gramatiku, poskytovat překlady nebo například pomoci s vaší výslovností.
Google Gemini
Po letošní keynote Google I/O byl zpřístupněn model Gemini 1.5, který nabízí kontext 1M (a později 2M) tokenů. „To znamená, že do něj můžete nahrát vcelku obrovské množství textu (až pár tisíc stránek), přičemž AI se v tom stále vyzná a bude schopna odpovídat. Tento přístup je u Google unikátní,” uvádí Vojtěch Černý, ředitel inovací z IT firmy Algotech. Krom toho má mít Gemini brzy vizuální i audio schopnosti velmi podobné jako u GPT-4o. „Dále Google slibuje také inovaci Androidu, bezpečnosti, nabízí open-source modely a v neposlední řadě také reformaci jejich původního produktu – vyhledávání. S frází ‚Let Google do the googling for you' slibuje asistenta, který provede hlubší výzkum, průzkum či srovnání za vás. No, uvidíme. Jestli to bude fungovat, bude to velkolepé,” dodává Černý.
OpenAI Sora
Další nástroj od OpenAI dokáže generovat video z textu, jmenuje se Sora. Tento revoluční systém, postavený na pokročilých algoritmech strojového učení, dokáže na základě textu vytvářet videa dlouhá až minutu, která působí velmi realisticky. Sora umožňuje plynule a elegantně spojovat různé videosekvence, čímž otevírá nové možnosti pro tvorbu multimediálního obsahu. Ačkoli systém zatím neumí zcela bezchybně generovat složitější fyzikální jevy, jeho výstupy jsou natolik přesvědčivé, že je pro běžného diváka téměř nemožné rozpoznat, zda se jedná o autentické záběry, nebo o umělou inteligencí vytvořené video. O tom se můžete sami přesvědčit z nového hudebního videoklipu od kapely Washed Out, který byl celý vytvořen za pomocí Sory. Sora jako taková by měla být veřejně vydaná během tohoto roku,” doplňuje Vojtěch Černý.
S nástrojem pro vytváření videí pomocí umělé inteligence přichází i čínská společnost Shengshu Technology. Nástroj se jmenuje Vidu a slibuje až 16 sekundová videa ve full HD rozlišení.
„V současné době je důležité zaměřit se také na vývoj detekčních algoritmů, které dokáží odhalit charakteristické znaky AI generovaných videí. Zároveň je klíčová edukace veřejnosti – lidé by měli být obezřetní a ověřovat si zdroje a pravdivost videí, se kterými se na internetu setkají,“ říká Vojtěch Černý. V reakci na rostoucí množství AI generovaného obsahu na internetu se mnoho velkých technologických firem, jako Meta, Google, Microsoft či TikTok, rozhodlo zavést viditelné i neviditelné označování tohoto typu obsahu. “Neviditelné označování se používá tradičně na označování zvuku a obrazu. Do výstupu se přidá pro lidi nepostřehnutelný, ale velmi specificky pravidelný “šum”, který je možno programem detekovat a zjistit tak, že byl daný výstup vygenerován pomocí AI (a zpravidla určit kterého). Tento šum je často stavěn tak, aby s velkou pravděpodobností přežil základní obrazové či zvukové operace jako jsou ořezy, přidání dalšího šumu atd. Zajímavé je, že se takto dá označovat i text, do kterého se přidávají neviditelné znaky, alternativy písmen, i specifické tvary slov, pro stejný efekt,” doplňuje Černý.
