CzechIndustry > Další inovace v oblasti AI – rychlý přehled zásadních novinek
Další inovace v oblasti AI – rychlý přehled zásadních novinek
Technologičtí giganti OpenAI, Microsoft, Meta a Apple přinášejí na trh další inovace v oblasti umělé inteligence. Od pokročilých chatbotů a nástrojů pro generování videí až po finanční asistenty a virtuální avatary, tyto novinky slibují zefektivnit práci a otevřít nové možnosti pro byznys i osobní použití. Řada z těchto technologií ještě není venku a proto jejich kvalitu zatím známe pouze zprostředkovaně. Pojďme se podívat na některé z nich.
Nová verze ChatGPT-4o
OpenAI, přední společnost v oblasti umělé inteligence, představila novou verzi svého populárního chatbota ChatGPT, a to zcela zdarma. Tato vylepšená varianta přináší řadu revolučních funkcí, které posouvají AI na další úroveň. Jednou z klíčových novinek je schopnost vést hlasové konverzace v reálném čase, a to s lidsky působící rychlostí odezvy pouhých 320 milisekund. Kromě hlasu dokáže ChatGPT-4o také analyzovat obrázky a videa, které mu uživatel poskytne, a vést o nich smysluplný dialog. ChatGPT-4o tak může sloužit jako konverzační partner, který vám např. pomůže procvičovat cizí jazyk. Dokáže vymyslet personalizované cvičení, vysvětlit gramatiku, poskytovat překlady nebo například pomoci s vaší výslovností.
Google Gemini
Po letošní keynote Google I/O byl zpřístupněn model Gemini 1.5, který nabízí kontext 1M (a později 2M) tokenů. „To znamená, že do něj můžete nahrát vcelku obrovské množství textu (až pár tisíc stránek), přičemž AI se v tom stále vyzná a bude schopna odpovídat. Tento přístup je u Google unikátní,” uvádí Vojtěch Černý, ředitel inovací z IT firmy Algotech. Krom toho má mít Gemini brzy vizuální i audio schopnosti velmi podobné jako u GPT-4o. „Dále Google slibuje také inovaci Androidu, bezpečnosti, nabízí open-source modely a v neposlední řadě také reformaci jejich původního produktu – vyhledávání. S frází ‚Let Google do the googling for you' slibuje asistenta, který provede hlubší výzkum, průzkum či srovnání za vás. No, uvidíme. Jestli to bude fungovat, bude to velkolepé,” dodává Černý.
OpenAI Sora
Další nástroj od OpenAI dokáže generovat video z textu, jmenuje se Sora. Tento revoluční systém, postavený na pokročilých algoritmech strojového učení, dokáže na základě textu vytvářet videa dlouhá až minutu, která působí velmi realisticky. Sora umožňuje plynule a elegantně spojovat různé videosekvence, čímž otevírá nové možnosti pro tvorbu multimediálního obsahu. Ačkoli systém zatím neumí zcela bezchybně generovat složitější fyzikální jevy, jeho výstupy jsou natolik přesvědčivé, že je pro běžného diváka téměř nemožné rozpoznat, zda se jedná o autentické záběry, nebo o umělou inteligencí vytvořené video. O tom se můžete sami přesvědčit z nového hudebního videoklipu od kapely Washed Out, který byl celý vytvořen za pomocí Sory. Sora jako taková by měla být veřejně vydaná během tohoto roku,” doplňuje Vojtěch Černý.
S nástrojem pro vytváření videí pomocí umělé inteligence přichází i čínská společnost Shengshu Technology. Nástroj se jmenuje Vidu a slibuje až 16 sekundová videa ve full HD rozlišení.
„V současné době je důležité zaměřit se také na vývoj detekčních algoritmů, které dokáží odhalit charakteristické znaky AI generovaných videí. Zároveň je klíčová edukace veřejnosti – lidé by měli být obezřetní a ověřovat si zdroje a pravdivost videí, se kterými se na internetu setkají,“ říká Vojtěch Černý. V reakci na rostoucí množství AI generovaného obsahu na internetu se mnoho velkých technologických firem, jako Meta, Google, Microsoft či TikTok, rozhodlo zavést viditelné i neviditelné označování tohoto typu obsahu. “Neviditelné označování se používá tradičně na označování zvuku a obrazu. Do výstupu se přidá pro lidi nepostřehnutelný, ale velmi specificky pravidelný “šum”, který je možno programem detekovat a zjistit tak, že byl daný výstup vygenerován pomocí AI (a zpravidla určit kterého). Tento šum je často stavěn tak, aby s velkou pravděpodobností přežil základní obrazové či zvukové operace jako jsou ořezy, přidání dalšího šumu atd. Zajímavé je, že se takto dá označovat i text, do kterého se přidávají neviditelné znaky, alternativy písmen, i specifické tvary slov, pro stejný efekt,” doplňuje Černý.
Microsoft Copilot for Finance
Copilot for Finance od Microsoftu je specializovaná verze Microsoft Copilot integrovaného do aplikací Microsoft 365. Tento nástroj slibuje zásadně zefektivnit a usnadnit práci s čísly ve firmách všech velikostí. Copilot dokáže automatizovat rutinní úkoly jako analýza odchylek v prodeji, příprava finančních reportů, vyúčtování a tak dále. Navíc dokáže pracovat s daty přímo z účetních systémů jako Microsoft Dynamics 365 či SAP. Velké korporace jako Visa, BP či Pfizer již Copilot využívají, ale benefity může přinést i menším firmám – ať už jde o automatizaci rutinních úkolů, personalizované analýzy nebo přípravu atraktivních prezentací pro klienty.
Claude AI nově dostupný v EU
Startup Anthropic, jeden z předních rivalů OpenAI, oznámil, že jeho pokročilý chatbot Claude AI je nyní dostupný i v Evropské unii. Tento chatbot vyniká v několika klíčových oblastech, včetně schopnosti číst, analyzovat a sumarizovat nahrané soubory. Díky důrazu na etiku a bezpečnost je Claude AI navržen tak, aby minimalizoval rizika spojená s používáním AI.
Dříve bylo možné používat chatbota Claude pouze za pomocí třetích stran, například skrze platformu jako je Poe. Poe, který vytvořila společnost Quora, funguje jako agregátor různých chatbotů včetně ChatGPT, Claude a Gemini. Poe navíc umožňuje vytvářet vlastní AI chatboty kombinací existujících modelů a uživatelem definovaných instrukcí, a to i bez znalosti programování. Platforma je dostupná zdarma přes web i mobilní aplikace. Prémiové funkce jako neomezené konverzace jsou ale zpoplatněny.
Llama 3 od Mety
Meta nedávno začala využívat svůj nejnovější open-source jazykový model Llama 3. Tento pokročilý model přináší uživatelům Facebooku, Messengeru, Instagramu a WhatsAppu pokročilejší interakci s AI asistenty. Velkou výhodou modelu Llama 3 jsou poměrně otevřené licenční podmínky – model lze zdarma používat jak pro výzkumné, tak i komerční účely, a to až do 500 milionů aktivních uživatelů.
Llama 3 přináší výrazně vyšší rychlost generování odpovědí z desítek vteřin na jednotky či dokonce zlomky vteřin. Skutečným unikátem na poli open-source jazykových modelů je pak schopnost Llama 3 celkem obstojně komunikovat v češtině. To otevírá dveře pro vývoj pokročilých českých AI aplikací.
Virtuální avataři
Technologie virtuálních avatarů dosáhla dalšího milníku – nyní dokáží nejen věrně napodobit vzhled a hlas konkrétního člověka, ale také jeho specifickou dikci a způsob mluvy. Nejnovějším příkladem je VASA-1 od Microsoftu, která dokáže vytvořit avatary s ohromující věrností a přesvědčivostí pouze z jedné fotografie. Běžný uživatel by jen stěží rozeznal, že se nejedná o opravdového člověka.
Právě proto se Microsoft rozhodl tuto technologii zatím nezveřejnit – obává se možného zneužití, zejména v kontextu blížících se voleb. Je zřejmé, že s rostoucí dokonalostí AI avatarů bude nutné najít nové způsoby, jak ověřovat pravost videí, a především vzdělávat veřejnost, aby dokázala tyto AI výstupy kriticky posuzovat. Dalším nástrojem, který posouvá hranice manipulace s videem, je Synthesia. Její avatary lze nyní obdařit nastavitelnými emocemi, takže mohou působit šťastně, smutně či jakkoliv jinak dle potřeby.
Apple a AI
Apple se blíží k uzavření dohody s OpenAI, tvůrcem ChatGPT, jen několik týdnů před plánovaným uvedením iOS 18. Tato spolupráce umožní Apple integrovat pokročilé AI technologie přímo do iPhonů, což přináší významné změny v oblasti bezpečnosti, soukromí a funkcionality zařízení. Apple, známý svým důrazem na ochranu soukromí, plánuje zpracovávat co nejvíce dat přímo na zařízení, čímž minimalizuje riziko úniku informací na třetí strany.
Nové AI funkce budou podporovány výkonnými čipy, jako je M4 v nejnovějších iPadech, a očekává se, že iPhone 16, který bude uveden na trh na podzim, bude těmito schopnostmi rovněž vybaven. Partnerství s OpenAI také umožní Applu přenést část odpovědnosti za data na OpenAI, což může být klíčové pro další rozvoj AI funkcí v iOS 18. Tato dohoda představuje významný krok vpřed v integraci umělé inteligence do každodenního života uživatelů iPhonů. (20.5.2024)