OpenAI-jev GPT-5.4 uvodi Pro i Thinking opcije i smanjuje pojavu halucinacija
TL;DR - Kratak rezime
- Rizik: Kontekstni prozor od milion tokena i unapređeno rasuđivanje mogu biti zloupotrebljeni za sofisticirane dezinformacije ili neovlašćeni pristup poverljivim podacima.
- Uticaj: Pro i Thinking varijante čine AI asistenciju bržom, ekonomičnijom i preciznijom u pravnim poslovima, finansijskom modeliranju i projektima masovne produkcije sadržaja, omogućavajući kompanijama efikasniju izradu kompleksnih rešenja.
- Izgledi: Zahvaljujući vrhunskim rezultatima na testovima i smanjenju halucinacija za 33%, GPT-5.4 bi mogao da postavi nove standarde za napredne LLM modele, podstičući novi talas konkurencije i stroža bezbednosna pravila.
OpenAI predstavio GPT-5.4 sa "Pro" i "Thinking" varijantama
Šta je novo u GPT-5.4?
GPT-5.4 dolazi u tri verzije:
- Standard – osnovni model za opštu upotrebu.
- Thinking – varijanta fokusirana na rasuđivanje koja naglašava transparentnost procesa razmišljanja (chain-of-thought).
- Pro – optimizovan za brzinu i isplativost, idealan za rad pod visokim opterećenjem.
Sve tri verzije dolaze sa ogromnim kontekstnim prozorom od milion tokena, najvećim koji je OpenAI do sada objavio. To omogućava modelu da odjednom obrađuje obimnu dokumentaciju, duge baze koda ili kompleksne pravne ugovore.
Performanse i rezultati testiranja
OpenAI je istakao nekoliko rekordnih rezultata:
- Zauzeo je prvo mesto na OSWorld-Verified i WebArena Verified testovima za korišćenje računara.
- Postigao je novi rekord od 83% na OpenAI GDPval testu za zadatke zasnovane na znanju.
- Predvodio je Mercor-ov APEX-Agents test, koji procenjuje profesionalne veštine u oblastima prava i finansija.
CEO kompanije Mercor, Brendan Foody, kaže da GPT-5.4 "briljira u kreiranju dugoročnih rezultata poput prezentacija, finansijskih modela i pravnih analiza", uz brži i ekonomičniji rad u poređenju sa drugim vodećim modelima.
Efikasnost tokena i smanjenje halucinacija
OpenAI navodi da GPT-5.4 rešava iste probleme koristeći "znatno manje tokena" u poređenju sa verzijom GPT-5.2. Na testovima bezbednosti, verovatnoća greške kod pojedinačnih tvrdnji je manja za 33%, dok je verovatnoća netačnog ukupnog odgovora manja za 18%.
Nova arhitektura za pozivanje alata: Tool Search
API sada uvodi funkciju pod nazivom Tool Search. Ranije je bilo neophodno uneti definiciju svakog alata u sam upit (prompt), što je drastično povećavalo potrošnju tokena. Uz Tool Search, model povlači definicije samo kada su mu zaista potrebne, čime se smanjuju troškovi i latencija, čak i uz korišćenje desetina različitih alata.
Bezbednosna evaluacija procesa razmišljanja
OpenAI je pokrenuo test bezbednosti fokusiran na rezultate procesa razmišljanja (chain-of-thought - CoT). On ispituje da li model prikriva ili pogrešno predstavlja svoje rasuđivanje u složenim, višestepenim zadacima. Rani podaci sugerišu da Thinking varijanta ređe pribegava obmanjujućem CoT-u, što povećava poverenje u alate za monitoring.
Zašto je to važno
Kombinacija ogromnog kontekstnog prozora, efikasnije upotrebe tokena i boljih bezbednosnih rezultata u GPT-5.4 modelu predstavlja značajan iskorak za profesionalnu upotrebu AI tehnologije. Advokatske kancelarije, investicione banke i studiji za kreiranje sadržaja sada mogu brže i povoljnije da proizvode sofisticirane materijale.
Ipak, tolika snaga donosi i određene rizike. Širi kontekstni prozor i dublje rasuđivanje mogu biti zloupotrebljeni za kampanje dezinformacija ili izvlačenje osetljivih podataka iz privatnih skupova. Niža stopa halucinacija kod OpenAI modela ublažava deo rizika, ali dvostruka priroda ove tehnologije drži regulatore i nadzorne organe u stanju pripravnosti.
🔮 Predviđanja futuriste
Predviđanja za 2029. godinu:
- Profesionalne oblasti poput prava, finansija i medija mogle bi biti preplavljene izuzetno obimnim sadržajem generisanim veštačkom inteligencijom, poput ugovora od više miliona stranica ili hiper-detaljnih tržišnih prognoza. Zahvaljujući kontekstualnim prozorima od milion tokena, ova promena bi mogla iz korena izmeniti način na koji vrednujemo ljudsku stručnost.
- Pretraga alata (Tool Search) mogla bi omogućiti ekosisteme stotina usko specijalizovanih API-ja koji komuniciraju sa GPT-5.4 po nižoj ceni, što bi moglo podstaći novi talas „plug-and-play“ AI usluga. Istovremeno, to zlonamernim akterima olakšava prikrivanje tajnih lanaca alata za širenje dezinformacija ili krađu podataka.
- Niža stopa halucinacija i transparentno praćenje toka misli (chain-of-thought) mogli bi usmeriti regulatore ka strožim okvirima, što bi potencijalno podstaklo vlade da kodifikuju bezbednosne standarde za AI. To bi moglo ubrzati usvajanje pouzdane AI tehnologije ili, pak, usporiti inovacije pod teretom usklađivanja sa propisima.