🤖 OpenAI desplega GPT-5 i ja està remenant la pota
Just ahir (7 d'agost de 2025), OpenAI va desvetllar ChatGPT-5. Sobre el paper, és un gran salt: raonament més matisat, generació de codi més nítida, habilitat per llegir pistes emocionals, a més de la capacitat de fer malabars amb text, imatges i potser fins i tot algunes combinacions estranyes entremig. Tothom en pot fer un tast (Free, Plus i Pro), tot i que el nivell gratuït encara té els límits de "no em facis un atracó". També hi ha tota una petita família de versions derivades (GPT-5-mini, nano i una versió de xat divertida) i, pel que sembla, Gmail i Calendar estan en procés. La màquina d'expectació està funcionant, però algunes veus continuen assenyalant: aquesta encara no és l'AGI de nivell de ciència-ficció que algunes persones esperen.
🔗 Llegiu-ne més
🛡 El Cyber Challenge d'IA de DARPA es tanca amb victòries discretament enormes
L'AI Cyber Challenge, un experiment DARPA de dos anys de durada sobre la caça automatitzada d'errors, va arribar a la seva final a la DEF CON, i els resultats no són poca cosa. El més destacat? Detecció i correcció més ràpida i precisa de forats de seguretat en sistemes d'alt risc, com ara hospitals, plantes d'aigua, el tipus de coses que no voleu desconnectar. La corona de 4 milions de dòlars va ser per al "Team Atlanta" (una barreja de Georgia Tech, Samsung Research, KAIST i POSTECH). A l'última prova, els finalistes van solucionar el 77% de les vulnerabilitats i en van solucionar el 61%, molt per sobre d'una taxa de detecció del 37% a la primera ronda. Quatre de les seves eines ara són públiques, i DARPA ja insinua més finançament per treure això del laboratori i traslladar-ho al món real desordenat.
🔗 Llegiu-ne més
💼 Els analistes de Wall Street es reuneixen amb els seus companys de feina d'IA
Pel que fa a les finances, Omar Sayed, de Porchester Capital, ho va dir sense embuts: aproximadament tres quartes parts de la càrrega de treball d'un analista típic ara la gestiona la IA, amb noms com Claude i Gemini (amb RAG al capdavant). No es tracta només de fer càlculs numèrics; també de modelar el flux de caixa, mantenir el CRM i fins i tot verificar les operacions. Al seu taller, l'eficiència ha augmentat aproximadament 4 vegades en comparació amb l'antiga rutina manual. Els grans actors, com ara S&P Global i Goldman, també s'hi estan sumant. Tot i així, el consens és que les parts més humanes de la feina (l'empatia i la construcció de relacions) encara .
🔗 Llegiu-ne més