Les 17 et 18 mai 2025, l’ #IA #AI #o4-mini a résolu des énigmes uniques. Le #monde #scientifique n’en revient toujours pas : sur 40 énigmes, 30 résolues en direct.
Des chercheurs de #Caltech, #Oxford et #Cambridge ont bivouaqué à #Berkeley durant 2j
Les 17 et 18 mai 2025, l’ #IA #AI #o4-mini a résolu des énigmes uniques. Le #monde #scientifique n’en revient toujours pas : sur 40 énigmes, 30 résolues en direct.
Des chercheurs de #Caltech, #Oxford et #Cambridge ont bivouaqué à #Berkeley durant 2j
Oubliez GPT-4, GPT-4o ou Turbo : OpenAI veut simplifier l'intelligence artificielle. GPT‑5 arrive début août avec une ambition folle, unifier tous les modèles dans un seul système, plus fluide, plus accessible, plus intelligent.
#ChatGPT hinterlässt #unsichtbare #Zeichen im #Text
In den neueren #Sprachmodellen von #OpenAI hinterlässt die KI offenbar absichtlich unsichtbare Zeichen.
Dem Bericht nach hinterlassen die Modelle #GPT- #o3 und #o4-mini unsichtbare #Unicode-Zeichen in dem generierten Text. #OpenAI kündigte diese Maßnahme bisher nicht an.
We have entered an era where it pays to have decent handwriting.
[This was truly the only prompt; I did not edit the output.] #o4
💡 OpenAI o3 e o4-mini: pensiero visivo e tool agentici potenziati in ChatGPT
https://gomoot.com/openai-o3-e-o4-mini-pensiero-visivo-e-tool-agentici-potenziati-in-chatgpt
#ai #blog #ia #llm #news #o3 #o4 #o4mini #openai #picks #ragionamento #tech #tecnologia #thinking @OpenAI
Dal OpenAI arrivano o3 e o4-mini: due modelli AI che leggono grafici, zoomano foto, invocano API e scrivono codice in modo autonomo, pensiero visivo potenziato.
🧠 #OpenAI ha presentato i nuovi modelli #o3 e #o4-mini (con avanzamenti della fase di reasoning), e Codex CLI (un #AI Agent open-source).
👉 Li ho provati: https://www.linkedin.com/posts/alessiopomaro_openai-o3-o4-activity-7318516446437826561-bxZQ
___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro
🧠 #OpenAI ha presentato i nuovi modelli #o3 e #o4-mini (con avanzamenti della fase di reasoning), e ha lanciato Codex CLI (un #AI Agent open-source). ✨ Ho provato o3 in diversi task: #coding, generazione di testo, analisi dei dati, ricerca online, logica, matematica, istruzioni complesse, analisi delle immagini, e in un sistema multi-agent via API. 👉 Sul coding, è performante: ho realizzato un'applicazione locale (Python) con interfaccia grafica che converte un gruppo di immagini in tutti i formati, con resize e gestione della qualità, funzionante alla prima esecuzione. 👉 Fantastici la ricerca online e code interpreter in fase di reasoning, perché sono dinamici in base al flusso di ragionamento. 👉 Ho provato anche CodexCLI, un agente AI per il terminale che consente di scrivere codice, navigare file, interpretare immagini e interagire con il computer in modo multimodale e controllato. Nel test, entro in una directory e faccio sintetizzare al modello un PDF locale. Una funzionalità davvero interessante. 🚀 o3 è il modello più potente, dedicato a compiti complessi come coding, matematica, e ragionamento visivo. o4-mini, invece, offre prestazioni sorprendentemente elevate in rapporto a dimensioni e costi, risultando ideale per usi ad alto volume di richieste. ⚙️ Entrambi possono usare l’intera suite di strumenti di #ChatGPT: ricerca web, code interpreter, generazione e modifica immagini, function calling e tool personalizzati. Per la prima volta, ragionano anche sulle immagini: le usano come parte integrante della catena di pensiero, sbloccando nuove modalità di problem solving. 📈 Le performance: o4-mini raggiunge il 93,4% di accuratezza su AIME 2024 e 2719 ELO su Codeforces. o3 ottiene 83,3% su GPQA (domande da PhD), 86,8% su MathVista, 78,6% su CharXiv, e domina nei task di software engineering, superando ampiamente i predecessori. 🔒La sicurezza è stata potenziata con nuovi sistemi di rifiuto delle richieste, rilevamento di #prompt rischiosi e test rigorosi: entrambi i modelli restano sotto le soglie critiche su tutti i fronti (biochimica, cybersecurity, auto-miglioramento AI). 🔗 Il post: https://lnkd.in/deVB8aGf 🔗 Codex CLI: https://lnkd.in/d5gMt3YC ___ ✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://lnkd.in/dN-bwBrV #AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM
The AI has lost its marbles...
...signoff message.
A 4 hour session to try to write a complex script in #bash.
What began as a simple exercise, became a "why are you so dumb" trial.
TLDR; #Chatgpt #o4 don't do BAsH gud.
However the new "Research" mode of ChatGpt is impressive, it took 20 minutes realtime.