🤖 Aggiornamento LLM — Maggio 2026

Cosa è cambiato e cosa ti interessa sapere.


🟢 ChatGPT / OpenAI

Il 5 maggio OpenAI ha rilasciato GPT-5.5 Instant come nuovo modello predefinito per tutti gli utenti ChatGPT, in sostituzione di GPT-5.3 Instant. Le principali migliorie riguardano accuratezza, con il 52,5% di allucinazioni in meno su prompt ad alto rischio in ambiti come medicina, legge e finanza, oltre a risposte più concise e migliore gestione di immagini e problemi STEM.

ChatGPT Images 2.0 è ora disponibile su tutti i piani, con una modalità “images with thinking” che pianifica l’output visivo prima di generarlo. Il sistema di memoria si è evoluto: gli utenti Plus e Pro vedono esplicitamente quali fonti hanno personalizzato ogni risposta (ricordi salvati, chat passate, file, Gmail connessa) con controlli per correggere o eliminare il contesto usato.

Cosa cambia per te

Professionista e manager: GPT-5.5 Instant riduce il rischio di risposte errate su query legali, finanziarie o mediche. La trasparenza sul contesto usato dalla memoria è utile per chi usa ChatGPT con dati aziendali sensibili.

Studente e docente: Le risposte STEM più precise e la nuova generazione di immagini con ragionamento aiutano in lavori scientifici e spiegazioni visive.

Uso personale: Images 2.0 su tutti i piani significa creazione visiva senza piano a pagamento.

Fonte: TechCrunch, 5 maggio 2026 — OpenAI Blog


🔵 Gemini / Google DeepMind

Il 19 maggio, al Google I/O 2026, Google ha presentato Gemini 3.5. Il primo rilascio è Gemini 3.5 Flash: modello progettato per agenti e coding, quattro volte più veloce dei modelli frontier comparabili in termini di token al secondo, con 84,2% su CharXiv Reasoning. È già disponibile nella Gemini app, in AI Mode di Google Search e nell’API.

Google ha anche aggiornato Deep Think (disponibile per gli abbonati AI Ultra) con capacità di ragionamento avanzato per ricerca scientifica e ingegneria. Sul fronte prezzi, il piano AI Ultra è stato riorganizzato: dal singolo tier a 249,99$/mese si passa a due tier a 99,99$ e 200$/mese. Gemini 3.5 Pro è in uso interno e atteso nelle settimane successive.

Cosa cambia per te

Professionista e manager: Gemini 3.5 Flash nei workflow agentici e in Search porta risposte più rapide nelle integrazioni Workspace. La nuova struttura prezzi AI Ultra può rendere accessibile il tier avanzato a un costo inferiore rispetto a prima.

Studente e docente: Deep Think aggiornato è progettato esplicitamente per ricerca scientifica e risoluzione di problemi complessi. Rilevante per chi lavora in ambiti STEM o fa analisi dati avanzate.

Uso personale: Gemini 3.5 Flash in Google Search è già attivo per molti utenti: le risposte AI nella ricerca diventano più veloci e contestuali senza azioni da parte dell’utente.

Fonte: Google Blog, 19 maggio 2026


🟠 Claude / Anthropic

Anthropic ha rilasciato Claude Opus 4.7, Sonnet 4.6 e Haiku 4.5. Opus 4.7 segna un salto netto: 87,6% su SWE-Bench Verified, 13 punti in più rispetto a Opus 4.6, e input immagini a risoluzione tre volte superiore. Sul fronte sviluppatori, la piattaforma introduce tre funzionalità per agenti gestiti: Dreaming (consolidamento autonomo della memoria persistente tra sessioni), Multiagent Orchestration (un agente guida che delega a sotto-agenti specializzati su filesystem condiviso), e Outcomes (un valutatore separato che misura l’output rispetto a una rubrica definita dallo sviluppatore, con iterazioni automatiche).

I clienti su AWS ottengono accesso alla Claude Console con strumenti per prompt engineering e valutazione. Le integrazioni native con Photoshop, Blender, Ableton e Adobe Creative Cloud sono ufficiali.

Cosa cambia per te

Professionista e manager: Multiagent Orchestration e Outcomes abbassano la soglia per costruire workflow agentici affidabili senza supervisione manuale continua. Le integrazioni Creative Cloud aprono Claude al lavoro diretto su asset visivi e audio.

Studente e docente: Opus 4.7 con risoluzione immagini triplicata è utile per analizzare grafici scientifici, diagrammi o lavagne fotografate con un livello di dettaglio molto superiore.

Uso personale: Dreaming e la gestione migliorata della memoria persistente rendono Claude più coerente su progetti multi-sessione e conversazioni lunghe.

Fonte: Anthropic News, maggio 2026 — Releasebot


🟣 Perplexity

Perplexity ha aggiornato Deep Research portandolo su Claude Opus 4.6 e ampliando gli output strutturati: ora genera direttamente presentazioni, fogli di calcolo, dashboard e siti web senza uscire dall’interfaccia. Il Model Council consente di eseguire la stessa query su tre modelli diversi in parallelo e confrontare le risposte.

Nell’API Agente è ora disponibile il tool finance_search, che restituisce dati finanziari strutturati: quotazioni, bilanci, stime analisti, KPI per segmento. Su iOS, quiz e flashcard si generano con comandi in linguaggio naturale da qualsiasi contenuto. Le imprese ottengono audit log più granulari e restrizioni di accesso per dominio.

Cosa cambia per te

Professionista e manager: Deep Research che produce direttamente un foglio Excel o una dashboard riduce i passaggi tra ricerca e presentazione dei risultati. Il tool finance_search nell’API è utile per automazioni su dati di mercato.

Studente e docente: Quiz e flashcard generate automaticamente da qualsiasi testo o pagina web su iOS abbassano il tempo necessario per preparare materiale di studio o verifica.

Uso personale: Model Council è utile per chi vuole un secondo parere su una risposta senza dover riformulare la domanda altrove.

Fonte: Perplexity Changelog, maggio 2026


âš« DeepSeek

Il 24 aprile DeepSeek ha rilasciato DeepSeek V4-Pro (1,6T parametri, 49B attivati) e DeepSeek V4-Flash (284B parametri, 13B attivati), entrambi con contesto da 1 milione di token. L’efficienza computazionale è il dato tecnico principale: in un contesto da 1M token, V4-Pro usa il 27% del compute di V3.2 e il 10% della memoria; V4-Flash scende ulteriormente al 10% compute e 7% memoria.

Entrambi sono disponibili come open weights con licenza MIT. Il 22 maggio i prezzi promozionali su V4-Pro sono diventati permanenti: 0,435$/M token input, 0,87$/M output, senza scadenza.

Cosa cambia per te

Professionista e manager: La riduzione drastica del costo computazionale per contesti lunghi rende V4 praticabile per analisi di documenti interi, codebase grandi o archivi di testi aziendali. Il pricing permanente abbatte l’incertezza economica.

Studente e docente: Open weights MIT significa che si può girare localmente o deployare senza vincoli di licenza per ricerca e didattica.

Uso personale: Il contesto da 1M token su V4-Flash a basso costo è oggi la scelta più economica sul mercato per applicazioni con input molto lunghi.

Fonte: MIT Technology Review, 24 aprile 2026 — Al Jazeera


🌙 Kimi / Moonshot AI

Il 20 aprile Moonshot AI ha rilasciato Kimi K2.6, modello open-weight con architettura MoE da 1T parametri (32B attivati per token). Il sistema Agent Swarm scala a 300 sotto-agenti specializzati con fino a 4.000 step coordinati in una singola esecuzione autonoma, quadruplicando le capacità di K2.5. Su SWE-Bench Pro K2.6 segna 58,6, superando GPT-5.4 (57,7) e Claude Opus 4.6 (53,4).

Il tasso di allucinazione su AA-Omniscience è sceso dal 65% al 39%. Il 25 maggio tutta la serie kimi-k2 precedente è stata ufficialmente dismessa: chi usava le API Kimi deve migrare a K2.6.

Cosa cambia per te

Professionista e manager: Per chi costruisce agenti di coding o automazione, K2.6 è oggi l’open-weight con le migliori prestazioni misurate su benchmark reali. L’Agent Swarm a 300 sotto-agenti è il massimo disponibile in open source.

Studente e docente: Disponibile come open weight, K2.6 è accessibile per ricerca accademica su sistemi multi-agente senza costi API.

Uso personale: La dismissione della serie K2 originale richiede migrazione esplicita a K2.6 per chi usava le API Kimi.

Fonte: Artificial Analysis, aprile 2026 — Deep Infra Blog


📓 NotebookLM / Google

A maggio Google ha aggiunto la sincronizzazione automatica con Google Drive: i file Docs, Sheets e Slides collegati a un notebook si aggiornano senza intervento manuale, con rispetto dei permessi (se un file viene rimosso da Drive o i permessi vengono revocati, NotebookLM aggiorna l’accesso di conseguenza).

NotebookLM è ora integrato in Google Workspace Studio attraverso il nuovo step “Ask NotebookLM”, che consente di usare qualsiasi notebook esistente come fonte AI in automazioni no-code. Il pannello Studio è stato ridisegnato per gestire più output dello stesso tipo all’interno di un unico notebook.

Cosa cambia per te

Professionista e manager: La sincronizzazione automatica con Drive trasforma NotebookLM in uno strumento di consultazione documentale sempre aggiornato, utile per documentazione tecnica, policy o knowledge base aziendali in continua evoluzione.

Studente e docente: L’integrazione in Workspace Studio consente di costruire automazioni didattiche, come risposta automatica a domande su materiale del corso, senza scrivere codice.

Uso personale: Il pannello Studio ridisegnato semplifica la gestione di podcast, riassunti e briefing su temi personali tracciati nel tempo.

Fonte: Google Workspace Updates, maggio 2026 — Workspace Studio Integration


Il mese in cui tutto si è spostato di un livello

Maggio 2026 ha visto sette aggiornamenti simultanei che, messi insieme, ridisegnano cosa significa “usare un modello AI” nel lavoro quotidiano: memoria trasparente, agenti che orchestrano altri agenti, contesti da un milione di token che costano una frazione di prima. Una soglia che si abbassa.

Nel podcast parliamo di come leggere questi cambiamenti senza inseguirli ogni giorno e di cosa vale davvero la pena adottare adesso rispetto a cosa aspettare.

Ascoltalo qui: https://tinyurl.com/LMAISpotify

O sulla piattaforma che preferisci