🤖 Aggiornamento LLM — Giugno 2026

Cosa è cambiato e cosa ti interessa sapere.


🟢 ChatGPT / OpenAI

OpenAI ha semplificato l’interfaccia di selezione dei modelli il 10 giugno: via le etichette “Thinking” varianti, ora ci sono sei opzioni in linguaggio ordinario: Instant, Medium, High, Extra High, Pro Standard, Pro Extended.

Il 4 giugno è arrivato il Lockdown Mode, una modalità per dati sensibili che disattiva web live, Deep Research, Agent Mode e file download per proteggere da prompt injection.

GPT-4.5 è andato in pensione il 26 giugno, sostituito da GPT-5.5 in tutte le conversazioni attive. In parallelo, GPT-5.6 è in preview via API per partner selezionati, con focus su coding, scienze e cybersecurity.

Nuovo modello speech-to-text per la dettatura distribuito su tutti i piani, con miglioramenti su accenti non americani e parlanti multilingue.

Cosa cambia per te

  • Professionista e manager: Lockdown Mode è la risposta concreta a chi lavora con dati aziendali critici e non può rischiare prompt injection. Si attiva con un click, nessuna configurazione IT richiesta.
  • Studente e docente: La dettatura multilingue funziona finalmente bene anche su accenti non americani e frasi che mescolano lingue. Utile per prendere appunti vocali in italiano con termini inglesi.
  • Uso personale: Il picker semplificato risolve un problema reale: non devi più capire cosa fosse “Thinking Light” per scegliere la modalità giusta alla situazione.

Fonte: OpenAI Help Center, The Verge, OpenAI Blog — giugno 2026

https://help.openai.com/en/articles/6825453-chatgpt-release-notes
https://openai.com/index/gpt-5-5-instant/


🔵 Gemini / Google DeepMind

Gemini 3.5 Flash è passato a Generally Available: supera Gemini 3.1 Pro sui benchmark di coding e task agentici mantenendo la velocità della famiglia Flash. È il modello GA di riferimento per chi lavora via API su task complesse. In parallelo è stato presentato Gemini Omni, un modello multimodale che accetta testo, audio, immagini e video in input e genera video dinamici in output.

Due modelli di generazione immagini precedenti (gemini-3.1-flash-image-preview e gemini-3-pro-image-preview) sono stati deprecati con spegnimento definitivo al 25 giugno. Chi li usava via API deve migrare.

Cosa cambia per te

  • Professionista e manager: Gemini 3.5 Flash GA significa un modello di livello Pro a velocità e costi Flash. Per chi automatizza workflow ripetitivi via API, è un upgrade diretto senza cambiare codice.
  • Studente e docente: Gemini Omni apre la strada a spiegazioni in formato video generate on-demand. Ancora in preview, ma la direzione è verso materiali didattici multimodali.
  • Uso personale: Se usi Gemini per editing immagini o video su Google One, verifica quale modello stai usando: i vecchi sono spenti dal 25 giugno.

Fonte: Google DeepMind Blog, Google AI Developers Changelog — giugno 2026

https://deepmind.google/models/gemini/
https://ai.google.dev/gemini-api/docs/changelog


🟠 Claude / Anthropic

Anthropic ha rilasciato Claude Fable 5 e Claude Mythos 5. Fable 5 è descritto come il modello più capace mai reso disponibile al pubblico: context window da 1 milione di token di default, fino a 128.000 token di output per singola richiesta, performance di vertice su coding, ricerca scientifica e vision. Prezzi API: $10 per milione di token in input, $50 per milione in output.

Mythos 5 è lo stesso modello sottostante ma con alcune restrizioni di sicurezza alleggerite in aree specifiche, disponibile solo via Project Glasswing per casi d’uso enterprise in cybersecurity. Due novità platform: gli agenti gestiti ora girano in sandbox private con supporto MCP interni, e i piani Team/Enterprise possono taggare Claude direttamente in Slack.

Cosa cambia per te

  • Professionista e manager: 1 milione di token di context come default significa caricare documenti lunghi, intere repository di codice o set di dati estesi senza gestire chunk manualmente. Per il knowledge work continuativo, è un cambio di paradigma operativo.
  • Studente e docente: 128.000 token di output per richiesta è rilevante per tesi, analisi estese o produzioni editoriali: la risposta non si interrompe più a metà del lavoro.
  • Uso personale: Claude in Slack (piani Team) porta l’assistente nel flusso di lavoro quotidiano senza dover cambiare app o copiare testo tra finestre.

Fonte: Anthropic.com/newsplatform.claude.com — giugno 2026


🟣 Perplexity

Perplexity Computer è ora disponibile all’interno di Microsoft 365: Word, Excel, PowerPoint, Outlook e Teams.

Il Deep Research ora usa Claude Opus 4.6 come motore sottostante, migliorando la qualità su task di ricerca complessa.

A Computex 2026 Perplexity ha presentato un hybrid local-server inference orchestrator: un sistema che decide automaticamente se eseguire un task in locale o nel cloud, senza che l’utente debba scegliere.

Lato enterprise: controlli granulari per feature, audit log estesi con le risposte generate, restrizioni di accesso per dominio email e limiti di credito personalizzabili per organizzazione.

Cosa cambia per te

  • Professionista e manager: Perplexity Computer dentro Teams e Outlook è una funzione concreta: ricerca e sintesi delegate direttamente nel contesto di lavoro, senza cambiare strumento.
  • Studente e docente: Deep Research con Opus 4.6 produce output più strutturati su domande complesse. Non è più solo “cerca e riassumi”, è più vicino a una ricerca bibliografica guidata.
  • Uso personale: L’inference ibrida è trasparente per l’utente, ma si traduce in meno latenza su device recenti, senza dover scegliere modalità offline o online.

Fonte: Perplexity Changelog, MarkTechPost — giugno 2026

https://www.perplexity.ai/changelog
https://www.marktechpost.com/2026/06/05/perplexity-ai-introduces-hybrid-local-server-inference-orchestrator-for-personal-computer-automatic-on-device-and-cloud-task-routing/


🟡 DeepSeek

Nessun nuovo modello a giugno. Il 31 maggio DeepSeek ha reso permanente lo sconto del 75% sui token di output di V4 Pro, applicato temporaneamente all’uscita ad aprile. Il prezzo di output si attesta a circa 34 volte sotto GPT-5.5 e 29 volte sotto Claude Opus 4.8. V4 Pro resta il modello di riferimento: 1,6 trilioni di parametri totali, 49 miliardi attivi per token, context da 1 milione, architettura Mixture-of-Experts open-weight.

Cosa cambia per te

  • Professionista e manager: Il pricing permanentemente basso rende V4 Pro la scelta razionale per workflow API ad alto volume dove la qualità di risposta è sufficiente ma il costo conta. Si può pianificare su quella base senza aspettarsi aumenti.
  • Studente e docente: Per chi sperimenta con API personali, il rapporto qualità/prezzo rimane imbattibile. V4 Flash (284 miliardi, 13 miliardi attivi) è ancora più economico per task semplici.
  • Uso personale: La notizia è che il prezzo basso non era temporaneo. DeepSeek V4 Pro rimane l’opzione più economica del mercato per context lunghi.

Fonte: CNBC, TechCrunch, llm-stats.com — maggio/giugno 2026

https://www.cnbc.com/2026/04/24/deepseek-v4-llm-preview-open-source-ai-competition-china.html
https://techcrunch.com/2026/04/24/deepseek-previews-new-ai-model-that-closes-the-gap-with-frontier-models/


🔴 Kimi / Moonshot AI

Il 12 giugno Moonshot AI ha rilasciato e reso open-source Kimi K2.7 Code, un modello specializzato in coding derivato da K2.6. Usa circa il 30% in meno di token di thinking rispetto al predecessore a parità o migliore performance su benchmark di coding e task agentici. Context window: 256.000 token. Forced thinking mode attivo di default, nessuna modalità non-thinking disponibile.

Disponibile via API con interfaccia compatibile OpenAI e su Hugging Face con licenza Modified MIT per deployment self-hosted.

Cosa cambia per te

  • Professionista e manager: K2.7 Code è un modello agentico da coding open-weight utilizzabile in ambienti self-hosted senza dipendenza da provider esterni. Per chi ha vincoli di data residency, è rilevante.
  • Studente e docente: Disponibile gratuitamente via Hugging Face per chi vuole sperimentare un modello di coding competitivo in locale o su infrastruttura propria.
  • Uso personale: La compatibilità con l’API OpenAI significa che funziona con le stesse integrazioni già configurate, con costo API generalmente più basso.

Fonte: Nerova.ai, MarkTechPost, Hugging Face — giugno 2026


📓 NotebookLM / Google

L’8 giugno NotebookLM ha ricevuto il suo aggiornamento più sostanziale: motore aggiornato a Gemini 3.5, ricerca agentica attiva, e un cloud computer integrato per eseguire codice direttamente nel notebook. La source discovery costruisce il knowledge base a partire da una descrizione del progetto: NotebookLM suggerisce fonti usando Google Search invece di richiedere un set di fonti completato in anticipo.

Gli output si sono espansi a grafici, PDF, fogli di calcolo e presentazioni PowerPoint. Aggiunta la memoria delle interazioni passate, disattivabile, indipendente dagli altri servizi Google. Disponibilità: Google AI Ultra e piani Workspace business con AI Access.

Cosa cambia per te

  • Professionista e manager: Il cloud computer integrato trasforma NotebookLM da strumento di sintesi a ambiente analitico: puoi fare analisi quantitative, eseguire script e query sui tuoi documenti senza uscire dall’interfaccia.
  • Studente e docente: La source discovery guidata è utile per chi deve costruire una base bibliografica su un tema: descrivi il progetto, ricevi suggerimenti di fonti invece di cercare tu da zero.
  • Uso personale: Gli output in PowerPoint e PDF significano che il lavoro esce già formattato, non come testo da copiare e riformattare altrove.

Fonte: TechCrunch, Google Blog, Geeky Gadgets — giugno 2026


Quando tutti i modelli si aggiornano insieme

Giugno 2026 non è stato un mese di un singolo annuncio. È stato un mese di aggiornamenti sincronizzati su tutta la mappa: Fable 5, Gemini 3.5 Flash, NotebookLM agentico, GPT-5.6 in preview, Kimi K2.7 Code open-source. Il risultato pratico è che chi usa questi strumenti oggi si trova a navigare un ecosistema che cambia su più fronti contemporaneamente.

Nel podcast Lavoro Meglio con l’AI parliamo esattamente di questo: non dei modelli in astratto, ma di cosa succede quando li usi davvero nel lavoro.

Ascoltalo qui: https://tinyurl.com/LMAISpotify

O nella piattaforma di ascolto che preferisci