GPT-1
Il primo esperimento Transformer
📊 I numeri
OpenAI rilascia il primo modello basato sull'architettura Transformer. È poco più di una curiosità accademica — la comunità scientifica è entusiasta, il pubblico ignaro.
- Nessuna perdita di lavoro
- Zero consapevolezza pubblica dell'AI generativa
- Dibattito etico limitato ai ricercatori
L'AI esiste solo nei paper universitari. I tuoi device, la tua produttività, il tuo lavoro NON sono toccati ancora.
GPT-2
"Too dangerous to release"
📊 I numeri
Il modello genera paragrafi di testo coerenti. OpenAI inizialmente non lo rilascia completo per paura di un uso improprio per fake news. È il primo "moment of concern" pubblico.
- Primo allarme fake news da AI
- Governi iniziano a chiedersi: "Cosa possiamo farci?"
- Etica dell'AI entra nel discorso politico
- Zero perdita di lavoro tangibile
La tua vita non è ancora toccata. Ma i policy maker iniziano a gridare (inascoltati) sui rischi. È un avvertimento ignorato.
GPT-3
L'avvento del Few-Shot Learning
📊 I numeri
La prima AI che può svolgere compiti (traduzione, riassunto, coding) vedendo solo pochi esempi, senza addestramento specifico. Primo vero "AI as a Service" via API.
- Primi segnali di automazione in customer service
- Junior copywriter: alcune aziende usano GPT-3 per bozze
- Startup costruite SOLO su GPT-3 (copywriting, tutoring)
- NO LAYOFF MASSICCI ANCORA — è un tool, non una sostituzione
Se lavori nel tech, marketing o legge, GPT-3 è sul tuo radar come "cosa interessante da provare". Per il 99% dei lavoratori: ancora invisibile. Ma il clock inizia.
GitHub Copilot
Primo agente AI in produzione
📊 I numeri
Basato su GPT-3 ma specializzato per il codice. Junior dev: meno frustrazione, template generato. Senior dev: focus su logica, non boilerplate.
- Le assunzioni nel tech iniziano a rallentare
- Stack Overflow: meno domande basiche
- Startup: "assumiamo il 20% di junior in meno"
Solo chi usa editor moderni (VSCode, Jetbrains) ha accesso. Dev in paesi emergenti: accesso limitato, costo proibitivo. Il divario Nord-Sud nel tech inizia ad allargarsi.
DALL-E 2
L'AI che disegna i tuoi sogni
📊 I numeri
OpenAI rilascia il primo generatore text-to-image consumer-ready. Descrivi un'immagine, l'AI la crea. Supporta outpainting, inpainting e variazioni stilistiche.
- Stock photographers: primi segnali di disruption
- Illustratori: "l'AI mi ruberà il lavoro?"
- Agenzie creative: iniziano a sperimentare
Se lavori nella creatività visiva, questo è il primo segnale d'allarme. L'AI non è ancora abbastanza buona per sostituirti, ma il trend è chiaro.
Stable Diffusion
L'AI generativa diventa open source
📊 I numeri
Stability AI rilascia il modello completamente open source. Gira su GPU consumer. Esplode l'ecosistema: AUTOMATIC1111, ComfyUI, LoRA, fine-tuning personalizzato.
- Democratizzazione: chiunque può generare immagini AI
- Controversie copyright: artisti citano in giudizio
- Deepfake: esplodono i contenuti non consensuali
L'open source democratizza ma rimuove i guardrail. Contenuti NSFW, deepfake, violazioni copyright proliferano senza controllo.
Midjourney
L'arte AI conquista il mainstream
📊 I numeri
Modello closed-source accessibile via Discord. Qualità artistica superiore. V4 (Nov 2022) segna il punto di svolta verso il fotorealismo. Profittevole dal primo anno.
- Pubblicità: concept art in minuti invece che giorni
- Gaming: pre-produzione rivoluzionata
- Editoria: copertine e illustrazioni AI
- Moda: lookbook e campagne generate
Se sei un creativo, Midjourney è sia una minaccia che un'opportunità. Chi lo padroneggia moltiplica la propria produttività. Chi lo ignora rischia l'obsolescenza.
Mistral AI
Il campione europeo dell'AI
📊 I numeri
Fondata da ex-ricercatori DeepMind e Meta, Mistral AI diventa il campione europeo dell'intelligenza artificiale. Modelli open source competitivi con GPT-3.5 e Claude, ma con sovranità digitale UE.
- Indipendenza: alternativa europea a OpenAI/Google
- Open source: Mistral 7B, Mixtral 8x7B scaricabili
- Enterprise: deployment on-premise conforme GDPR
- Performance: Mixtral batte GPT-3.5 in molti benchmark
L'AI di frontiera non è più un monopolio americano. Le aziende europee possono ora scegliere soluzioni conformi alla regolamentazione UE senza sacrificare performance.
ChatGPT
Il momento iPhone dell'AI
📊 I numeri
Grazie all'RLHF (Reinforcement Learning from Human Feedback), il modello impara a dialogare in modo utile. Tua nonna sa cosa sia ChatGPT. L'AI diventa mainstream.
- Customer Service: l'AI risponde al posto degli umani
- Marketing/Copywriting: "perché assumere 3 persone se ChatGPT lo fa?"
- Graphic Design: primi licenziamenti legati a DALL-E + ChatGPT
- Junior Software: blocco assunzioni nei grandi tech
- Università: "Gli studenti usano ChatGPT per i saggi"
- Insegnanti: caos, divieti, nuovi criteri di valutazione
- Cambio di paradigma: pensiero critico > conoscenza mnemonica
Lavori in customer service / back-office • Sei junior (esposto 20x più dei senior) • Il tuo lavoro è "ripetitivo e basato sulla conoscenza" • Lavori nel Sud del mondo (scarsa rete di protezione sociale)
GPT-4
Il salto multimodale di OpenAI
📊 I numeri
GPT-4 segna il passaggio alla multimodalità: accetta testo e immagini. Performance da 90° percentile all'esame di avvocatura USA. OpenAI consolida la leadership commerciale.
- Assistenti legali: l'AI legge 500 pagine di documenti istantaneamente
- Radiologi: AI supera gli umani in alcuni compiti diagnostici
- Sviluppatori: GitHub Copilot powered by GPT-4 esplode
GPT-4 API: $0.03/1K input, $0.06/1K output. ChatGPT Plus ($20/mese) diventa l'entry point per l'AI di massa.
Claude 3
La risposta di Anthropic: safety-first
📊 I numeri
Claude 3 Opus supera GPT-4 in MATH e GSM8K. Finestra di 200K token: può leggere interi libri. Constitutional AI riduce le hallucination. Anthropic emerge come vero competitor.
- Constitutional AI: training su principi etici espliciti
- Refusal reduction: meno rifiuti inutili
- Vision nativa: analisi immagini integrata
Claude 3 Opus: MMLU 86.8%, MATH 60.1%, GSM8K 95%. Primo modello a competere testa-a-testa con GPT-4.
Llama 2 Open Source
La democratizzazione dell'AI
📊 I numeri
Meta rilascia Llama 2 open source. Primo vero livellamento del campo di gioco. Un developer in Argentina può far girare Llama 2 sulla propria macchina. Una startup in Nigeria non deve pagare API.
- Africa, Asia: ecosistemi di developer indipendenti proliferano
- 50% delle Fortune 500 inizia progetti pilota con Llama
- Costo per inference: cala del 60% (self-hosted > API)
- Meno paura del vendor lock-in (OpenAI)
Se sei developer o titolare di startup: LIBERTÀ. Non sei più ostaggio dei prezzi delle API della Silicon Valley.
Function Calling + GPT-4 Turbo
La vera base degli agenti
📊 I numeri
Il catalizzatore dell'era agentica. L'LLM può ora chiamare API esterne autonomamente. Non è più "chiedo, risponde" — ora esegue task multi-step contro il mondo reale.
- Agente prenotazioni: parla con l'API dell'hotel, prenota direttamente
- Agente shopping: cerca database prodotti, compara prezzi
- Supporto clienti: risolve problemi toccando 3+ sistemi
- Agente coding: propone fix, esegue test, auto-deploya
Se lavori in customer service, prenotazioni, data entry: questa non è più assistenza. È sostituzione pura.
Gemini 1.0 / 1.5
La risposta di Google
📊 I numeri
Google risponde a GPT-4 con Gemini 1.0 (Dic 2023) e poi 1.5 Pro (Feb 2024). Record assoluto: 2 milioni di token di contesto — può processare interi libri, ore di video, codebase complete.
- Video: analisi automatica di ore di footage
- Legale: revisione di migliaia di pagine istantanea
- Ricerca: Q&A su interi corpora accademici
- Coding: comprende codebase enterprise complete
La "memoria" dell'AI si estende drammaticamente. Può capire contesti complessi che prima richiedevano spiegazioni ripetute. L'interazione diventa più naturale.
GPT-4o
Omni-modale in tempo reale
📊 I numeri
Un singolo modello gestisce testo, audio e video nativamente. L'interazione vocale diventa emotiva e istantanea. Può "sentire" frustrazione o gioia nella tua voce.
- Anziani: possono parlare con l'AI naturalmente (senza digitare)
- Bambini: primo amico AI che "capisce l'emozione"
- Call center: multilingue, 24/7, costo: $0.05/chiamata
- Allarme deepfake: "è davvero un umano?"
DeepSeek R1
Terremoto geopolitico
📊 I numeri
Primo LLM cinese competitivo con GPT-4. Matematica a livello olimpiadi. Prezzo 90% più basso. Il multipolarismo dell'AI inizia.
- USA: "La Cina ha recuperato più velocemente del previsto"
- UE: "Siamo ancora più indietro; serve una nostra AI"
- Sud globale: "finalmente, un'opzione non americana"
- India, Brasile, Nigeria: adozione di DeepSeek in impennata
DeepSeek rispetta le linee rosse del PCC. Tiananmen, Taiwan, Uiguri: risposte "approvate dallo stato". Scegliere tra corporate USA e governo cinese.
Devin
Il primo ingegnere software AI
📊 I numeri
Cognition AI presenta Devin, il primo "AI software engineer" autonomo. Può pianificare, scrivere codice, debuggare e deployare applicazioni complete. Demo impressionanti scatenano hype (e controversie).
- Junior dev: task entry-level completamente automatizzati
- Bug fixing: Devin risolve issue GitHub autonomamente
- Code review: analisi automatica di PR e refactoring
- Controversie: demo "cherry-picked", benchmark limitati
L'automazione arriva nel coding. Anche se Devin non sostituisce ancora senior dev, il messaggio è chiaro: le task ripetitive di programmazione stanno per scomparire.
Llama 3 / 3.1
Open source raggiunge la frontiera
📊 I numeri
Meta rilascia Llama 3 (Apr 2024) e poi 3.1 405B (Lug 2024). Primo modello open source competitivo con GPT-4o e Claude 3.5. 8 lingue supportate, 128K contesto.
- Enterprise: 50%+ Fortune 500 in produzione con Llama
- Startup: nessun vendor lock-in, costi inference minimi
- Benchmark: #1 istruzioni, #2 math/reasoning, #4 coding
- Fine-tuning: ecosistema esplode (350M+ download)
L'AI di frontiera ora è gratuita e modificabile. Puoi deployarla on-premise, adattarla al tuo dominio, senza dipendere da OpenAI o Google.
Regolamentazione AI Globale
EU AI Act, US Executive Order, China Measures
📊 I numeri
Il 2024 segna l'inizio della regolamentazione globale dell'AI. L'UE adotta la prima legge completa al mondo. USA e Cina seguono approcci radicalmente diversi.
- EU: Rights-based, precautionary, multe fino a €35M o 7% fatturato
- USA: Innovation-first, frammentato, solo executive orders
- Cina: State-led, censura prioritaria, campioni nazionali favoriti
Come con GDPR, le aziende globali si adatteranno agli standard EU. La regolamentazione più severa diventa lo standard de facto mondiale.
OpenAI o1
Ragionamento a catena di pensiero
📊 I numeri
L'AI impara a "pensare" prima di rispondere. Utilizza tempo di calcolo in inferenza per esplorare strategie diverse. Il lavoro intellettuale ora completamente esposto.
- Matematici: "L'AI risolve questo più velocemente"
- Consulenti junior: analisi da 1 settimana → 30 minuti
- Data scientist: feature engineering automatizzato
- Ricercatori: revisione di 10.000 paper in una notte
Aziende che usano o1: +40% output per dipendente. MA: 3-7% dei guadagni → salari dei lavoratori. Il resto: profitti, valore per gli azionisti. La disuguaglianza CRESCE nonostante l'AI.
Claude Computer Use
L'AI esce dalla chat
Claude acquisisce la capacità di guardare uno schermo, muovere il cursore, cliccare e digitare. Può eseguire compiti burocratici su qualsiasi software desktop. 10 volte più veloce di un umano.
- Addetti data entry: intera categoria minacciata
- Assistenti amministrativi: 60% dei compiti automatizzabili
- Onboarding clienti: "compila modulo + verifica" → AI
- Tester QA: "clicca attraverso gli scenari" → AI
Il lavoro da desktop ERA "sicuro dall'automazione". Ora: niente è sicuro. "Il tuo lavoro è automatizzabile se è su un computer."
Apple Intelligence
AI privacy-first per miliardi di utenti
📊 I numeri
Apple lancia AI on-device integrata in iOS 18, iPadOS 18, macOS Sequoia. Processing locale per privacy, integrazione con ChatGPT per task complessi. Democratizzazione AI consumer.
- 2 miliardi di utenti: AI diventa utility quotidiana
- Privacy-first: modello alternativo a cloud AI
- Siri 2.0: assistente realmente utile dopo 13 anni
- Writing tools: correzione/riscrittura ovunque nell'OS
L'AI non è più qualcosa da "usare deliberatamente". È integrata nel sistema operativo. Ogni utente Apple diventa un utente AI, che lo voglia o no.
Sora
L'AI genera video cinematografici
📊 I numeri
OpenAI rilascia Sora, modello di generazione video text-to-video con qualità cinematografica. Può creare clip realistiche, animazioni, mondi virtuali. Industry entertainment sotto shock.
- Stock footage: 100K+ job a rischio (Getty, Shutterstock)
- VFX artists: pre-viz e concept automatizzati
- Advertising: spot TV generati in minuti, non settimane
- Deepfake concerns: disinformazione video scalabile
Con Sora, qualsiasi video può essere falso. L'autenticità visiva, fondamento della verità giornalistica, collassa. Serve urgentemente watermarking e detection AI.
OpenAI Operator
L'AI che naviga il web per te
📊 I numeri
OpenAI lancia Operator, un agent AI che naviga il browser autonomamente. Può fare acquisti online, prenotare viaggi, compilare form, ricercare informazioni complesse. Automazione task quotidiani.
- Assistenti virtuali: prenotazioni e ricerche automatizzate
- Data entry: compilazione form web autonoma
- Shopping assistants: comparazione prezzi e acquisti
- Travel agents: prenotazione voli/hotel end-to-end
Il browser diventa un'interfaccia per l'AI, non per l'umano. Task che richiedevano 30 minuti → 2 minuti con supervisione. La produttività individuale esplode, ma i ruoli intermedi scompaiono.
Claude Code CLI
L'AI nel terminale
📊 I numeri
Claude gira nel terminale. Legge file, modifica codice, esegue comandi shell. Loop di feedback autonomo: test fallisce → AI rilegge errore → corregge → ri-testa.
- "Copilot era carino, ma Claude Code CLI è la fine"
- Tassi di completamento bootcamp: in calo
- "Perché imparare a programmare se l'AI lo fa?"
- 2 ingegneri + Claude Code = team di 10 ingegneri
Lavoratori ad alta qualifica: potenziati, 2 volte più produttivi. Lavoratori a bassa qualifica: spiazzati, meno opportunità. Sud globale: meno creazione di posti di lavoro che al Nord.
CodeMachine
Il loop di auto-correzione
Primo sistema di self-healing code generation: definisci l'obiettivo → l'LLM pianifica → scrive codice → esegue test. Se il test fallisce? L'LLM legge l'errore → riscrive → ri-testa. Il loop continua fino al successo.
- Zero intervento umano necessario per molti task
- Iterazioni automatiche fino a max tentativi
- Il developer diventa supervisore, non esecutore
BMAD Method
Architettura multi-agente
📊 I numeri
Build Measure Analyze Design — un framework che trasforma un'idea vaga in specifiche dettagliate. Agente PM → Agente Ricerca → Agente Codice → Agente QA, ognuno con ruolo specializzato.
- Il product management diventa AI-mediato
- Da brief a backlog completo in ore, non settimane
- Riduzione drastica del lavoro di documentazione
Claude Flow
Orchestrazione di team AI
Non un singolo bot, ma un team coordinato di agenti. Un Project Manager AI delega a Ricercatore e Coder. MCP (Model Context Protocol) coordina gli output tra agenti.
- Interi scrum team sostituiti da ensemble AI
- 1 CEO + 5 agenti AI > azienda tradizionale da 100 persone
- Struttura costi: 10x meno costo del lavoro
- Startup vs Fortune 500 ora più alla pari
70% meno PM (l'AI orchestra) • 50% meno ingegneri mid-level (solo supervisione) • 90% meno tester (l'AI testa autonomamente) • 40% meno ricercatori junior
Claude Skills
Competenze modulari e personalizzabili
Sistema di skill modulari che estende le capacità di Claude. Ogni skill è una cartella con best practice, template e istruzioni per task specifici: creazione documenti (docx, pptx, xlsx, pdf), design frontend, costruzione MCP server, e altro.
- Skill pubbliche: docx, pptx, xlsx, pdf, frontend-design
- Skill utente: workflow personalizzati caricati dall'utente
- Skill esempio: brand-guidelines, mcp-builder, skill-creator
- Claude legge il file SKILL.md prima di ogni task rilevante
Ogni azienda può creare skill personalizzate con le proprie linee guida, template e workflow. Claude diventa un'estensione del knowledge aziendale.
MCP + A2A Standard
I protocolli diventano universali
Model Context Protocol riceve OAuth, output strutturati, best practice di sicurezza. Agent-to-Agent Protocol entra nella Linux Foundation con oltre 100 organizzazioni. L'infrastruttura per l'orchestrazione è completa.
- MCP connette agenti a strumenti
- A2A permette agli agenti di comunicare tra loro
- Standard aperti → niente vendor lock-in
- Le aziende possono costruire su fondamenta stabili
GPT-5
Architettura unificata con router dinamico
📊 I numeri
Il modello più significativo dal GPT-4. Sistema unificato con router in tempo reale che decide dinamicamente tra risposte veloci e modalità "pensiero". Sostituisce o3, o4-mini e GPT-4o come modelli separati.
Il governo federale USA annuncia l'accesso a ChatGPT Enterprise per l'intera forza lavoro dell'esecutivo.
Claude Sonnet 4.5
Migliore della categoria per agenti e coding
📊 I numeri
Cursor lo definisce "prestazioni di coding allo stato dell'arte". Devin riporta +18% pianificazione, +12% punteggi end-to-end. 0% tasso errori sui test di modifica codice (vs 9% Sonnet 4).
- Cognition acquisisce Windsurf a $10.2B di valutazione
- Devin: tasso di merge 67% su Goldman, Santander, Nubank
- Cursor supera $500M di ricavi annuali, oltre il 50% delle Fortune 500
Gemini 3.0 Pro
Google riprende la leadership
📊 I numeri
Supera GPT-5 Pro (31.64%) su Humanity's Last Exam. Gemini Enterprise connette dati aziendali attraverso Microsoft 365, Salesforce, SAP, BigQuery.
Claude Opus 4.5
Il modello più avanzato al mondo
📊 I numeri
"Il miglior modello al mondo per coding, agenti e uso del computer." Descritto come il modello frontier più robustamente allineato, con resistenza superiore alla prompt injection.
- Prezzo: $5/$25 per milione di token
- Capacità a livello Opus ora accessibili
- Haiku 4.5: uso computer a 1/3 del costo di Sonnet
MCP Anniversary Release
Workflow basati su task e loop agentici
A un anno dal lancio, MCP introduce workflow basati su task (sperimentali), registrazione client basata su URL, OAuth machine-to-machine. I server MCP possono ora eseguire loop agentici usando token del client.
📊 Impatto misurato
Se gestisci persone: Il tuo lavoro è passato da "fare il lavoro" a "orchestrare l'AI". Il tuo valore: giudizio, etica, responsabilità.
Se fai lavoro intellettuale routinario: Alta probabilità di disruption nei prossimi 24 mesi. Riqualificazione: urgente.
Se sei giovane (< 30 anni): Aspettati 3-4 cambi di carriera completi, non 1-2.