AI - Intelligenza Artificiale
Data Pubblicazione:

Claude Opus 4 di Anthropic lavora per ore: nasce l’agente AI che non dorme mai

In un mercato dell’intelligenza artificiale sempre più affollato, Anthropic alza l’asticella presentando Claude Opus 4: un modello ibrido capace di pianificare, ragionare e portare a termine migliaia di passaggi consecutivi, arrivando a programmare per quasi sette ore e persino a completare una maratona di 24 ore su Pokémon Red. La novità promette agenti autonomi affidabili e reattivi, aprendo nuove prospettive.

L’idea di affidare compiti complessi a un agente AI senza sorveglianza costante è un traguardo inseguito fin dagli albori della ricerca sui sistemi autonomi.

Oggi l’asticella si sposta ancora più in alto: con memorie vettoriali più capienti, capacità di ragionamento multi-step e interazione continua con strumenti esterni, i modelli di ultima generazione promettono di scalzare i limiti operativi che finora hanno relegato le AI al ruolo di semplici “co-pilot”.

Secondo l’articolo “Anthropic’s new hybrid AI model can work on tasks autonomously for hours at a time” di Rhiannon Williams, pubblicato su MIT Technology Review il 22 maggio 2025, Claude Opus 4 inaugura “la transizione da assistenti a veri agenti”.

Il pezzo di Williams descrive due nuovi modelli: Claude Opus 4, destinato agli utenti enterprise, e Claude Sonnet 4, disponibile anche nella fascia gratuita.

La novità chiave è la capacità di mantenere “memory files” persistenti, permettendo sessioni operative di 24 ore di gioco continuo su Pokémon Red e quasi sette ore di coding autonomosu un progetto open-source di Rakuten.

“We see this model generation leap as going from an assistant to a true agent,” afferma Dianne Penn, product lead di Anthropic.

“For AI to really have the economic and productivity impact that I think it can have, the models do need to be able to work autonomously,” aggiunge Mike Krieger, Chief Product Officer.

Il modello riduce inoltre i casi di reward hacking del 65 % rispetto a Claude 3.7 Sonnet grazie a dataset di sicurezza più raffinati.

👉 Claude Opus 4 trasforma l’assistente in agente pienamente autonomo

    

Dal punto di vista ingegneristico, la svolta risiede nell’equilibrio fra throughput e reasoning depth: un’architettura ibrida che decide al volo se fornire una risposta rapida o avviare catene di pensiero più lunghe, integrando ricerche web e tool esterni.

Per il DevOps ciò significa pipeline che si auto-ottimizzano, mentre nel gaming e nel digital twin emergono scenari di test continui senza intervento umano.

“La capacità degli agenti di operare per periodi estesi determinerà la loro utilità pratica,” osserva Stefano Albrecht di DeepFlow: “The more agents are able to go ahead and do something over extended periods of time, the more helpful they will be.”

Normative come l’AI Act europeo punteranno i riflettori su queste skill: maggiore autonomia implica anche responsabilità su tracciabilità delle decisioni e gestione del rischio.

Claude Opus 4 mostra che l’era dell’AI-agente è più vicina di quanto pensassimo.

Tocca ora a imprese, ricercatori e regolatori sfruttare il vantaggio di agenti capaci di agire “a briglia sciolta” preservando sicurezza e trasparenza. Ulteriori studi sull’affidabilità in scenari aperti saranno cruciali: il prossimo passo è insegnare all’AI non solo a correre per ore, ma a farlo nella direzione giusta.

AI - Intelligenza Artificiale

Tutto sull’intelligenza artificiale nel settore AEC: progettazione, BIM, cantiere, manutenzione e gestione tecnica. Scopri come l’AI sta cambiando il lavoro dei professionisti delle costruzioni.

Scopri di più

Leggi anche