Costruire agenti AI affidabili richiede ore di lavoro che non c’entrano nulla con l’intelligenza del modello: sandbox sicure, state management tra i turn, gestione degli errori di tool, orchestrazione tra più agenti. Anthropic risolve tutto questo con Claude Managed Agents, ora in public beta — disponibile per tutti gli account API senza richiesta separata.

Cosa cambia rispetto a prima

Prima: partivi da zero. Sandbox manuale, gestione del contesto, retry logic, logging degli errori di tool execution — tutto codice da scrivere e mantenere. Il time-to-production di un agente affidabile era nell’ordine dei mesi.

Con Managed Agents: Anthropic gestisce l’infrastruttura. Tu definisci l’agente (system prompt, tool, skill), Anthropic crea il container, gestisce l’esecuzione e il recovery dagli errori. Il time-to-production secondo i dati interni è sceso a giorni.

I componenti della piattaforma

Performance: +10% nel task success rate

Anthropic riporta un miglioramento del 10% nel task success rate rispetto al prompting standard sulla stessa API. La differenza viene dall’orchestrazione gestita: quando un tool fallisce, il sistema riprova con strategia diversa invece di fermarsi. Rakuten ha deployato agenti specializzati in una settimana ciascuno. Notion, Asana e Sentry riportano riduzione significativa del tempo di sviluppo.

Pricing

Voce Costo Note
Token input (Claude Sonnet 4.6) $3/MTok Con prompt caching attivo il costo scende significativamente
Token output (Claude Sonnet 4.6) $15/MTok Standard Sonnet
Container sandbox runtime $0,08/ora Addebitato solo durante l’esecuzione attiva
Rate limit creazione sessioni 60 req/min
Rate limit lettura/streaming 600 req/min

Cosa è ancora in research preview

Multiagent (più agenti che collaborano), outcomes (ottimizzazione automatica dei result) e memory (persistenza a lungo termine) sono ancora in research preview con accesso limitato. La public beta copre il caso d’uso principale: agente singolo con tool execution gestita.

Impatto pratico per chi usa Claude Code e l’API

Se usi già Claude via API per automazioni, Managed Agents riduce il codice boilerplate in modo significativo. Se hai agenti che spesso falliscono su errori di tool execution intermittenti, la gestione automatica del recovery è il guadagno più immediato. Il costo aggiuntivo del container ($0,08/ora) è trascurabile per task brevi — diventa rilevante per agenti che girano per ore in modo continuativo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *