Claude Managed Agents in public beta: Anthropic gestisce sandbox e orchestrazione

Costruire agenti AI affidabili richiede ore di lavoro che non c’entrano nulla con l’intelligenza del modello: sandbox sicure, state management tra i turn, gestione degli errori di tool, orchestrazione tra più agenti. Anthropic risolve tutto questo con Claude Managed Agents, ora in public beta — disponibile per tutti gli account API senza richiesta separata.

Cosa cambia rispetto a prima

Prima: partivi da zero. Sandbox manuale, gestione del contesto, retry logic, logging degli errori di tool execution — tutto codice da scrivere e mantenere. Il time-to-production di un agente affidabile era nell’ordine dei mesi.

Con Managed Agents: Anthropic gestisce l’infrastruttura. Tu definisci l’agente (system prompt, tool, skill), Anthropic crea il container, gestisce l’esecuzione e il recovery dagli errori. Il time-to-production secondo i dati interni è sceso a giorni.

I componenti della piattaforma

Agent: il modello con il suo system prompt, i tool disponibili e le skill configurate
Environment: container cloud con Python, Node.js e Go pre-installati — esegue i tool dell’agente
Session: istanza dell’agente attiva per uno specifico task, con stato persistente durante l’esecuzione
Tool integrati di default: Bash, operazioni su file, web search, server MCP

Performance: +10% nel task success rate

Anthropic riporta un miglioramento del 10% nel task success rate rispetto al prompting standard sulla stessa API. La differenza viene dall’orchestrazione gestita: quando un tool fallisce, il sistema riprova con strategia diversa invece di fermarsi. Rakuten ha deployato agenti specializzati in una settimana ciascuno. Notion, Asana e Sentry riportano riduzione significativa del tempo di sviluppo.

Pricing

Voce	Costo	Note
Token input (Claude Sonnet 4.6)	$3/MTok	Con prompt caching attivo il costo scende significativamente
Token output (Claude Sonnet 4.6)	$15/MTok	Standard Sonnet
Container sandbox runtime	$0,08/ora	Addebitato solo durante l’esecuzione attiva
Rate limit creazione sessioni	60 req/min	—
Rate limit lettura/streaming	600 req/min	—

Cosa è ancora in research preview

Multiagent (più agenti che collaborano), outcomes (ottimizzazione automatica dei result) e memory (persistenza a lungo termine) sono ancora in research preview con accesso limitato. La public beta copre il caso d’uso principale: agente singolo con tool execution gestita.

Impatto pratico per chi usa Claude Code e l’API

Se usi già Claude via API per automazioni, Managed Agents riduce il codice boilerplate in modo significativo. Se hai agenti che spesso falliscono su errori di tool execution intermittenti, la gestione automatica del recovery è il guadagno più immediato. Il costo aggiuntivo del container ($0,08/ora) è trascurabile per task brevi — diventa rilevante per agenti che girano per ore in modo continuativo.