Costruire agenti AI affidabili richiede ore di lavoro che non c’entrano nulla con l’intelligenza del modello: sandbox sicure, state management tra i turn, gestione degli errori di tool, orchestrazione tra più agenti. Anthropic risolve tutto questo con Claude Managed Agents, ora in public beta — disponibile per tutti gli account API senza richiesta separata.
Cosa cambia rispetto a prima
Prima: partivi da zero. Sandbox manuale, gestione del contesto, retry logic, logging degli errori di tool execution — tutto codice da scrivere e mantenere. Il time-to-production di un agente affidabile era nell’ordine dei mesi.
Con Managed Agents: Anthropic gestisce l’infrastruttura. Tu definisci l’agente (system prompt, tool, skill), Anthropic crea il container, gestisce l’esecuzione e il recovery dagli errori. Il time-to-production secondo i dati interni è sceso a giorni.
I componenti della piattaforma
- Agent: il modello con il suo system prompt, i tool disponibili e le skill configurate
- Environment: container cloud con Python, Node.js e Go pre-installati — esegue i tool dell’agente
- Session: istanza dell’agente attiva per uno specifico task, con stato persistente durante l’esecuzione
- Tool integrati di default: Bash, operazioni su file, web search, server MCP
Performance: +10% nel task success rate
Anthropic riporta un miglioramento del 10% nel task success rate rispetto al prompting standard sulla stessa API. La differenza viene dall’orchestrazione gestita: quando un tool fallisce, il sistema riprova con strategia diversa invece di fermarsi. Rakuten ha deployato agenti specializzati in una settimana ciascuno. Notion, Asana e Sentry riportano riduzione significativa del tempo di sviluppo.
Pricing
| Voce | Costo | Note |
|---|---|---|
| Token input (Claude Sonnet 4.6) | $3/MTok | Con prompt caching attivo il costo scende significativamente |
| Token output (Claude Sonnet 4.6) | $15/MTok | Standard Sonnet |
| Container sandbox runtime | $0,08/ora | Addebitato solo durante l’esecuzione attiva |
| Rate limit creazione sessioni | 60 req/min | — |
| Rate limit lettura/streaming | 600 req/min | — |
Cosa è ancora in research preview
Multiagent (più agenti che collaborano), outcomes (ottimizzazione automatica dei result) e memory (persistenza a lungo termine) sono ancora in research preview con accesso limitato. La public beta copre il caso d’uso principale: agente singolo con tool execution gestita.
Impatto pratico per chi usa Claude Code e l’API
Se usi già Claude via API per automazioni, Managed Agents riduce il codice boilerplate in modo significativo. Se hai agenti che spesso falliscono su errori di tool execution intermittenti, la gestione automatica del recovery è il guadagno più immediato. Il costo aggiuntivo del container ($0,08/ora) è trascurabile per task brevi — diventa rilevante per agenti che girano per ore in modo continuativo.
