H Company ha rilasciato Holo3 e ha riscritto il leaderboard del computer use: 78,85% su OSWorld-Verified, nuovo state-of-the-art assoluto — superando modelli proprietari con molti più parametri e un costo di inferenza ben più alto. Architettura MoE da 35B parametri totali, 10B attivi per token. Licenza Apache 2.0. I pesi sono già su HuggingFace.

Cos’è il computer use e perché conta

Il computer use è la capacità di un modello di controllare autonomamente interfacce grafiche desktop — cliccare, digitare, navigare tra applicazioni — per completare task complessi. Non è un chatbot che risponde a domande: è un agente che opera su software reale come farebbe un umano.

OSWorld-Verified è il benchmark di riferimento per questo dominio: misura la percentuale di task completati correttamente su interfacce desktop reali (e-commerce, business software, collaboration tool, workflow multi-applicazione). Prima di Holo3, i migliori modelli si attestavano intorno al 70-72%.

Specifiche tecniche

Benchmark: confronto con i modelli concorrenti

Modello OSWorld-Verified Parametri attivi Licenza Disponibilità
Holo3 78,85% 10B (su 35B) Apache 2.0 HuggingFace + API
Claude Opus 4.6 ~72% n/d (proprietario) Proprietario API Anthropic
GPT-5.4 ~70% n/d (proprietario) Proprietario API OpenAI
Gemini 3.1 Pro ~68% n/d (proprietario) Proprietario API Google

Fonte: OSWorld-Verified leaderboard, aprile 2026. I modelli proprietari senza score ufficiale sono indicati come stime dai report H Company.

Come accedervi

I pesi completi sono su HuggingFace. Per chi ha l’hardware adatto (almeno 24GB VRAM per i pesi float16, meno con quantizzazione) può scaricarli e usarli in locale. Per chi non ha la GPU, l’API gratuita è la via più rapida:

# Accesso via API (gratuita, in beta)
curl -X POST https://api.hcompany.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "holo3",
    "messages": [{"role": "user", "content": "Apri Chrome e cerca il prezzo corrente di RTX 5080 su Amazon"}]
  }'

Per chi è adatto

Sì, Holo3 fa al caso tuo se: stai costruendo automazioni desktop, pipeline di test automatizzati su interfacce grafiche, o agenti che devono operare su software legacy senza API. È anche una base eccellente per workflow di scraping visuale dove il sito non ha API accessibili.

No, non è la scelta giusta se: hai bisogno di un LLM per coding o chat — in quel dominio Qwen3-coder o Gemma 4 sono più efficienti per la stessa VRAM. Holo3 è specializzato, non generalista.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *