H Company ha rilasciato Holo3 e ha riscritto il leaderboard del computer use: 78,85% su OSWorld-Verified, nuovo state-of-the-art assoluto — superando modelli proprietari con molti più parametri e un costo di inferenza ben più alto. Architettura MoE da 35B parametri totali, 10B attivi per token. Licenza Apache 2.0. I pesi sono già su HuggingFace.
Cos’è il computer use e perché conta
Il computer use è la capacità di un modello di controllare autonomamente interfacce grafiche desktop — cliccare, digitare, navigare tra applicazioni — per completare task complessi. Non è un chatbot che risponde a domande: è un agente che opera su software reale come farebbe un umano.
OSWorld-Verified è il benchmark di riferimento per questo dominio: misura la percentuale di task completati correttamente su interfacce desktop reali (e-commerce, business software, collaboration tool, workflow multi-applicazione). Prima di Holo3, i migliori modelli si attestavano intorno al 70-72%.
Specifiche tecniche
- Architettura: MoE (Mixture of Experts) — 35B parametri totali, 10B attivi per token in inference
- Nome HuggingFace:
Hcompany/Holo3-35B-A3B - Licenza: Apache 2.0 — uso commerciale consentito
- Input: testo + immagini (multimodale)
- Addestramento: 486 task multi-step in 4 categorie (e-commerce, business software, collaboration, multi-app)
- API gratuita: disponibile su hcompany.ai/holo-models-api
Benchmark: confronto con i modelli concorrenti
| Modello | OSWorld-Verified | Parametri attivi | Licenza | Disponibilità |
|---|---|---|---|---|
| Holo3 | 78,85% | 10B (su 35B) | Apache 2.0 | HuggingFace + API |
| Claude Opus 4.6 | ~72% | n/d (proprietario) | Proprietario | API Anthropic |
| GPT-5.4 | ~70% | n/d (proprietario) | Proprietario | API OpenAI |
| Gemini 3.1 Pro | ~68% | n/d (proprietario) | Proprietario | API Google |
Fonte: OSWorld-Verified leaderboard, aprile 2026. I modelli proprietari senza score ufficiale sono indicati come stime dai report H Company.
Come accedervi
I pesi completi sono su HuggingFace. Per chi ha l’hardware adatto (almeno 24GB VRAM per i pesi float16, meno con quantizzazione) può scaricarli e usarli in locale. Per chi non ha la GPU, l’API gratuita è la via più rapida:
# Accesso via API (gratuita, in beta)
curl -X POST https://api.hcompany.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "holo3",
"messages": [{"role": "user", "content": "Apri Chrome e cerca il prezzo corrente di RTX 5080 su Amazon"}]
}'
Per chi è adatto
Sì, Holo3 fa al caso tuo se: stai costruendo automazioni desktop, pipeline di test automatizzati su interfacce grafiche, o agenti che devono operare su software legacy senza API. È anche una base eccellente per workflow di scraping visuale dove il sito non ha API accessibili.
No, non è la scelta giusta se: hai bisogno di un LLM per coding o chat — in quel dominio Qwen3-coder o Gemma 4 sono più efficienti per la stessa VRAM. Holo3 è specializzato, non generalista.
