Holo3: il modello open source che batte tutti nel computer use — 78,85% su OSWorld, Apache 2.0

H Company ha rilasciato Holo3 e ha riscritto il leaderboard del computer use: 78,85% su OSWorld-Verified, nuovo state-of-the-art assoluto — superando modelli proprietari con molti più parametri e un costo di inferenza ben più alto. Architettura MoE da 35B parametri totali, 10B attivi per token. Licenza Apache 2.0. I pesi sono già su HuggingFace. Cos’è […]
ASUS UGen300: acceleratore AI USB-C da 40 TOPS per trasformare qualsiasi PC in workstation AI

Finora fare AI in locale su un PC senza GPU dedicata significava scendere a compromessi pesanti: modelli piccoli, risposte lente, o arrendersi al cloud. ASUS cambia le carte con UGen300, un acceleratore AI che si collega semplicemente via USB-C e aggiunge 40 TOPS di potenza di calcolo dedicata a qualsiasi macchina — desktop o laptop, […]
AI e sviluppo software: dove ti moltiplica e dove ti frega — analisi da 3 mesi di Claude Code su progetto reale

Tre mesi di lavoro reale con Claude Code su un progetto da zero — non un tutorial, non un caso di studio costruito per l’articolo. Lalit Maganti, engineer con anni di esperienza, ha usato Claude Code quotidianamente per costruire syntaqlite, un linter e verificatore per SQLite, dopo 8 anni in cui continuava a rimandare per […]
Google AI Edge Gallery: Gemma 4 gira offline su iPhone — gratis sull’App Store

Google ha pubblicato AI Edge Gallery sull’App Store: un’app gratuita che esegue Gemma 4 E2B e E4B direttamente sull’iPhone, senza connessione internet, senza dati inviati a server esterni. L’inference avviene completamente in locale usando la Neural Engine di Apple Silicon. Simon Willison, che la segue da vicino, la definisce “un’app veramente utile” — non un […]
LLM locale con Claude Code: guida completa con Ollama — hardware, modelli e performance reali

Ollama ha un’integrazione ufficiale con Claude Code da gennaio 2026: un solo comando, un modello locale compatibile con tool calling, e Claude Code smette di parlare con i server Anthropic per usare la GPU che hai sul tavolo. Questa guida ti porta dal nulla a un setup funzionante, con dati di performance reali per ogni […]
GLM-5.1: LLM open source da 754B quasi pari a Claude Opus 4.6 — licenza MIT, gratis

Z.AI (Zhipu) ha rilasciato GLM-5.1, un modello Mixture-of-Experts da 754 miliardi di parametri con licenza MIT. I benchmark lo posizionano a pochi decimali di distanza da Claude Opus 4.6 su coding, matematica avanzata e ragionamento scientifico. La differenza più rilevante rispetto ai modelli precedenti: le capacità agentiche — GLM-5.1 può eseguire task autonomi per fino […]
Gemma 4: Google lancia 4 modelli open source Apache 2.0 — il 31B è #3 al mondo

Google DeepMind ha rilasciato Gemma 4 il 2 aprile 2026: quattro modelli open source con licenza Apache 2.0, multimodali nativi (testo, immagini, video), context window fino a 256k token. Il modello da 31B parametri è attualmente al terzo posto nella classifica mondiale Arena AI leaderboard tra tutti i modelli open, battendo sistemi con 10 volte […]
