NVIDIA Nemotron-Cascade-2 su Ollama: 30B MoE, 256k context, reasoning e coding — 24 GB download

NVIDIA ha portato Nemotron-Cascade-2 su Ollama: un modello MoE da 30B parametri totali con 3B attivi per token, context window di 256k token e un focus dichiarato su reasoning avanzato e capacità agentiche. Sul piano dei benchmark: gold medal all’IMO 2025 (matematica) e all’IOI 2025 (informatica). 73mila download in due settimane. Specifiche tecniche Architettura: Mixture […]
Claude Managed Agents in public beta: Anthropic gestisce sandbox e orchestrazione — ecco cosa cambia

Costruire agenti AI affidabili richiede ore di lavoro che non c’entrano nulla con l’intelligenza del modello: sandbox sicure, state management tra i turn, gestione degli errori di tool, orchestrazione tra più agenti. Anthropic risolve tutto questo con Claude Managed Agents, ora in public beta — disponibile per tutti gli account API senza richiesta separata. Cosa […]
RAG multimodale in locale: guida completa con Sentence Transformers v5.4 e Qwen3-VL

Finora fare RAG su documenti visivi — PDF scansionati, screenshot, slide, immagini di prodotto — richiedeva pipeline complesse con OCR, pre-processing e modelli separati per testo e immagini. Sentence Transformers v5.4 cambia questo: con una singola API puoi creare embedding multimodali su testo, immagini e video, e costruire sistemi di ricerca semantica che funzionano cross-modale. […]
Holo3: il modello open source che batte tutti nel computer use — 78,85% su OSWorld, Apache 2.0

H Company ha rilasciato Holo3 e ha riscritto il leaderboard del computer use: 78,85% su OSWorld-Verified, nuovo state-of-the-art assoluto — superando modelli proprietari con molti più parametri e un costo di inferenza ben più alto. Architettura MoE da 35B parametri totali, 10B attivi per token. Licenza Apache 2.0. I pesi sono già su HuggingFace. Cos’è […]
iPhone Air 2 e iPhone 18e arrivano a primavera 2027 con chip A20 — Apple cambia il ciclo di lancio

Apple sta riscrivendo il proprio calendario. Secondo Mark Gurman di Bloomberg, il prossimo anno non ci sarà solo il consueto lancio autunnale di settembre: iPhone Air 2 e iPhone 18e arriveranno nella primavera 2027, probabilmente a marzo o aprile, con chip A20. iPhone Air 2: cosa cambia rispetto al primo Il primo iPhone Air (2025) […]
iPhone Ultra pieghevole: prezzo oltre $2.000, display 7,7″ interno e 5,3″ esterno — settembre 2026

Apple è pronta a entrare nel mercato dei pieghevoli — e lo fa a modo suo: con un prezzo che taglia fuori i curiosi e punta agli early adopter convinti. Secondo Mark Gurman di Bloomberg, l’iPhone Ultra supererà la soglia dei $2.000, con configurazioni top vicino ai $2.800. Design e hardware Il dispositivo ha un […]
ASUS UGen300: acceleratore AI USB-C da 40 TOPS per trasformare qualsiasi PC in workstation AI

Finora fare AI in locale su un PC senza GPU dedicata significava scendere a compromessi pesanti: modelli piccoli, risposte lente, o arrendersi al cloud. ASUS cambia le carte con UGen300, un acceleratore AI che si collega semplicemente via USB-C e aggiunge 40 TOPS di potenza di calcolo dedicata a qualsiasi macchina — desktop o laptop, […]
Samsung Q1 2026: profitti 8x, le memorie per AI server valgono il 95% degli utili

Un solo trimestre in cui Samsung ha guadagnato più di tutto il 2025 insieme. I numeri del Q1 2026 sono fuori scala, e la ragione è una sola: la domanda di memoria per server AI non accenna a rallentare. I numeri del Q1 2026 Samsung ha registrato ricavi consolidati di circa 76,7 miliardi di euro, […]
NVIDIA ribilancia la roadmap 2026: Blackwell cresce al 71%, Rubin rallenta

NVIDIA ha rivisto la propria roadmap per il 2026 e i numeri raccontano una storia chiara: Blackwell domina, Rubin rallenta, Hopper si ritira. Non è un cambio di strategia improvvisato — è la risposta alle pressioni concrete che si trovano quando si fa ingegneria ad alto livello. Cosa cambia nella roadmap Le GPU Blackwell passano […]
AI e sviluppo software: dove ti moltiplica e dove ti frega — analisi da 3 mesi di Claude Code su progetto reale

Tre mesi di lavoro reale con Claude Code su un progetto da zero — non un tutorial, non un caso di studio costruito per l’articolo. Lalit Maganti, engineer con anni di esperienza, ha usato Claude Code quotidianamente per costruire syntaqlite, un linter e verificatore per SQLite, dopo 8 anni in cui continuava a rimandare per […]
