RAG multimodale in locale: guida completa con Sentence Transformers v5.4 e Qwen3-VL

Finora fare RAG su documenti visivi — PDF scansionati, screenshot, slide, immagini di prodotto — richiedeva pipeline complesse con OCR, pre-processing e modelli separati per testo e immagini. Sentence Transformers v5.4 cambia questo: con una singola API puoi creare embedding multimodali su testo, immagini e video, e costruire sistemi di ricerca semantica che funzionano cross-modale. […]
LLM locale con Claude Code: guida completa con Ollama — hardware, modelli e performance reali

Ollama ha un’integrazione ufficiale con Claude Code da gennaio 2026: un solo comando, un modello locale compatibile con tool calling, e Claude Code smette di parlare con i server Anthropic per usare la GPU che hai sul tavolo. Questa guida ti porta dal nulla a un setup funzionante, con dati di performance reali per ogni […]
