GUIDA PRATICA PER ESEGUIRE LLM LOCALI E MODELLI MOE
INDICE
Introduzione
CHE COSA SIGNIFICA AVERE UN PC PER L'IA
I COMPONENTI FONDAMENTALI
ASSEMBLAGGIO PASSO PASSO
OTTIMIZZAZIONE DEL SISTEMA
QUALI MODELLI LLM POSSO ESEGUIRE IN LOCALE
MODELLI MOE CONSIGLIATI
LIMITI DELLA CONFIGURAZIONE
ELENCO COMPONENTI E COSTI
Conclusione
INTRODUZIONE
Negli ultimi anni l'intelligenza artificiale generativa è diventata accessibile anche agli utenti privati. Oggi è possibile eseguire modelli linguistici avanzati direttamente sul proprio computer senza connessione internet, mantenendo il pieno controllo dei dati e riducendo i costi di utilizzo.
L'obiettivo di questo articolo è mostrare come assemblare un PC dedicato all'intelligenza artificiale locale utilizzando i componenti già selezionati e quali modelli linguistici siano realmente compatibili con questa configurazione.
CHE COSA SIGNIFICA AVERE UN PC PER L'IA
Un computer per l'intelligenza artificiale non deve necessariamente essere una workstation da migliaia di euro.
Per attività come:
• chatbot personali
• analisi documentale
• sistemi RAG
• scrittura assistita
• supporto clinico e nutrizionale
• generazione di contenuti
• agenti IA locali
è possibile ottenere risultati molto interessanti con una configurazione di fascia media ben progettata.
La differenza principale rispetto a un normale PC da ufficio è rappresentata dalla quantità di memoria RAM, dalla velocità dell'SSD e dalla capacità della CPU di elaborare grandi quantità di dati.
I COMPONENTI FONDAMENTALI
La scheda madre scelta è la MSI PRO B760M-P DDR4, compatibile con processori Intel di dodicesima, tredicesima e quattordicesima generazione e con memoria DDR4 fino a 128 GB. Dispone inoltre di slot M.2 PCIe 4.0 per SSD NVMe ad alta velocità. (MSI)
Per ottenere prestazioni adeguate nell'esecuzione di LLM locali è consigliabile utilizzare:
Processore
Intel Core i5-13400
oppure
Intel Core i7-13700
Memoria RAM
32 GB DDR4 rappresentano il minimo consigliato.
64 GB DDR4 rappresentano la scelta ideale.
Archiviazione
SSD NVMe PCIe 4.0 Crucial P5 Plus o equivalente.
Gli SSD PCIe 4.0 permettono caricamenti molto più rapidi dei modelli linguistici. (Bpm Power)
Alimentatore
650 W certificazione 80 Plus Bronze o superiore.
Case
Micro-ATX con buon flusso d'aria.
ASSEMBLAGGIO PASSO PASSO
- Installare il processore sulla scheda madre.
- Applicare la pasta termica.
- Montare il dissipatore.
- Installare i moduli RAM negli slot consigliati dal manuale.
- Inserire l'SSD NVMe nello slot M.2.
- Fissare la scheda madre al case.
- Installare l'alimentatore.
- Collegare i cavi di alimentazione.
- Collegare pannello frontale, USB e ventole.
- Accendere il sistema ed entrare nel BIOS.
- Aggiornare il BIOS all'ultima versione disponibile.
- Attivare il profilo XMP della memoria.
- Installare Windows 11 o Linux.
OTTIMIZZAZIONE DEL SISTEMA
Per ottenere il massimo dalle applicazioni IA locali è consigliabile:
• disattivare software inutili in avvio
• mantenere almeno il 20% dell'SSD libero
• utilizzare SSD dedicati ai modelli
• installare Ollama
• installare LM Studio
• installare Open WebUI
Questa combinazione permette di creare un vero assistente IA locale.
QUALI MODELLI LLM POSSO ESEGUIRE IN LOCALE
Con 32 GB di RAM
Modelli consigliati:
• Ollama + Qwen3 4B
• Qwen3 8B
• Gemma 3 4B
• Gemma 3 12B quantizzato
• Llama 3.1 8B
• Mistral 7B
• Phi 4
Prestazioni generalmente molto buone.
Con 64 GB di RAM
È possibile utilizzare:
• Qwen3 14B
• Gemma 3 27B quantizzato
• DeepSeek R1 Distill 32B
• Llama 3.3 70B in quantizzazione aggressiva
• Mistral Small
MODELLI MOE CONSIGLIATI
I modelli Mixture of Experts rappresentano una delle evoluzioni più interessanti dell'IA moderna.
In questi modelli non vengono attivati tutti i parametri contemporaneamente ma solo una parte degli esperti specializzati.
Con 64 GB di RAM risultano particolarmente interessanti:
• Qwen3-30B-A3B
• DeepSeek-V3 Lite
• DeepSeek-R1 Distill
• Mixtral 8x7B
• Mixtral 8x22B quantizzato
Per attività professionali di nutrizione, ricerca scientifica, produzione di articoli e analisi documentale il modello che offre probabilmente il miglior compromesso tra qualità e velocità è Mixtral 8x7B.
LIMITI DELLA CONFIGURAZIONE
Senza scheda grafica dedicata NVIDIA con almeno 16 GB di VRAM non sarà possibile utilizzare comodamente:
• DeepSeek V3 completo
• Qwen3 235B
• GPT OSS 120B
• Llama 4 Scout completo
• Llama 4 Maverick completo
Questi modelli richiedono workstation molto più potenti.
Per il lavoro quotidiano di un biologo nutrizionista, invece, modelli da 7B, 14B e alcuni MOE leggeri risultano già più che adeguati.
ELENCO COMPONENTI E COSTI
Configurazione consigliata
Scheda madre
Prezzo medio:
90-110 €
Processore
Intel Core i5-13400
Prezzo medio:
180-220 €
RAM
32 GB DDR4 3200 MHz
Prezzo medio:
60-80 €
oppure
64 GB DDR4 3200 MHz
Prezzo medio:
120-160 €
SSD
Crucial P5 Plus 1 TB
Prezzo medio:
80-120 €
Alimentatore
Corsair CX650
Prezzo medio:
70-90 €
Case
Micro-ATX airflow
Prezzo medio:
50-80 €
Dissipatore
Thermalright Assassin X
Prezzo medio:
20-30 €
Costo totale indicativo
Versione 32 GB:
circa 500-650 €
Versione 64 GB:
circa 650-850 €
CONCLUSIONE
L'esecuzione locale di modelli linguistici rappresenta oggi una soluzione concreta per professionisti, ricercatori e operatori sanitari che desiderano utilizzare l'intelligenza artificiale mantenendo il controllo dei dati.
Una configurazione basata su scheda madre MSI PRO B760M-P DDR4, processore Intel Core i5 o i7 di tredicesima generazione, 64 GB di RAM e SSD NVMe PCIe 4.0 consente già di utilizzare numerosi modelli LLM e MOE di ultima generazione per attività professionali avanzate, compresa l'analisi documentale, la creazione di contenuti e lo sviluppo di sistemi RAG locali.
Disclaimer
Le informazioni contenute in questo documento hanno esclusivamente finalità informative, educative e divulgative. Le procedure di assemblaggio hardware, aggiornamento del BIOS, installazione del sistema operativo, configurazione software e utilizzo di modelli di intelligenza artificiale vengono descritte a scopo orientativo e potrebbero non essere adatte a tutte le configurazioni hardware.
L’autore e il distributore del presente materiale non assumono alcuna responsabilità per eventuali danni diretti o indiretti a componenti hardware, periferiche, dispositivi di archiviazione, sistemi operativi, software, dati personali o professionali derivanti dall’applicazione delle informazioni riportate.
L’assemblaggio di un computer comporta rischi tecnici, inclusi danni causati da scariche elettrostatiche, montaggio errato dei componenti, impostazioni BIOS non corrette, incompatibilità hardware, problemi di alimentazione, surriscaldamento o utilizzo improprio delle apparecchiature.
Prima di effettuare qualsiasi modifica hardware o software è consigliabile verificare la compatibilità dei componenti attraverso la documentazione ufficiale del produttore e, se necessario, richiedere il supporto di un tecnico qualificato.
I prezzi, le disponibilità e le caratteristiche tecniche dei componenti possono variare nel tempo. Eventuali link commerciali, inclusi quelli verso piattaforme di e-commerce, sono forniti esclusivamente come riferimento e non costituiscono raccomandazione d’acquisto né garanzia di disponibilità, compatibilità o prestazioni.
L’utilizzo di modelli di intelligenza artificiale locali è sotto la completa responsabilità dell’utente. Prima di impiegare tali strumenti in ambito professionale, sanitario, legale, amministrativo o finanziario è necessario verificare in modo indipendente l’accuratezza delle informazioni prodotte.
Procedendo con l’assemblaggio e la configurazione del sistema, l’utente accetta di assumersi integralmente ogni rischio connesso all’utilizzo delle informazioni contenute nel presente documento.
Disclaimer:
I contenuti sono generati con l’ausilio di ChatGPT e verificati con Gemini, sulla base di idee nate dal mio lavoro di biologo nutrizionista ed esperto in IA per la sanità e la nutrizione. Ogni testo è esaminato, adattato e validato secondo le mie competenze professionali. Le informazioni hanno scopo divulgativo e non sostituiscono la consulenza di un professionista sanitario qualificato.
Glossario
LLM: Large Language Model.
MOE: Mixture of Experts.
VRAM: memoria dedicata della scheda video.
RAG: Retrieval Augmented Generation.
Quantizzazione: tecnica che riduce l'occupazione in memoria dei modelli.
RIFERIMENTI BIBLIOGRAFICI
MSI PRO B760M-P DDR4 Specifiche Ufficiali
Crucial P5 Plus Informazioni Tecniche
👨⚕️ DR ORICCHIO GENNARO
🧬 BIOLOGO 🍽️ NUTRIZIONISTA
🌐 IAMIA.IT
📕 Numero Iscrizione Albo Sezione A: AA_091060
📕 ESPERTO IN INTELLIGENZA ARTIFICIALE PER LA SANITÀ E LA NUTRIZIONE
📞 Tel. 392 2474124
📧 Email: oricchiogennaronutrizionista@gmail.com
📧 Email: www.iamia.it@gmail.com
🌐 WEB: https://www.oricchiogennaro.it/
📝 BLOG: https://iamia.it/blog
📝 BLOG: https://www.gennarooricchio.it/blog/
🎙️ PODCAST: https://podcasters.spotify.com/pod/show/gennaro10
▶️ YOUTUBE: @nutrizionistaoricchiogennaro