AI - Intelligenza Artificiale | Digitalizzazione | Ingegneria Strutturale | Software Strutturali | CSP FEA S.C.
Data Pubblicazione:

IA generativa e interfacce conversazionali per la fruizione della documentazione tecnica in Ingegneria

L’articolo analizza vantaggi e limiti dei sistemi di IA generativa nell’ingegneria, dove rigore e precisione sono essenziali. Presenta Catenary, la tecnologia sviluppata da GMSC Consulting, progettata per garantire trasparenza, affidabilità e sicurezza nella fruizione di documentazione tecnica privata.

Le moderne tecnologie di IA hanno abbassato le barriere di accesso all’informazione promettendo di poter facilmente trovare ed ottenere informazioni e soluzioni semplicemente facendo una domanda.

I vantaggi sarebbero evidenti, ma questi sistemi di IA sono applicabili anche ai domini tecnici come l’ingegneria dove precisione e accuratezza sono fondamentali?

L’IA generativa può davvero rispondere a domande tecniche complesse riducendo od eliminando il tempo speso su normative manuali e consulenti?

Per capirlo vediamo come funzionano le tecnologie attualmente disponibili, quali sono i loro vantaggi e i loro limiti, ed infine introduciamo una nuova tecnologia IA, Catenary, specificatamente sviluppata per l’ingegneria.

 

  

L’IA generativa: come funziona

Gli assistenti virtuali di IA generativa non sono intelligenti. Questa è la premessa da cui si deve partire per applicare con successo l’IA all’ingegneria.

Le risposte di una IA generativa pura testuale sono generate statisticamente sillaba per sillaba basandosi unicamente sulla probabilità che ha una certa sillaba di continuare correttamente il filo del discorso precedente.

Un comportamento quasi istintivo dell’IA generativa e degli LLM che ne sono l’implementazione.

L’abilità di rispondere a domande anche molto tecniche è dovuta alla capacità di ricordare i testi e gli esercizi studiati durante il loro addestramento.

Gli LLM imparano un po’ come lo studente che si prepara all’esame di analisi facendo migliaia e migliaia di esercizi pur senza capire davvero la teoria.

Approccio che funziona sì, ma che entra in crisi quando si tratta di rispondere a domande nuove, o su informazioni che non sono di dominio pubblico.

Pensiamo alle normative, per esempio, piuttosto che alla documentazione tecnica privata di uno studio o in generale a qualsiasi contesto dove le informazioni sono private.

In tutti questi casi l’IA generativa da sola non può funzionare bene perché non può ricordare quello che non ha mai letto.

  

Cosa sono i RAG?

La soluzione è fornire direttamente all’IA le informazioni che non ha e poi vincolarla ad usare solo queste informazioni (altrimenti l’IA generativa genera, ovvero inventa, quello che non sa).

Questo approccio si chiama Retrieval Augmented Generation (RAG) e la sua efficacia dipende moltissimo dalla precisione con cui le fonti corrette sono identificate e fornite all’IA generativa.

Normalmente per la ricerca delle informazioni utili si usa l’analisi della somiglianza fra gli *embedding della domanda e quelli delle fonti nel database sfruttando l’assunzione implicita che più le fonti sono simili alla domanda e più è probabile che queste siano utili a rispondere.

Ma, la definizione di somiglianza di due testi ottenuta tramite embedding è molto vaga, e spesso considera aspetti tecnicamente irrilevanti come: lo stile, la grammatica, il contesto generale, etc.

In pratica quindi l’approccio di ricerca delle fonti tramite embedding spesso è troppo impreciso per essere utile nei contesti tecnici e normativi.

*Nota: Gli embedding sono dei vettori di lunghezza unitaria che vengono usati nel ML per rappresentare in formato vettoriale il dato in input. La strategia di addestramento fa sì che il prodotto scalare fra vettori calcolati a partire da dati simili sia vicino ad uno, mentre dati diversi daranno un prodotto scalare vicino a 0 o negativo. Gli embedding sono largamente usati come “impronta digitale” dei dati ma anche come valori intermedi usati dalle reti neurali che attraverso molteplici passi di calcolo raccolgono e codificano iterativamente sempre più informazioni.

  

Come evitare i RAG?

La soluzione dei grandi big della tecnologia è evitare la ricerca e selezione delle fonti scegliendo invece di leggere sempre, ad ogni domanda dell’utente, l’intero database.

Questa soluzione, che si potrebbe definire di forza bruta, oltre ad avere costi molto elevati ed in ultima istanza insostenibili su larga scala, tende anche ad allucinare ed essere poco affidabile al crescere della dimensione del database principalmente per due fattori.

Da una parte gli LLM durante il loro addestramento hanno letto raramente esempi di testi molto lunghi e quindi, per usare la metafora dello studente, hanno fatto pochi esercizi di questo tipo.

Dall’altra parte sappiamo che gli LLM non ragionano ma rispondono predicendo ogni volta le sillabe che più probabilmente continuano il discorso.

Questa predizione dipende da tutte le sillabe precedenti (ovvero il totale delle sillabe contenute nel database) rendendo la scelta della sillaba corretta sempre più aleatoria e meno accurata all’aumentare della dimensione del database.

 

Catenary: nuovo paradigma nell’IA

Per superare le limitazioni strutturali evidenziate, serve un cambio di paradigma nell'uso dell'intelligenza artificiale applicata alla documentazione tecnica. È in questo contesto che nasce la tecnologia IA sviluppata da GMSC Consulting.

Catenary è il software di IA studiato per applicazioni ingegneristiche e già usato da CSPFea per fornire supporto ed accesso alla documentazione tecnica dei software Midas. Catenary è nato per affrontare i limiti strutturali degli LLM e dei sistemi RAG nel trattamento della documentazione tecnica privata. 


LEGGI ANCHE Aurora e Catenary: l’Intelligenza Artificiale al servizio dell’Ingegneria Strutturale


 

La strategia tecnologica di Catenary

La visione strategica alla base del vantaggio tecnologico di Catenary si fonda su quattro pilastri:

  1. Combinazione sinergica di tecnologie generative e non-generative: per ottenere accuratezza, trasparenza e sostenibilità, Catenary unisce la potenza dei LLM con strumenti classici di NLP, knowledge graph, ML simbolico e logico.
  2. Automazione e sostenibilità: le pipeline* di training e aggiornamento sono completamente automatizzate e incrementali, per garantire bassi costi di gestione e aggiornamenti continui anche su documenti in evoluzione.
  3. Accessibilità e compliance: l’uso di LLM open source e di piccola/media scala consente il deployment su proprio server o su cloud privato, anche per PMI. Il sistema è nativamente conforme al GDPR e all’AI Act grazie alla tracciabilità delle fonti, alla cifratura dei dati e alla presenza costante di un “human-in-the-loop”.
  4. Specializzazione del motore di IA: Per ogni corpus di documentazione privata e tecnica viene addestrato un motore IA dedicato. Grazie alle pipeline incrementali ed ottimizzate questa strategia è applicabile anche su corpus di documenti ampi e che cambiano con frequenza.

*Nota: Una pipeline di training è una sequenza di processi informatici che a partire dai dati creano ed ottimizzano i modelli di ML ed IA.

 

Strumenti Tecnologici

Per concretizzare la visione strategica, Catenary ha già sviluppato e implementato un insieme articolato di funzionalità tecniche avanzate che lo contraddistinguono. Queste componenti rendono il sistema robusto, efficiente e già operativo in contesti reali.

  • Grafo di conoscenza per default: Catenary rappresenta la conoscenza in forma di grafo semantico. Ogni nodo rappresenta una porzione di informazione o concetto, e ogni arco indica una relazione significativa. Questo approccio supera le limitazioni delle classiche basi dati tabellari, rendendo più naturale l’accesso e il ragionamento sui contenuti tecnici.
  • Decomposizione ottimale dei documenti: i documenti tecnici e proprietari non vengono semplicemente divisi in blocchi testuali (come succede nei RAG), ma analizzati e suddivisi in modo da riflettere la loro struttura logica e gerarchica (capitoli, sezioni, sottosezioni). Ogni porzione mantiene la relazione con il contesto, evitando ambiguità e migliorando la qualità degli embedding.
  • Decomposizione semantica delle fonti: ogni segmento di testo viene ulteriormente scomposto in componenti informative indipendenti (concetti, relazioni, regole) e collegate al frammento originale. Questa granularità migliora la precisione del recupero informativo.
  • Addestramento Fine-tuning degli embeddings: i modelli di embedding vengono personalizzati sui contenuti specifici del cliente. Questo processo aumenta la capacità del sistema di comprendere termini tecnici non presenti nei corpora generici e migliora notevolmente l’accuratezza semantica della ricerca su documenti tecnici riservati.
  • Validazione avanzata delle fonti: una rete LLM valuta la rilevanza effettiva dei testi candidati a diventare fonti per la risposta e selezionati via embedding. Solo i più pertinenti vengono validati per la generazione della risposta, migliorando significativamente la completezza delle informazioni utilizzate.
  • Visualizzazione delle fonti e spiegabilità: ogni risposta è accompagnata dalle fonti utilizzate, visualizzabili dall’utente finale. Questo supporta la trasparenza e garantisce che l’utente resti sempre il decisore informato, in linea con le linee guida dell’AI Act.
  • Modelli LLM competitivi: invece di un unico modello grande e costoso, Catenary utilizza più modelli piccoli, ognuno specializzato su un compito, eseguiti in parallelo tramite spellcaster. Questo consente scalabilità e velocità, riducendo i costi e i requisiti hardware.
  • Spellcaster – Motore di calcolo ML decentralizzato: Catenary sfrutta un’infrastruttura distribuita (Spellcaster) sviluppata specificatamente dal team di Catenary per eseguire in parallelo piccoli modelli LLM su workstation consumer. Spellcaster garantisce resilienza, distribuzione dei carichi, tolleranza ai guasti e costi contenuti.
  • Crittografia client-side (AES-GCM): ogni artefatto (documento, modello, embedding) è cifrato sul client locale prima del caricamento nel cloud tramite crittografia AES-GCM che protegge sia i dati sia la proprietà dell’informazione, prevenendo anche attacchi basati sull’appropriazione indebita dell’identità. Ogni cliente ha il proprio ambiente sicuro, con garanzie contro l’interferenza o la fuga di dati tra clienti diversi. Questo isolamento logico è parte integrante della strategia di crittografia di Catenary. L'architettura multi-tenant di Catenary infatti, pur condividendo risorse infrastrutturali, mantiene separati dati, modelli e pipeline di ogni cliente, assicurando privacy e sicurezza anche in scenari complessi.
  • Pipeline di addestramento automatizzate e incrementali: Catenary costruisce ogni assistente personalizzato su una specifica documentazione tecnica privata. Ogni assistente viene addestrato partendo da zero tramite pipeline interamente automatizzate. Quando la documentazione cambia, l’aggiornamento è proporzionale solo alle modifiche, rendendo sostenibile l’uso su larga scala anche in contesti dove la documentazione privata cambia frequentemente
  • Decomposizione ed analisi delle domande (in corso): le domande complesse vengono scomposte automaticamente in sotto argomenti indipendenti, che vengono analizzati separatamente per la selezione delle fonti utili. Tutte le fonti identificate vengono ordinate non solo per somiglianza, ma anche per utilità rispetto alla domanda per poi scegliere le migliori su cui costruire la risposta finale.

  

Conclusione

L’utilizzo dell’IA generativa per l’accesso alla documentazione tecnica rappresenta una delle frontiere più promettenti – e al tempo stesso più complesse – dell’intelligenza artificiale applicata. Tuttavia, i limiti strutturali dei sistemi puramente generativi e dei sistemi RAG tradizionali rendono evidente che l’approccio “generalista” non è sufficiente per garantire precisione, affidabilità e sicurezza in contesti ad alta criticità come l’ingegneria.

La soluzione sviluppata da GMSC Consulting, Catenary nasce come risposta concreta a questa sfida: non un semplice assistente conversazionale, ma un’infrastruttura cognitiva su misura, capace di comprendere, strutturare e interrogare in modo efficiente la documentazione tecnica privata.

La combinazione sinergica di tecnologie generative e non, l’uso strategico di knowledge graph, la trasparenza delle fonti e l’attenzione a privacy, compliance e sostenibilità operativa, rendono Catenary una piattaforma realmente adatta a supportare l’intelligenza umana – non a sostituirla – nei processi di analisi tecnica di aziende, studi e professionisti che operano con documenti tecnici complessi e riservati.

Vuoi rendere davvero accessibile, sicura e consultabile la tua documentazione tecnica?
Scopri come Catenary può supportare il tuo studio o la tua azienda con un motore IA su misura, trasparente e conforme alle normative.

👉 Approfondisci su www.gmscconsulting.com/catenary-it

AI - Intelligenza Artificiale

Tutto sull’intelligenza artificiale nel settore AEC: progettazione, BIM, cantiere, manutenzione e gestione tecnica. Scopri come l’AI sta cambiando il lavoro dei professionisti delle costruzioni.

Scopri di più

Digitalizzazione

Scopri la digitalizzazione in edilizia: BIM, digital twin, cantiere digitale, piattaforme collaborative e normative. Su INGENIO articoli tecnici e casi reali per innovare il mondo delle costruzioni.

Scopri di più

Ingegneria Strutturale

L’ingegneria strutturale garantisce sicurezza e durabilità alle costruzioni. Scopri su INGENIO materiali, norme, tecnologie e soluzioni per progettare, rinforzare e monitorare strutture nuove ed esistenti.

Scopri di più

Software Strutturali

I software strutturali sono fondamentali per progettare in modo preciso e conforme alle normative. INGENIO raccoglie articoli, recensioni, guide e casi pratici per ingegneri e strutturisti.

Scopri di più

Leggi anche