Nelle ultime settimane è esploso il fenomeno ChatGPT. Si tratta di un prototipo di agente conversazionale basato su di un sistema di Intelligenza Artificiale ad apprendimento automatico (machine learning) sviluppato dalla società OpenAI 1, e su cui la stessa Microsoft ha investito oltre dieci miliardi di dollari. “
Un saggio, un articolo, il copione di un film, le risposte di un quiz ma anche del codice informatico: non c’è cosa che con un breve input testuale nella finestra da chat del programma non si possa generare.
Se si chiede a ChatGPT di menzionare le sue fonti rispetto ad un testo che ha prodotto, il chatbot risponde infatti, inevitabilmente, o che non è in grado di indicarle (e che occorre fare riferimento alle banche dati bibliografiche); o indicando fonti bibliografiche largamente “inventate”. Questo perché ChatGPT è stato costruito utilizzando algoritmi di apprendimento automatico, in particolare di Deep Learning. I suoi “dati di allenamento” consistono in moltissimi testi, provenienti da varie fonti, ivi compresi testi accademici.
Tuttavia, l’accuratezza delle risposte dipende in via principale dalla qualità e accuratezza delle informazioni contenute nei suoi dati di allenamento. Inoltre, essendo stato addestrato utilizzando una variante dell’apprendimento non supervisionato che è la c.d. “modellazione del linguaggio mascherato” quando genera una risposta utilizza le conoscenze acquisite dai suoi dati di formazione per generare nuovo testo, completando le informazioni mancanti. Sicché, se “inventare” non è il verbo corretto, vero è, tuttavia, che i testi generati sono a rischio elevato di imprecisione, se non di vero e proprio errore. Certamente, pero, hanno un’apparenza di originalità: e per questo sfuggono anche al controllo dei software antiplagio.
Sapere e comprendere tutto questo è fondamentale, prima di decidere se e come servirsi dello strumento.