OpenAI: ora si può simulare una conversazione umana con Chatgpt
La fondazione di OpenAI risale al 2015 su progetto di Elon Musk e Sam Altman. Inizialmente sembrava trattarsi di un’altra idea del miliardario CEO di Tesla destinata ad essere dimenticata. Tuttavia nonostante Musk abbia abbandonato il ruolo da amministratore nel 2018 per conflitto di interessi l’organizzazione ha proseguito con la sua attività di ricerca e ha messo a punto ChatGPT.
Alla base di questo chatbot di OpenAI c’è un modello di linguaggio basato sull’intelligenza artificiale) e sul machine learning, ossia l’apprendimento automatico. Viene considerato una “AI amichevole” in quanto sviluppata per avere conversazioni realistiche e articolate, come con un individuo reale.
OpenAI: l’intelligenza artificiale come beneficio per l’umanità
Nel 2017 l’azienda ha rilasciato un bot progettato appositamente per poter trionfare alle partite del videogioco Dota 2. Si tratta di un multiplayer dove due squadre competono fra loro per distruggere la fortezza avversaria. All’inizio della partita si sceglie un eroe e si possono acquistare oggetti, dopodiché la competizione continua fino all’obiettivo sopra citato.
Nell’agosto 2020 poi OpenAI ha annunciato lo sviluppo del modello linguistico GTP-2, precursore di GTP-3 che poi è quello che la società ha impiegato per ChatGPT. L’annuncio di questo chatbot infine è recente e ha avuto luogo il 30 novembre del 2022. Da allora ha registrato più di 100 milioni di utenti che hanno voluto sperimentarlo.
Come funziona ChatGPT
La funzione di ChatGPT è quella di dialogare con i suoi interlocutori umani nella maniera più naturale possibile. Il chatbot è in grado di sostenere una conversazione composta da più domande concatenate fra di loro e in caso di errore di ammettere le proprie mancanze. In caso di domande inopportune o poco etiche può riuscire a comprenderne la natura e rifiutarsi di rispondere.
Per avviare una conversazione occorre avere un account OpenAI dopodiché è possibile procedere con la prova. L’AI è stato addestrata grazie al sistema RLHF(Reinforcement Learning from Human Feedback). Inizialmente per aiutare l’apprendimento del chabot si sono messi all’opera dei ricercatori che hanno “interpretato” delle conversazioni da usare come esempio.
Una volta creato questo dataset per ChatGPT gli informatici lo hanno accorpato a un altro già esistente, quello predisposto per InstructGPT. Si tratta di un chatbot che OpenAI definisce “parente stretto” di ChatGPT, anche se ha una funzione leggermente diversa. Segue le istruzioni date dall’utente per fornire un output completo e dettagliato.
Confrontando i messaggi scritti dagli “allenatori” di AI che a turno interpretavano l’utente il chatbot il modello ha messo a punto una classifica delle risposte migliori. Per rinforzare l’algoritmo inoltre i ricercatori hanno utilizzato la PPO (Proximal Policy Optimization). Si tratta di un sistema per allenare le AI in ambienti variabili.
I limiti del chatbot di OpenAI
La società ammette che per quanto all’avanguardia e decisamente più complesso rispetto ad altre AI odierne, ChatGPT ha diversi margini di miglioramento. Prima di tutto per quanto le sue risposte siano per la maggior parte sensate ci sono dei casi in cui questa caratteristica viene meno. In altri casi invece l’output appare sensato ma contiene informazioni errate.
A volte inoltre a seconda di come l’utente pone la domanda l’AI può dichiarare di non saper rispondere o meno, anche per leggere variazioni di forma. In caso il chatbot dichiari di non poter dare una risposta il consiglio di OpenAI è semplice. Basta provare a riscrivere la domanda cambiando qualche termine e fare un secondo tentativo.
Un altro aspetto che richiederà miglioramenti è relativo alle richieste di ChatGPT di maggiori dettagli all’utente per comprendere meglio la sua richiesta. Per ora l’algoritmo spesso tira a indovinare con il rischio di andare fuori tema o sviare la domanda confondendo l’utente. Usarlo richiede di essere più dettagliati possibile nella domanda da porre.
Per quanto riguarda invece le domande inappropriate il processo di riconoscimento non è ancora infallibile ed è possibile che in alcuni casi ChatGPT risponda comunque. Allo scopo di bloccare simili richieste OpenAI ricorre a Moderation API. che permette agli sviluppatori di intervenire in caso di necessità per assistere l’AI.