Intelligenza artificiale e humor, analisi di un fenomeno da mettere alla prova
Una ricerca condotta dalla Cornell University in collaborazione con OpenAI stessa, pubblicata dalla Association for Computational Linguistics, ha messo alla prova l’abilità di ChatGPT versione 4 (la più recente) di riconoscere lo humour e di abbinare alcune vignette del New Yorker alle rispettive didascalie date in forma sparsa
Le Intelligenze Artificiali (IA), ormai l’abbiamo capito, non hanno l’ambizione a ricostruire l’intelligenza umana, sia perché ancora non sappiamo quali forme essa abbia, sia perché il modello che è stato scelto per il loro sviluppo è quello molto più rapido e conveniente della digestione ed evacuazione statistica di grandi basi di dati.
Il libro di Nello Cristianini pubblicato dal Mulino riassume lo stato dell’arte in maniera molto chiara. Ma grazie proprio alla mole di dati su cui sono allenate abbiamo ormai l’impressione di un’approssimazione a noi sempre più realistica e da esseri molto sensibili quali siamo abbiamo bisogno di continue rassicurazioni di non aver creato il Golem che ci soppianterà.
Una ricerca condotta dalla Cornell University in collaborazione con OpenAI stessa, pubblicata lo scorso agosto dalla Association for Computational Linguistics, ha messo alla prova l’abilità di ChatGPT versione 4 (la più recente) di riconoscere lo humour e di abbinare alcune vignette del New Yorker alle rispettive didascalie date in forma sparsa.
Il risultato è che ChatGPT è meno sveglio rispetto agli umani: “Il miglior modello multimodale rimane 30 punti percentuali dietro alla performance umana nel compito dell’abbinamento” (trad. mia), e comunque la spiegazione dello humour da parte di umani rimane preferibile nei 2/3 dei casi.
Va detto che lo humour del New Yorker spesso è difficile da capire anche per molti lettori umani, e forse è proprio per questo che è stato scelto come banco di prova.
Mi piacerebbe partire da questo dato per cercare di spostare l’attenzione dal comprensibile hype dell’IA a che cosa tutto questo avanzamento tecnologico ci può portare in termini di comprensione di noi e del mondo.
Dato che tra i miei interessi c’è lo studio dello humour, ho trovato la ricerca della Cornell particolarmente interessante perché va a stuzzicare un punto linguistico nevralgico, ossia cerca di capire che cos’è lo humour per cercare di migliorare la performance nelle macchine in quello che probabilmente è l’ultimo ambito linguistico in cui arrancano.
Se riusciamo a fare capire a una macchina lo humour grafico, forse in futuro potremo costruire chatbot buontemponi che ci intratterranno tutto il dì? La linguistica computazionale, i cui sviluppi hanno portato negli ultimi vent’anni ai traduttori automatici e alle IA generative – che si basano ancora molto sull’etichettatura “fatta a mano” degli item usati per il loro addestramento, e quindi in buona sostanza su testi – ha raggiunto risultati incredibili nella traduzione e nella produzione di testi (ChatGPT, Copilot, Gemini) ma questi testi hanno tutti in comune la caratteristica di essere tremendamente “seri”, con un grado di ambiguità il più vicino possibile allo zero.
È vero che anche i bot come Alexa e Siri possiedono un certo senso dell’umorismo ma non si tratta mai di un umorismo che ci dà soddisfazione come quello di un comico in carne e ossa: è innegabile che i loro tentativi appaiano, come dire, un po’ meccanici.
La ricerca sullo humour è arrivata a concordare su alcuni assunti di base, come ad esempio sul fatto che esistono manifestazioni esterne (tra cui sorriso e riso), più o meno intense, di un processo interno che fondamentalmente ha a che fare con la percezione di una incongruità.
Le sono stati dati tanti nomi: da bisociazione, nei termini di Arthur Koestler, a script opposition, secondo Victor Raskin e Salvatore Attardo; ma anche Pirandello aveva provato a definire l’umorismo, e prima di lui molti altri fino ad Aristotele. Si tratta sostanzialmente della creazione da parte umana di aspettative in base a schemi mentali, e della soddisfazione (o meno) di queste aspettative con la contemporanea realizzazione di una nuova verità non prevista che nell’atto umoristico appare immediatamente evidente.
Senza l’aspetto di nuova verità che si svela rapidamente non ci sarebbe umorismo, perché la corrispondenza o meno a uno schema, in sé, non fa ridere. Se pensiamo a una scoperta scientifica, dove la teoria trova a mano a mano conferma negli esperimenti, descriveremmo il sentimento dei ricercatori come felicità, sollievo, gioia, ma non umorismo.
Personalmente sarei contento se le IA riuscissero a produrre dello humour perché vorrebbe dire che abbiamo capito come funziona davvero il nostro cervello nell’atto della creazione.
Purtroppo le IA generative, finché continueranno a utilizzare la “scorciatoia” della potenza di calcolo statistico, probabilmente non arriveranno mai a capire né a generare testi umoristici (o creativi in genere) che abbiano davvero valore per noi. Il testo umoristico, come e più di tutti i testi creativi, si basa sull’imprevedibilità dei collegamenti, sfrutta al massimo l’intertestualità e i tratti soprasegmentali del discorso (intonazione, pause, sottintesi, linguaggio del corpo, interferenze del contesto, ecc.), insomma sfugge alla campana di Gauss per rifugiarsi nelle code della distribuzione, perché è lì che si trovano i collegamenti nuovi e non banali.
E non ci arriveranno perché la maggior parte delle IA segue una logica che vuole massimizzare il training per rispondere alla maggior parte delle domande degli utenti – d’altronde le hanno progettate per quello – le quali si trovano invece proprio al centro della campana. Il mio scopo qui non è però dare conforto o rinforzare ancora una volta l’idea che l’IA non arriverà mai a sostituire le persone.
Ne ho scritto sulle pagine della Rivista Il Mulino qualche anno fa a proposito di Google Translate quando ha fatto il salto all’architettura dei Deep Neural Network: sembra l’altro secolo invece sono passati solo 7 anni e quasi nessuno si ricorda di quando questo strumento era citato soltanto per fare battute sulle sue traduzioni al limite dell’assurdo.
A quel tempo immaginavo che, contando sulla rapidità dello sviluppo tecnico, sarebbe passato relativamente poco prima che le case editrici avrebbero fatto uso dell’IA per le traduzioni.
Ma ero ottimista, in realtà ora l’IA ce l’abbiamo persino nella lavatrice e in quello che poi nella lavatrice ci finisce, sensori incorporati anche nei vestiti e tutti irrimediabilmente connessi e supportati da IA. Da quella volta non c’è ancora stato un cambio di paradigma paragonabile all’introduzione dei network neurali. Ripongo molte speranze nei computer quantistici ma sembra che dovremo pazientare ancora qualche annetto. Nel frattempo possiamo ancora farci quattro grasse risate, se si può ancora usare questo termine.
Riproduzione riservata © Messaggero Veneto