IA, apprendimento automatico e influencer: cosa dobbiamo sapere

Foto di Gerd Altmann da Pixabay

Il termine “influencer dei social media” può richiamare alla mente qualche personaggio che in Instagram sponsorizza vestiti e oggetti carini, ma in realtà gli influencer influenzano tutti i tipi di prodotti, comprese le nuove tecnologie sull’intelligenza artificiale. L’interesse generale per l’intelligenza artificiale e l’apprendimento automatico (ML) è ai massimi storici e il settore sta rispondendo, sfornando migliaia di nuovi servizi basati sull’intelligenza artificiale e sull’apprendimento automatico per conferenze e riviste. La comunità AI/ML è anche particolarmente attiva nel pubblicare documenti tecnici (preprint), ancora non sottoposti a citazioni accademiche, tramite piattaforme online come “ArXiv”.

Una ricerca condotta da una coppia di utenti molto influenti di X (ex Twitter) ha analizzato più di 8.000 documenti di AI e ML, considerando sia le menzioni sui social media che il numero di citazioni accademiche. Esaminando i tweet da dicembre 2018 a ottobre 2023, i ricercatori hanno concluso che i documenti AI/ML condivisi da due specifici influencer avevano un numero medio di condivisioni da due a tre volte superiore a quello delle citazioni stesse. Questo è fondamentale perché le citazioni accademiche non riguardano solo il riconoscimento nel proprio campo; influenzano anche decisioni come il finanziamento della ricerca e il mandato presso le istituzioni accademiche. Ed è un cambiamento rispetto allo status quo. Recentemente, nel 2018, uno studio sugli atti di moltissime conferenze ha dimostrato che il punteggio di revisione di un preprint, ovvero l’accettazione alle conferenze più importanti, era un indicatore primario del conteggio delle citazioni future. Ora, “la correlazione tra i tweet degli influencer e il conteggio delle citazioni – e non i punteggi delle recensioni – indica un cambiamento nel modo in cui la comunità trova e legge gli articoli”, conclude questo nuovo lavoro.

I ricercatori hanno selezionato due influencer come casi di studio. Entrambi condividono costantemente articoli su AI/ML e hanno un seguito significativo su X (ex Twitter): @_akhaliq e @arankomatsuzaki. “Questi influencer sono emersi come figure cruciali nel navigare nel flusso di informazioni, simili ai giornalisti nella società civile, evidenziando e contestualizzando opere significative per la comunità”, scrivono gli autori. Questo è un servizio utile – e, ovviamente, non retribuito – da parte di questi influencer, data la mole delle ricerche. Ma fare “un eccessivo affidamento su un gruppo selezionato di interessati può inavvertitamente distorcere il panorama della ricerca, divulgando ed enfatizzando determinati argomenti o prospettive rispetto ad altri”, scrivono i ricercatori. “Pregiudizi involontari nella condivisione del lavoro di determinati laboratori o diversi ricercatori possono consolidare la mancanza di diversità geografica, di genere o istituzionale”, aggiunge il documento. “La consapevolezza è il primo passo per rompere questa camera di risonanza dei social media”, afferma l’autore principale Iain Xie Weissburg, uno studente del primo anno di master nel programma di ingegneria elettrica e informatica dell’Università di Santa Barbara, in California.

“Volevamo aiutare la comunità a riconoscerlo ed essere vigili nel garantire che la ricerca rimanga un ambito uniformemente livellato”, dice Weissburg. “Allo stato attuale, tendiamo tutti a ottenere le nostre informazioni da pochi eletti, concludiamo che questi sono gli argomenti caldi e quindi spesso selezioniamo la nostra ricerca in base a tale pubblicità.”
Il punto non è quello di incolpare o attribuire indebite responsabilità a questi influencer o ad altri, Weissburg è attento a notare. “Il fatto è che i sistemi di pubblicazione e conferenza devono adattarsi al vasto aumento del volume della ricerca sull’intelligenza artificiale/ML nel prossimo futuro, soprattutto con l’afflusso dell’intelligenza artificiale generativa nella sfera pubblica”, afferma Weissburg. L’analisi evidenzia non solo l’influenza crescente dei social media nella ricerca sull’intelligenza artificiale/ML, ma anche l’importanza di un ecosistema in evoluzione per portare diversità di pensiero nel panorama accademico digitale di oggi.

La selezione, da parte dei ricercatori, di soli due influencer è una metodologia “tutt’altro che perfetta”, afferma Delip Rao, un ricercatore indipendente affiliato all’Università della Pennsylvania e all’Università della California, Santa Cruz. Aggiunge che “queste due persone tendono a twittare articoli di grandi laboratori e nomi famosi. Quindi non è chiaro chi stia influenzando chi”. Tuttavia, è d’accordo con la conclusione generale secondo cui un piccolo gruppo di influencer ha un effetto enorme, “il che è problematico per la scienza e il conteggio delle condivisioni è pensato per essere guidato da esperti che comprendono profondamente il lavoro che stanno condividendo e il contesto”, osserva, aggiungendo che è “irrealistico aspettarsi che anche gli influencer esperti apportino questo tipo di revisione rigorosa all’attività dei social media al di fuori dei loro lavori giornalieri”.
Ciò è particolarmente vero data la proliferazione della ricerca AI/ML negli ultimi tempi, come ha riconosciuto di recente uno dei due influencer in primo piano. “Odio quando arXiv pubblica casualmente circa 500 articoli quasi ogni giorno! L’enorme volume di articoli pubblicati quotidianamente è travolgente, rendendo poco pratico per le persone vagliare i feed di arXiv”, dice Aran Komatsuzaki, il responsabile della tecnologia di Teraflop.ai in un’intervista. “La comunità si affida a tecnici scientifici come me e @_akhaliq per evidenziare ogni giorno una selezione di documenti degni di nota…. [Sono] cauto nel non promuovere la ricerca con risultati poco convincenti, deboli o dubbi”.

L’altro influencer citato, Ahsen Khaliq o “AK”, è un ingegnere di machine learning presso Hugging Face. “Penso che ci sia un certo spostamento nella comunità verso la ricerca/scoperta di nuove ricerche e la condivisione tramite Twitter o altri social media piuttosto che tramite conferenze/punteggi dei revisori, sebbene ognuno abbia il proprio posto nella comunità”, afferma Khaliq in un’intervista. “La conclusione principale del documento”, afferma Weissburg, “è che ricercatori, organizzatori di conferenze e istituzioni accademiche devono essere consapevoli del cambiamento delle norme poiché le piattaforme di preprinting e gli account dei social media cambiano il panorama della condivisione della ricerca, specialmente nello spazio AI/ML. Gli autori sostengono inoltre che le conferenze e i processi di revisione paritaria potrebbero dover evolversi per garantire che la ricerca di qualità sia effettivamente distribuita. Weissburg afferma che gli ingegneri che lavorano nel settore dovrebbero a volte resistere alla tentazione di salire sul treno delle pubblicità, per non ignorare altre importanti aree di ricerca. Anche gli influencer possono prendere atto che “il paper sharing non è un gioco a somma zero. Hai un effetto e non devi necessariamente sempre condividere le aziende più grandi e i ricercatori più famosi. È importante avere una comunità diversificata in termini di idee diverse e background diversi”.

Nel lavoro futuro, Weissburg spera di esplorare possibili effetti che arriveranno anche fuori dai social media, e cioè in altre aree della scienza. Resta, comunque, sempre l’opportunità di esplorare i meccanismi alla base dei social media – come il modo in cui gli algoritmi presentano i contenuti agli utenti – in relazione al riconoscimento accademico. Rao vorrebbe vedere nuove idee per far emergere e diffondere documenti di qualità. “Quando c’è una produzione eccessiva, è naturale fare affidamento sui tecnici scientifici, e la dipendenza della comunità da queste persone è un grido di aiuto”, dice. “Abbiamo bisogno di modi migliori per combattere questo diluvio di informazioni e, si spera, la risposta non sia solo negli influencer”.