Quando l’intelligenza artificiale ci rende tutti più vicini

Tim Berners Lee, ricercatore inglese giovanissimo, nel1993 rilasciò pubblicamente il codice che, qualche anno prima, vide nascere il World Wide Web. Nello stesso anno, il ventinovenne Jensen Huang, assieme ad altri due soci, Chris Malachowsky e Curtis Priem, sicuri del fatto che il PC un giorno avrebbe permesso anche la fruizione di prodotti multimediali e di videogiochi, fondò NVIDIA. Si dice che quel giorno Huang riunì i suoi due futuri soci in un piccolo bar di Palo Alto e comunicò loro la volontà di lasciare il suo lavoro a tempo indeterminato per lanciare una Startup che si sarebbe occupata dello sviluppo di hardware e software per far funzionare applicazioni video e videogiochi sui personal computer.

Non sappiamo esattamente cosa il ventinovenne disse ai suoi due amici… Sappiamo solo che anche gli altri due riuscirono a raccogliere 40.000 dollari e deciso di abbandonare la multinazionale dove lavoravano per seguire Huang nella fondazione della sua Startup.
All’inizio l’idea non aveva un nome proprio, tanto che tutti i documenti relativi allo sviluppo del progetto vennero archiviati con le lettere “NV”, che sta per “next version”.
Un nome alla Startup, però, andava dato! Partendo da quelle due lettere, “NV”, si arrivò ad “Nvidia”. Probabilmente i tre ragazzi avranno pensato all’invidia che questi prodotti avrebbero potuto suscitare, in un futuro prossimo, nei competitori!

Quel futuro prossimo è oggi. Solo negli ultimi tre anni le azioni Nvidia hanno triplicato il loro valore, tanto da essere il leader assoluto nel campo dei videogame e, soprattutto, nel settore delle applicazioni in cui le immagini e le animazioni sono parte essenziale dell’applicazione di un computer… L’ultima è la videoconferenza. Proprio così! In un settore che sembrava già “saturo” di idee, iniziative e concorrenza (ad esempio Meet, Zoom e Teams…) Jensen Huang, che ormai si sta avvicinando ai 60 anni, qualche giorno fa ha presentato la nuova piattaforma Nvidia per le videoconferenze! Sembrerebbe non esserci più nulla di nuovo e innovativo nel settore delle video chiamate dopo lo smart working, la didattica a distanza o la tecnologia per tenere vicine persone distanti, ma, evidentemente, se io ne sto parlando e voi lo state leggendo qualcosa, in realtà, c’è!

Complice il momento che stiamo tutti vivendo, strumenti come quelli per la comunicazione da remoto sono divenuti alleati quotidiani nell’ambito della produttività. Le tecnologie già esistenti sono, obiettivamente, avanzate e sviluppate apportando miglioramenti significativi, sulla base delle richieste degli utilizzatori, ma presentano ancora ampi margini di miglioramento! Margini di miglioramento che Nvidia si propone di colmare con “Maxine”: il nuovo sistema di comunicazione che si prefigge di migliorare la connessione da remoto delle videoconferenze, grazie ad un insieme di servizi in cloud e di applicazioni gestite da un’intelligenza artificiale.

Riassumendo in poche righe, si tratta di un sistema che, tramite algoritmi avanzati permette di migliorare la compressione delle immagini generate dagli apparati di videoconferenza, per poterne garantire l’utilizzo anche in zone dove la connessione non sia molto performante. Sarà sempre possibile mantenere, come già fanno gli altri software, la possibilità di cancellare il rumore di fondo e di sottotitolare (ed anche tradurre) automaticamente tutto quello che viene pronunciato… Ciò che è innovativo è un motore grafico potente e performante in grado di fare alcune “fotografie” del volto del relatore e dei partecipanti durante la videochiamata, selezionarne alcuni punti chiave dei lineamenti (occhi, naso, bocca, orecchie e capelli), trasmettere tramite cloud le informazioni, ricreando nei video di ciascun partecipante, grazie all’intelligenza artificiale, il volto di tutti in tempo reale.

Sarà strabiliante, ad esempio, parlare con qualcuno via webcam da una strana angolazione o anche senza essere davanti l’obiettivo e, allo stesso tempo, risultare presente al nostro interlocutore, trasmettendo ogni nostra espressione, riprodotta artificialmente in base al tono di voce e alle parole da noi pronunciate! Interessante anche il vantaggio offerto da Maxine riguardo la compressione video: non avremo più una trasmissione (pesante) dei video inviati dalla webcam ma verranno solamente trasmesse le “coordinate” dei punti chiave dei nostri lineamenti, sulla base di alcune nostre fotografie; ciò permetterà di ottenere un’immagine molto più definita diminuendo il “bitrate” e riducendo, così, la quantità di banda richiesta a favore di una maggiore qualità.

Stiamo assistendo ad una nuova trasformazione epocale: una tecnologia che sembrava fredda e distante si sta evolvendo sulla base dei nuovi eventi e delle necessità delle persone: l’intelligenza artificiale ci aiuta ad essere più vicini… Ma sicuramente dovremo, prima, volerlo noi!