AIgeist 39 │L'AI Open Source è in piena crisi di nervi │Cosa significa AI gratis │ I modelli "free" più gettonati │ Lo zampino dei grandi gruppi tech
Benvenuti in AIgeist, la newsletter settimanale che parla semplicemente di AI.
Le altre nostre newsletter: Finambolic (martedì), Xerotonina (giovedì). Abbonatevi, è gratis!
Ci svegliamo e diamo un’occhiata alle ultime notizie usando il nostro smartphone Android, basato su un “cuore” Linux. Ci colleghiamo a un sito di news che usa Apache come server, reso sicuro da un software OpenSSL, e che utilizza per gestire le informazioni WordPress. Stiamo usando un browser - Chrome, Edge di Microsoft, o Opera - basato su codice aperto. Insomma, bastano 30 secondi e abbiamo già usato 5 - come minimo - software basati su criteri Open Source, in qualche sua forma.
Bello il mondo aperto. Certo questo non impedisce al potere tecnologico e alle big tech di utilizzare in vari modi - inclusa qualche forma di “openwashing”, che è un po’ il green washing del software - l’etichetta per rendersi interessanti e alla fine vendere qualcosa.
E allora chiediamoci: il mondo dell’AI è ancora affezionato a questi concetti, se vogliamo legati a una cultura tecnologica solo anagraficamente datata, ma presentissima e indispensabile?
Per rispondere ci siamo fatti aiutare delle nostre fonti online, che poi è il nostro lavoro principale, ma anche un po’ da ChatGPT, amico-nemico di ogni scrittore di newsletter. Allora abbiamo chiesto all’oracolo di mettere a confronto i fattori che più differenziano software e AI in termini di opportunità per avere una gestione “open” delle sue tecnologie. Ecco il risultato:
La lettura ottenuta, confrontata con numerosi articoli che presenteremo oltre scritti da esperti del MIT e altri, è ottima. Riassumiamo noi in una breve frase: poiché i modelli AI usano dati di provenienza non controllabile, indissolubilmente legati a grandi capacità di calcolo poco ripetibili, e i cui risultati possono essere pericolosi - e l’attribuzione di responsabilità in caso di danni complicata - costruire modelli aperti di AI è molto, molto difficile.
Se Open e AI non vanno d’accordo
Partiamo dal “peccato originale”: l’azienda dietro la più grande popolarizzazione dell’AI si chiama, appunto, OpenAI. Mai forse il marketing è stato così profondo e sottile insieme. Cosa c’è infatti di Open in OpenAI? Semplice, niente, o quasi niente. Non possiamo ripercorrere qui la storia della ormai celeberrima azienda californiana, ma ci basti un aspetto: nata come azienda “ibrida” a cavallo tra no profit e no profit, ha cambiato pelle ed è oggi full profit (ne parliamo a fondo in AIgeist 34, vedi sotto).
Passiamo poi a un altro protagonista del settore: Marc Zuckerberg, ideatore di Facebook e boss di Meta. La sua strategia AI è interamente costruita sul principio di “noi siamo open”. Sentitelo qui in una intervista a Bloomberg di luglio:
Anche qui ci permettiamo un riassunto solo leggermente interpretato per renderlo leggibile: secondo Zuch non esisterà un supermodello (ma nella solita lotta testosteronica, ci tiene a dire che il suo è il più potente) ma ci saranno tanti sviluppatori di applicazioni che useranno la piattaforma Llama per creare tante cose specifiche e verticali. Ma alla fine la dice tutta: i nostri centinaia di milioni di creatori potranno usare sistemi AI per aumentare la propria presenza online e servire la propria community (e poi, NDR, ci penseremo noi a monetizzare il tutto).
I teorici dell’impossibile
Se volete una lettura ancora più cinica su come le big tech stiano “giocando” col termine OpenAI vi lasciamo alla lettura di questo eccellente e lungo articolo della rivista The New Stack, intitolato Why Open Source AI Has No Meaning. Ecco una citazione particolarmente illuminante:
L'intelligenza artificiale crea un paradosso per la comunità open source. Da un lato ci sono i pragmatici aperti e dall’altro ci sono quelli che vogliono che l’intelligenza artificiale open source sia ambiziosa e fedele ai suoi principi. Il problema: l'open source sta perdendo significato poiché i fornitori di AI LLM chiamano i loro servizi open source, indipendentemente dal fatto che lo siano o meno.
L’autore dell’articolo ha sentito varie autorità in materia, primo fra tutti un italiano, da lungo tempo in California, Stefano Maffulli. Il suo ruolo è quello di Direttore Esecutivo dell’Open Source Initiative (OSI). Nata nel 1998, l’organizzazione, oggi aperta anche a soci finanziatori, si è, secondo Wikipedia, posizionata come la voce realista del mondo del software libero, accettando il fatto che ci debba essere una relazione positiva e collaborativa tra mondo open e mondo commerciale. E sul punto AI si mantiene questo atteggiamento pragmatico. Secondo Maffulli “si tratta di riconoscere che le grandi aziende hanno già un vantaggio. Se adottiamo un approccio puramente aspirazionale, nessuno potrà soddisfare la definizione, il che causerà problemi ai piccoli attori. Le grandi aziende tecnologiche hanno molti dati che possono utilizzare. Il resto di noi no”.
La stagione del pragmatismo
Ed ecco che finalmente esiste una definizione di Open Source AI, roba di poche settimane fa. Dopo tante discussioni, La Open Source Initiative (OSI) ha detto la sua. Vediamo in cosa consiste in breve citando liberamente la sintesi che ne fa la MIT Technology Review:
Un sistema di intelligenza artificiale open source può essere utilizzato per qualsiasi scopo senza la necessità di ottenere il permesso, e i ricercatori dovrebbero essere in grado di ispezionarne i componenti e studiare come funziona il sistema.
Dovrebbe anche essere possibile modificare il sistema per qualsiasi scopo, incluso cambiarne l'output, e condividerlo con altri per utilizzarlo, con o senza modifiche, per qualsiasi scopo. Inoltre, lo standard tenta di definire un livello di trasparenza per i dati di addestramento, il codice sorgente e i pesi di un determinato modello.
In quel “tenta di definire” (“attempts to define” nell’originale) c’è tutto il succo della mediazione che si è ottenuta. Noi vi lasciamo liberi di leggere la versione integrale della definizione sul sito dell’OSI, mentre qui trovate le organizzazioni e aziende che hanno fatto “endorsment” di questa definizione. Ci sono vari governi, c’è Mozilla (quella di Firefox, ma non solo), c’è Carnegie Mellon, università e singoli ricercatori.
Proviamo a mettere ordine nei modelli
Ma allora cosa posso fare da me, senza pagare? Molto, moltissimo. Così ci diceva recentemente un imprenditore che utilizza nella sua stessa azienda AI vari modelli “gratuiti”, miniAI o anche sistemi di interpretazione dei dati alternativi, per trasformarli in in prodotti che vende a corporation serissime e attentissime alla qualità e alla sicurezza del software.
La migliore rassegna sullo stato dell’arte la trovate in questo lungo articolo-rassegna di ZdNet.
Analizza tutti i modelli più o meno open in circolazione e li separa per tipo di uso (testo, immagini, multimedia eccetera), ne segnala le principali qualità e li categorizza per modello di licenza. Ecco quelle più usate con una breve descrizione (scritta con l‘aiuto di ChatGPT4o):
Apache License 2.0: Una licenza permissiva che consente l’uso, la modifica e la distribuzione del software, sia per scopi commerciali che non commerciali, a condizione che venga mantenuta la notifica di copyright e una copia della licenza.
MIT License: Una licenza permissiva che permette l’uso, la copia, la modifica, la fusione, la pubblicazione, la distribuzione, la sublicenza e/o la vendita di copie del software, a condizione che venga inclusa la notifica di copyright e la dichiarazione di permesso.
GNU General Public License (GPL): Una licenza copyleft che richiede che le versioni modificate del software siano anch’esse distribuite con la stessa licenza GPL, garantendo che il software rimanga libero e aperto.
Creative Commons Attribution License: Una licenza che consente agli utenti di condividere, copiare e adattare il materiale, anche per scopi commerciali, purché venga attribuito il credito appropriato all'autore originale.
BSD License: Una licenza permissiva che consente l’uso, la modifica e la distribuzione del software, con poche restrizioni, promuovendo un'ampia adozione e collaborazione.
Per avere davanti agli occhi la directory totale di cosa si può fare già oggi sotto le varie forme di licenza niente di meglio che andare sul portale Hugging Face e selezionare il tipo di licenza preferito. E viva la libertà!
Aria e Allegro
PS: vi lasciamo in compagnia di una creatura che ci sembra in tono con il mondo libero di cui abbiamo parlato: una scimmia che suona il basso creata con il software Open Source di AI Aria e Allegro, definito open-source multimodal AI model.