AIgeist numero 4 │ Scienza e arte del prompt │ L'AI che cerca frasi celebri nei film │ Il rischio bias e come evitarlo │"Voci nella notte" vincerà Sanremo│E tu come mi usi?
Benvenuti in AIgeist, la newsletter settimanale che parla semplicemente di AI.
Ogni mercoledì alle 7. Le altre nostre newsletter: Finambolic (martedì), Xerotonina (giovedì)
Il tema è - Scienza e arte del prompt
Parlare di prompt è parlare di (e con) l’intelligenza artificiale. Partiamo dall’inizio: la parola in sé, “prompt” è presa a prestito dal mondo dei sistemi informatici, e indica quando un sistema è “pronto” a ricevere dei comandi. Questi comandi possono non essere fatti di parole comprensibili – anzi normalmente in informatica non sono tali – ma l’idea è la stessa: si dà un comando a un sistema che è a disposizione. La storia completa dell’idea di prompt la trovate in questo utile paper.
Da qui in poi proviamo a dare una mano a tutti noi utenti di sistemi come ChatGPT, e tra le righe spiegare dove sta la scienza e l’arte del comando. Regola base: dobbiamo immergerci nell’idea che a differenza di un essere umano il sistema non conosce il contesto in cui viene fatta la richiesta, e come tale non può rispondere adeguatamente se non glielo si spiega. Esempio: posso chiedere a ChatGPT di rispondere a un quesito (esempio, dimmi le capitali degli Stati americani) e lui produrrà un semplice elenco. Ma faccio meglio a dirgli “le prime 5 capitali degli stati americani in ordine di popolazione, insieme alle loro coordinate geografiche e il numero di abitanti”. In questo secondo caso sto usando il modello al meglio, chiedendo con il prompt non solo la risposta a una domanda, ma il modo in cui il sistema deve rispondere e come deve arricchire la risposta stessa.
Quindi consiglio cruciale: non limitarsi a fare domande ma immaginarsi sempre che tipo di risposta si desidera. Qui abbiamo chiesto una tabella arricchita, ma potevamo chiedere uno stile letterario (“mettilo in rima”), diverse profondità di risposta (“aggiungi 10 righe per ogni città con brevi cenni storici”) eccetera. Questa seconda parte di domanda, il “come”, deve diventare quasi un automatismo per noi.
Circa la scrittura vera e propria è GPT4 stesso a dirci quali sono le regole essenziali, eccole - sono le 3 C:
1. Chiarezza e Specificità: mai dare indicazioni vaghe o generiche
2. Concisione: non esagerare con le parole, soprattutto quelle inutili, che confondono il sistema
3. Contesto! Qui ci ricolleghiamo al punto sopra: aggiungere indicazioni che riguardino l’ambito linguistico, sociale o culturale di cui si vuole un risultato
A queste regole di base aggiungiamo qualche trucchetto del mestiere, per esempio: far impersonare a ChatGPT un autore, un personaggio. Si tratta di aggiungere un’indicazione come “usa un linguaggio giornalistico” o “scrivi come se fossi un caro amico” o anche “usa uno stile come quello di Dante”. Se siete alla ricerca di altri trucchi del genere, questo bellissimo articolo ne riporta a dozzine.
Per immergersi ancor di più nel tema niente di meglio della sezione specifica che ChatGPT dedica all’argomento, con esempi (una sezione da studiare religiosamente), simulazioni, e anche tanta tecnica.
Seguendo le indicazioni viste sopra dovreste già ottenere migliori risultati (e comunque vale sempre il principio che non si ottiene il miglior risultato al primo colpo, occorre riprovare aggiustando il tiro). Per diventare dei master of prompt provate a consultare questa guida ai 10 migliori corsi online (alcuni sono gratis)
Se avete difficoltà con l’inglese niente paura, ecco un elenco completo di corsi in italiano – a pagamento.
Da ricordare in breve> Comandare i sistemi come ChatGPT con i prompt richiede disciplina. Dobbiamo sempre indicare un contesto di azione e spiegare al sistema che tipo di risposta si vuole ottenere, anche aiutandosi con trucchi come quello di fargli impersonare “voci” ad hoc.
La risorsa è - L'AI che cerca frasi celebri
Chi ha detto “se vogliamo che tutto rimanga com’è, bisogna che tutto cambi”? Questo motore di ricerca per appassionati di cinema, basato sull’AI, permette di cercare parole o frasi indicizzate su 12 milioni di film in inglese, italiano, spagnolo, francese, tedesco e giapponese (ma il mondo inglese è 10 volte più ricco (vedi oltre dove parliamo di bias…). Una volta inserita la frase più o meno celebre la piattaforma restituisce il video dove è stata pronunciata, con titolo e fonte di tutti gli spezzoni dei film. L’effetto è sorprendente, ci si può giocare per ore. La fonte a cui attinge Playphrase.me è IMDb (Internet Movie Database) il sito di proprietà di Amazon che cataloga, archivia film, attori, registi e programmi televisivi.
Utile per> Cinefili senz’altro, ma anche curiosoni, smemorati, cacciatori di idee e meme da inserire in progetti creativi.
🔗 Link: Playphrase.me
🪙Prezzo: Gratis fino a 5 frasi, poi 3 dollari al mese. Registrazione tramite il sito Patreon dello sviluppatore.
L’idea è - Combattere il “bias”
Garbage in, garbage out. Il motto funziona sia per i dati di input in informatica sia per l’AI. Se pregiudizi, superstizioni e stereotipi fanno parte del nostro sapere anche gli strumenti di intelligenza artificiali che si addestrano nei LLM (Large Language Model) non ne sono esenti. Secondo Chat GPT4 stesso (?!) sono almeno 8 i bias presenti nelle sue risposte che ancora non è in grado di correggere (occhio quindi, quando si usa senza attenzione a scuola o al lavoro…):
Bias di selezione: Il dataset di training può non rappresentare equamente tutti i gruppi sociali, culturali, geografici o professionali.
Bias storico e culturale: I training data include contenuti storici che possono riflettere i pregiudizi e le norme sociali di periodi passati.
Bias di genere e etnia: I modelli possono incorporare bias di genere, etnia o altri bias sociali presenti nei dati di training, portando a stereotipi o generalizzazioni inadeguate nelle risposte.
Limitazioni nella copertura dell'argomento: Alcuni argomenti possono essere sotto-rappresentati nel dataset di training, risultando in una conoscenza superficiale o inaccurata di tali argomenti.
Bias di popolarità: Gli argomenti, le opinioni o le prospettive che sono più comunemente discussi o presenti nei dati di training possono essere sovrarappresentati, portando a una tendenza verso il "mainstream" nelle risposte, a scapito di punti di vista minoritari o alternativi.
Bias di conferma: Il modello potrebbe generare risposte che tendono a confermare le opinioni prevalenti o popolari trovate nel training data.
Sensibilità e privacy: I dati utilizzati per il training possono includere o riflettere informazioni sensibili o private.
Attualità: I modelli sono addestrati su un corpus di dati che termina in un momento specifico (ad esempio, aprile 2023 per la mia ultima formazione).
Come si può combatterli? Questo contributo dell’Harvard Business Review presenta varie soluzioni, che riassumiamo così: primo: imparare, studiare e non pensare che qualcuno se ne occuperà per te; secondo, dirigere la ricerca tecnica e scientifica verso la soluzione dei problemi elencati sopra.
Invece di concentrarsi esclusivamente sull’ampliamento dei modelli, bisogna comprendere e documentare i pregiudizi già presenti nei dati.
Chi ci ha provato seriamente è la startup indiana no profit Karya, presentata in questo servizio di Time Magazine. Utilizza in modo equo lavoratori di ogni angolo dell’India per creare basi di dati equilibrate, in lingue che rischiano l’isolamento in un mondo che ha come suo bias più grande l’onnipresenza della lingua inglese - lingua nella quale gran parte della conoscenza scientifica è scritta (vedi il grafico sotto). Perché alla fine possiamo ancora riscrivere le regole e costruire dei sistemi migliori.
“Stiamo parlando di sistemi che stanno avendo un impatto su tutta la nostra società e di lavoratori che rendono tali sistemi più affidabili e meno distorti. Se ci fossero lavoratori con diritti fondamentali e più responsabilizzati, credo che anche il risultato – il sistema tecnologico – avrà una qualità migliore”. Jonas Valente, esperto di piattaforme di lavoro digitali presso l’Internet Institute dell’Università di Oxford
Tempo di lettura> 25 minuti circa
🔗 Link: The Workers Behind AI Rarely See Its Rewards. This Indian Startup Wants to Fix That - Fonte: Time Magazine
![](https://substackcdn.com/image/fetch/w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fb6bb4a0d-dc82-432c-ac07-c02dcc639325_1600x840.png)
Chat&risposta: "Voci nella notte" vincerà Sanremo
Sulla base dei testi delle ultime canzoni che hanno vinto Sanremo negli ultimi 10 anni puoi scrivere il testo che potrebbe vincere questa edizione?
Prompt del team AIgeist.ai per ChatGPT4
Ecco la canzone “Voci nella notte” in stile rap che cattura i temi di resilienza e ricerca di identità, elementi che possono piacere al pubblico di Sanremo.
(Verso 1)
Nelle strade della vita, cammino solo,
Con la musica che guida, verso un sogno, non mollo.
Ogni prova, ogni sfida, è un capitolo,
Nella storia che scrivo, in ogni nota, un simbolo.
(Ritornello)
Voci nella notte, sussurrano verità,
Nel buio trovo la mia strada, libertà.
Con ogni rima, spacco il silenzio, nuova identità,
Sono voce del mio tempo, nella lotta, unità.
(Verso 2)
Tra dubbi e certezze, la mia voce risuona,
Racconto di chi cade ma poi si incorona.
Con la penna e il beat, disegno il mio destino,
Ogni parola un passo, fuori dal labirinto.
(Ritornello)
Voci nella notte, sussurrano verità,
Nel buio trovo la mia strada, libertà.
Con ogni rima, spacco il silenzio, nuova identità,
Sono voce del mio tempo, nella lotta, unità.
(Bridge)
Da solo contro il mondo, ma la musica è scudo,
Ogni strofa un ponte, sopra il mare in tumulto.
La mia storia è di chi non si arrende,
Rap di chi lotta, sogna, e poi vince, prende.
(Outro)
Voci nella notte, eco di speranza,
In ogni verso, una nuova danza.
Nella melodia, la forza di cambiare,
Rap del domani, per chi osa sognare.