Lab: Prompt Design e Classificazione Pilota

This Week in AI

Google introduce il watermarking invisibile con SynthID

Google DeepMind estende SynthID a tutte le immagini generate da Gemini: un watermark invisibile incorporato nei pixel che permette la rilevazione automatica dei contenuti sintetici.

Da discutere

Se il watermarking fosse universale, cambierebbe il problema dell’AI slop? O le immagini generate da modelli open source resterebbero prive di marcatura?

This Week in AI

Dal riconoscimento automatico alla classificazione umana

I sistemi automatici di rilevazione IA hanno ancora tassi di errore significativi
La classificazione multimodale (immagine + contesto) è più affidabile di quella basata solo sull’immagine (Ferrara, 2026)
Il nostro approccio LLMs-in-the-loop combina giudizio umano e IA (Marino & Giglietto, 2024)

Collegamento con il lab: oggi progetterete i prompt per far classificare le immagini a Gemini — e poi verificherete se concorda con voi.

Roadmap del lab

Ricapitolazione — dataset e schema di classificazione da ieri (10 min)
Prompt design — struttura di un buon prompt multimodale (20 min)
Test pilota — classificare 10-15 immagini con Gemini (30 min)
Raffinamento — migliorare il prompt in base ai risultati (20 min)
Documentazione — codebook nel foglio condiviso (10 min)

Ricapitolazione da Ieri

Il dataset e il vostro schema

Il dataset (fornito)

420 post AI-generated da Facebook
File CSV con metadati e metriche di engagement
Fonte: studio Terenzi & Giglietto (Terenzi & Giglietto, 2025)
Cartella condivisa su Google Drive

Il vostro schema (da ieri)

Ogni gruppo ha definito un angolo di classificazione
Categorie operazionalizzate con definizioni
Ipotesi su quali categorie generino più engagement

Ricordate

Tutti i gruppi classificano le stesse immagini — questo permetterà il confronto inter-gruppo nella sintesi finale.

Prompt Design per la Classificazione

Anatomia di un prompt di classificazione

Un prompt efficace per classificare immagini con Gemini ha quattro componenti (Cosenza, 2025):

Componente	Funzione	Esempio
Ruolo	Definire l’expertise dell’IA	“Sei un analista di contenuti visivi…”
Categorie	Elencare le opzioni con definizioni	“Classifica in: A, B, C, D”
Criteri	Specificare come decidere	“Considera il soggetto principale…”
Formato output	Strutturare la risposta	“Rispondi in formato tabella…”

Esempio: prompt per classificazione per soggetto

Prompt di esempio

“Sei un analista di contenuti visivi specializzato nell’identificazione di immagini generate dall’IA sui social media. Ti mostrerò un’immagine da una pagina Facebook italiana. Classificala in UNA delle seguenti categorie:

1. BAMBINI — soggetto principale: minori in scene emotive (preghiera, povertà, gioco) 2. ANIMALI — soggetto principale: animali in contesti insoliti o antropomorfizzati 3. PAESAGGI — scene naturali o urbane iperrealiste 4. RELIGIONE — iconografia religiosa, figure sacre, scene devozionali 5. ALTRO — nessuna delle precedenti (specifica)

Rispondi con: CATEGORIA | CONFIDENZA (alta/media/bassa) | MOTIVAZIONE (max 20 parole)“

Errori comuni nel prompt design

Da evitare

Categorie vaghe senza definizioni
Troppe categorie (>7 aumenta l’errore)
Nessun esempio per i casi limite
Output non strutturato (testo libero)

Buone pratiche

Definizioni operative per ogni categoria
Categoria “Altro” con obbligo di specifica
Esempi di casi ambigui nel prompt
Formato output tabellare o strutturato

Dal seminario Paroni

Ricordate l’Attività 1: quando Gemini non concordava con il gruppo, avete raffinato il prompt aggiungendo esempi e criteri espliciti. Oggi farete lo stesso con le immagini.

Test Pilota

Workflow del test pilota

Obiettivo: testare il prompt su 10-15 immagini diverse prima di scalare a tutto il dataset.

Passo	Azione	Tempo
1	Selezionate 10-15 immagini variegate dal dataset	5 min
2	Caricate ogni immagine su Gemini con il vostro prompt	15 min
3	Registrate i risultati nel foglio condiviso	5 min
4	Annotate i casi problematici	5 min

Importante: scegliete immagini diverse tra loro — il test deve coprire la varietà del dataset.

Cosa osservare durante il test

Per ogni immagine classificata, annotatevi:

Gemini ha scelto la categoria che avreste scelto voi?
La motivazione fornita da Gemini è coerente?
La confidenza correla con la difficoltà reale del caso?
Ci sono categorie mai usate da Gemini?
Ci sono immagini che Gemini classifica come “Altro” ma che voi assegnereste a una categoria?

Il paradosso dell’esperto (Marino & Giglietto, 2024): Gemini potrebbe cogliere pattern che voi non notate — e viceversa. Entrambe le prospettive sono preziose.

Raffinamento del Prompt

L’approccio iterativo

Il ciclo è lo stesso del seminario Paroni, applicato alle immagini:

Prompt v1 → Test → Analisi errori → Prompt v2 → Test → ...

Problemi tipici

Categoria troppo ampia (raccoglie tutto)
Categoria troppo stretta (mai usata)
Sovrapposizione tra categorie
Gemini interpreta diversamente una definizione

Soluzioni

Dividere la categoria in sotto-categorie
Fondere con una categoria simile
Aggiungere criteri discriminanti
Riformulare con esempi concreti

Esempio di raffinamento

Problema nel test	Modifica al prompt
Gemini classifica “bambino che prega” come RELIGIONE	Aggiungere: “La categoria si basa sul soggetto principale. Un bambino in contesto religioso → BAMBINI”
Tutte le immagini finiscono in “ALTRO”	Rivedere le definizioni: troppo restrittive? Aggiungere esempi
Gemini assegna confidenza “alta” a classificazioni errate	Aggiungere: “Indica confidenza ‘bassa’ se l’immagine potrebbe rientrare in più categorie”

Documentazione del Codebook

Struttura del codebook

Il codebook è il documento di riferimento per la classificazione — vale sia per Gemini che per i codificatori umani:

Elemento	Descrizione	Esempio
Categoria	Nome	BAMBINI
Definizione	Cosa include ed esclude	Minori come soggetto principale, in qualsiasi contesto
Esempi tipici	2-3 casi chiari	Bambino che prega, gruppo di bambini sorridenti
Casi limite	Regole per ambiguità	Se bambino + animale → soggetto in primo piano prevale
Decisione	Come risolvere i dubbi	In caso di dubbio, scegliere la categoria del soggetto più prominente

Dove documentare

Nel foglio Google Sheets condiviso, create un tab “Codebook”:

Colonna A: Nome categoria
Colonna B: Definizione operativa
Colonna C: Esempi tipici (descrizione testuale)
Colonna D: Casi limite e regole di decisione
Colonna E: Note dal test pilota

Il prompt finale va copiato in un secondo tab “Prompt” — è parte integrante della metodologia e andrà nell’appendice del relazione.

Suggerimento

Documentate anche le versioni precedenti del prompt. La storia delle iterazioni sarà utile per la sezione Metodo del relazione.

Lavoro Pratico

Istruzioni per il lavoro di gruppo

Workflow del lab (80 minuti)

Prompt drafting — scrivete il prompt con le vostre categorie (20 min)
Test pilota — classificate 10-15 immagini con Gemini (30 min)
Raffinamento — migliorate il prompt in base agli errori (20 min)
Codebook — documentate tutto nel foglio condiviso (10 min)

Divisione dei compiti suggerita:

AI analyst: scrive e testa il prompt su Gemini
Validatore: classifica le stesse immagini indipendentemente (senza vedere Gemini)
Data analyst: registra risultati e discordanze nel foglio
Coordinatore: gestisce i tempi e documenta il codebook

Checklist di fine lab

Prima di uscire, ogni gruppo verifica:

Prompt testato su almeno 10-15 immagini
Prompt raffinato sulla base dei risultati del test
Codebook documentato nel tab dedicato del foglio condiviso
30-50 immagini classificate (pilota + estensione)
Prompt finale copiato nel tab “Prompt” del foglio

Per martedì

Martedì scalerete la classificazione a tutte le 420 post. Il prompt deve essere pronto e testato. Se restano dubbi, raffinate tra oggi e martedì.

Grazie!

Prossima lezione: Lab — Classificazione su Scala con Gemini (24 Marzo 2026)

📧 fabio.giglietto@uniurb.it

🌐 blended.uniurb.it

Riferimenti

Cosenza, V. (2025). Esercizi di Intelligenza Aumentata: Imparare a Collaborare con le I.A.

Ferrara, E. (2026). The Generative AI Paradox: GenAI and the Erosion of Trust, the Corrosion of Information Verification, and the Demise of Truth [Manoscritto].

Marino, G., & Giglietto, F. (2024). Integrating Large Language Models in Political Discourse Studies on Social Media: Challenges of Validating an LLMs-in-the-loop Pipeline. Sociologica, 18(2), 87–107. https://doi.org/10.6092/issn.1971-8853/19524

Terenzi, M., & Giglietto, F. (2025). From AI Slop to Strategic Virality: The Impact of Synthetic Visuals on Public Discourse in Italian Facebook Communities [Manoscritto].