Lab: Prompt Design e Classificazione Pilota

IA Generativa e Media — Settimana 4

Fabio Giglietto

DISCUI · Università degli Studi di Urbino Carlo Bo

18 marzo 2026

This Week in AI

Google introduce il watermarking invisibile con SynthID

Google DeepMind estende SynthID a tutte le immagini generate da Gemini: un watermark invisibile incorporato nei pixel che permette la rilevazione automatica dei contenuti sintetici.

Da discutere

Se il watermarking fosse universale, cambierebbe il problema dell’AI slop? O le immagini generate da modelli open source resterebbero prive di marcatura?

This Week in AI

Dal riconoscimento automatico alla classificazione umana

  • I sistemi automatici di rilevazione IA hanno ancora tassi di errore significativi
  • La classificazione multimodale (immagine + contesto) è più affidabile di quella basata solo sull’immagine (Ferrara, 2026)
  • Il nostro approccio LLMs-in-the-loop combina giudizio umano e IA (Marino & Giglietto, 2024)

Collegamento con il lab: oggi progetterete i prompt per far classificare le immagini a Gemini — e poi verificherete se concorda con voi.

Roadmap del lab

  1. Ricapitolazione — dataset e schema di classificazione da ieri (10 min)
  2. Prompt design — struttura di un buon prompt multimodale (20 min)
  3. Test pilota — classificare 10-15 immagini con Gemini (30 min)
  4. Raffinamento — migliorare il prompt in base ai risultati (20 min)
  5. Documentazione — codebook nel foglio condiviso (10 min)

Ricapitolazione da Ieri

Il dataset e il vostro schema

Il dataset (fornito)

  • 420 post AI-generated da Facebook
  • File CSV con metadati e metriche di engagement
  • Fonte: studio Terenzi & Giglietto (Terenzi & Giglietto, 2025)
  • Cartella condivisa su Google Drive

Il vostro schema (da ieri)

  • Ogni gruppo ha definito un angolo di classificazione
  • Categorie operazionalizzate con definizioni
  • Ipotesi su quali categorie generino più engagement

Ricordate

Tutti i gruppi classificano le stesse immagini — questo permetterà il confronto inter-gruppo nella sintesi finale.

Prompt Design per la Classificazione

Anatomia di un prompt di classificazione

Un prompt efficace per classificare immagini con Gemini ha quattro componenti (Cosenza, 2025):

Componente Funzione Esempio
Ruolo Definire l’expertise dell’IA “Sei un analista di contenuti visivi…”
Categorie Elencare le opzioni con definizioni “Classifica in: A, B, C, D”
Criteri Specificare come decidere “Considera il soggetto principale…”
Formato output Strutturare la risposta “Rispondi in formato tabella…”

Esempio: prompt per classificazione per soggetto

Prompt di esempio

“Sei un analista di contenuti visivi specializzato nell’identificazione di immagini generate dall’IA sui social media. Ti mostrerò un’immagine da una pagina Facebook italiana. Classificala in UNA delle seguenti categorie:

1. BAMBINI — soggetto principale: minori in scene emotive (preghiera, povertà, gioco) 2. ANIMALI — soggetto principale: animali in contesti insoliti o antropomorfizzati 3. PAESAGGI — scene naturali o urbane iperrealiste 4. RELIGIONE — iconografia religiosa, figure sacre, scene devozionali 5. ALTRO — nessuna delle precedenti (specifica)

Rispondi con: CATEGORIA | CONFIDENZA (alta/media/bassa) | MOTIVAZIONE (max 20 parole)“

Errori comuni nel prompt design

Da evitare

  • Categorie vaghe senza definizioni
  • Troppe categorie (>7 aumenta l’errore)
  • Nessun esempio per i casi limite
  • Output non strutturato (testo libero)

Buone pratiche

  • Definizioni operative per ogni categoria
  • Categoria “Altro” con obbligo di specifica
  • Esempi di casi ambigui nel prompt
  • Formato output tabellare o strutturato

Dal seminario Paroni

Ricordate l’Attività 1: quando Gemini non concordava con il gruppo, avete raffinato il prompt aggiungendo esempi e criteri espliciti. Oggi farete lo stesso con le immagini.

Test Pilota

Workflow del test pilota

Obiettivo: testare il prompt su 10-15 immagini diverse prima di scalare a tutto il dataset.

Passo Azione Tempo
1 Selezionate 10-15 immagini variegate dal dataset 5 min
2 Caricate ogni immagine su Gemini con il vostro prompt 15 min
3 Registrate i risultati nel foglio condiviso 5 min
4 Annotate i casi problematici 5 min

Importante: scegliete immagini diverse tra loro — il test deve coprire la varietà del dataset.

Cosa osservare durante il test

Per ogni immagine classificata, annotatevi:

  • Gemini ha scelto la categoria che avreste scelto voi?
  • La motivazione fornita da Gemini è coerente?
  • La confidenza correla con la difficoltà reale del caso?
  • Ci sono categorie mai usate da Gemini?
  • Ci sono immagini che Gemini classifica come “Altro” ma che voi assegnereste a una categoria?

Il paradosso dell’esperto (Marino & Giglietto, 2024): Gemini potrebbe cogliere pattern che voi non notate — e viceversa. Entrambe le prospettive sono preziose.

Raffinamento del Prompt

L’approccio iterativo

Il ciclo è lo stesso del seminario Paroni, applicato alle immagini:

Prompt v1 → Test → Analisi errori → Prompt v2 → Test → ...

Problemi tipici

  • Categoria troppo ampia (raccoglie tutto)
  • Categoria troppo stretta (mai usata)
  • Sovrapposizione tra categorie
  • Gemini interpreta diversamente una definizione

Soluzioni

  • Dividere la categoria in sotto-categorie
  • Fondere con una categoria simile
  • Aggiungere criteri discriminanti
  • Riformulare con esempi concreti

Esempio di raffinamento

Problema nel test Modifica al prompt
Gemini classifica “bambino che prega” come RELIGIONE Aggiungere: “La categoria si basa sul soggetto principale. Un bambino in contesto religioso → BAMBINI”
Tutte le immagini finiscono in “ALTRO” Rivedere le definizioni: troppo restrittive? Aggiungere esempi
Gemini assegna confidenza “alta” a classificazioni errate Aggiungere: “Indica confidenza ‘bassa’ se l’immagine potrebbe rientrare in più categorie”

Documentazione del Codebook

Struttura del codebook

Il codebook è il documento di riferimento per la classificazione — vale sia per Gemini che per i codificatori umani:

Elemento Descrizione Esempio
Categoria Nome BAMBINI
Definizione Cosa include ed esclude Minori come soggetto principale, in qualsiasi contesto
Esempi tipici 2-3 casi chiari Bambino che prega, gruppo di bambini sorridenti
Casi limite Regole per ambiguità Se bambino + animale → soggetto in primo piano prevale
Decisione Come risolvere i dubbi In caso di dubbio, scegliere la categoria del soggetto più prominente

Dove documentare

Nel foglio Google Sheets condiviso, create un tab “Codebook”:

  • Colonna A: Nome categoria
  • Colonna B: Definizione operativa
  • Colonna C: Esempi tipici (descrizione testuale)
  • Colonna D: Casi limite e regole di decisione
  • Colonna E: Note dal test pilota

Il prompt finale va copiato in un secondo tab “Prompt” — è parte integrante della metodologia e andrà nell’appendice del relazione.

Suggerimento

Documentate anche le versioni precedenti del prompt. La storia delle iterazioni sarà utile per la sezione Metodo del relazione.

Lavoro Pratico

Istruzioni per il lavoro di gruppo

Workflow del lab (80 minuti)

  1. Prompt drafting — scrivete il prompt con le vostre categorie (20 min)
  2. Test pilota — classificate 10-15 immagini con Gemini (30 min)
  3. Raffinamento — migliorate il prompt in base agli errori (20 min)
  4. Codebook — documentate tutto nel foglio condiviso (10 min)

Divisione dei compiti suggerita:

  • AI analyst: scrive e testa il prompt su Gemini
  • Validatore: classifica le stesse immagini indipendentemente (senza vedere Gemini)
  • Data analyst: registra risultati e discordanze nel foglio
  • Coordinatore: gestisce i tempi e documenta il codebook

Checklist di fine lab

Prima di uscire, ogni gruppo verifica:

Per martedì

Martedì scalerete la classificazione a tutte le 420 post. Il prompt deve essere pronto e testato. Se restano dubbi, raffinate tra oggi e martedì.

Grazie!

Prossima lezione: Lab — Classificazione su Scala con Gemini (24 Marzo 2026)

📧 fabio.giglietto@uniurb.it

🌐 blended.uniurb.it

Riferimenti

Cosenza, V. (2025). Esercizi di Intelligenza Aumentata: Imparare a Collaborare con le I.A.
Ferrara, E. (2026). The Generative AI Paradox: GenAI and the Erosion of Trust, the Corrosion of Information Verification, and the Demise of Truth [Manoscritto].
Marino, G., & Giglietto, F. (2024). Integrating Large Language Models in Political Discourse Studies on Social Media: Challenges of Validating an LLMs-in-the-loop Pipeline. Sociologica, 18(2), 87–107. https://doi.org/10.6092/issn.1971-8853/19524
Terenzi, M., & Giglietto, F. (2025). From AI Slop to Strategic Virality: The Impact of Synthetic Visuals on Public Discourse in Italian Facebook Communities [Manoscritto].