Lab: Classificazione su Scala con IA

IA Generativa e Media — Settimana 5

Fabio Giglietto

DISCUI · Università degli Studi di Urbino Carlo Bo

24 marzo 2026

Roadmap del lab

  1. Pipeline completa — i due step della classificazione
  2. Step 1: codifica umana — 50 post, giudizio indipendente
  3. Step 1: consenso — discussione sui disaccordi e definizione raffinata
  4. Step 1: Gemini — dal consenso al prompt, classificazione automatica
  5. Primi pattern — proporzione di AI slop nel dataset
  6. Lavoro pratico — codifica, consenso e classificazione per gruppi

La Pipeline Completa

Il foglio di codifica: post_metadata

post_metadata8 tab, 4 operativi + 4 di supporto:

Tab operativi (oggi usiamo questi)

Tab Colore
STEP 1 — Codifica Umana (50) 🔵
STEP 1 — Gemini + Decisione 🟠
CODEBOOK
PROMPT

Tab di supporto / Step 2

Tab Colore
ISTRUZIONI
DATI (sola lettura)
STEP 2 — Codifica Umana (50) 🔵
STEP 2 — Gemini + Decisione 🟠

Due step, un obiettivo

La classificazione procede in due step sequenziali:

Step 1 — Binario Step 2 — Tematico
Domanda È AI slop? Che tipo di AI slop?
Categorie AI slop / Non AI slop Le vostre categorie (da mercoledì)
Applicato a Tutti i 420 post Solo i post classificati come AI slop
Validazione Kappa umano-umano + umano-IA Kappa umano-umano + umano-IA

AI slop vs. immagine AI

Un’immagine AI può non essere slop. Ma l’AI slop è sempre generato dall’IA. Valutate sempre testo e immagine insieme.

Immagine AI, non slop

  • Foto profilo generata con IA
  • Illustrazione editoriale dichiarata
  • Contenuto artistico esplicitamente AI

AI slop

  • Engagement bait con immagini generate
  • Contenuto virale non dichiarato come AI
  • Immagini emotive progettate per reazioni

Il workflow per ogni step

Ogni step segue lo stesso pattern — prima gli umani, poi Gemini:

Codifica umana (50 post) → Consenso sui disaccordi → Definizione raffinataPrompt Gemini (con one-shot) → Classificazione automatica

Collegamento con il seminario Paroni

Come avete praticato con le 20 headline: codifica individuale → confronto → raffinamento del prompt → classificazione Gemini. Lo stesso principio, su scala più ampia e con dati multimodali (Marino & Giglietto, 2024).

Oggi: Step 1

Oggi facciamo

  • Codifica umana: 50 post (individuale)
  • Discussione disaccordi → definizione raffinata
  • Prompt Gemini con one-shot examples
  • Classificazione binaria di tutti i 420 post

Domani faremo

  • Validazione Step 1 (kappa)
  • Matrice di confusione
  • Filtrare → sottoinsieme AI slop
  • Iniziare Step 2 (tematico)

Step 1: Codifica Umana

Codifica individuale: le regole

Ogni membro codifica 50 post pre-selezionati in modo indipendente nel tab STEP 1 — Codifica Umana (50).

  • Per ogni post: guardate testo + immagine insieme
  • Scelta binaria: AI slop oppure Non AI slop
  • Nessuna discussione con gli altri membri del gruppo
  • Non guardate le risposte degli altri
  • Se siete incerti, scegliete comunque e annotate il dubbio

Cosa rende un post AI slop?

Indicatori visivi

  • Artefatti tipici dell’IA generativa (dita, testo, texture)
  • Iperrealismo innaturale, illuminazione impossibile
  • Stile ricorrente di generazione (es. modelli diffusivi)

Indicatori contestuali

  • Testo del post emotivo o generico (“Amen”, “Chi ricorda?”)
  • Nessuna attribuzione della fonte dell’immagine
  • Pattern di engagement bait (inviti a condividere, commentare)

Attenzione: questi criteri sono un punto di partenza. La vostra definizione si raffinerà durante la fase di consenso.

Consenso sui disaccordi

Dalla codifica al consenso

Dopo che tutti hanno codificato i 50 post:

  1. Confrontate le vostre classificazioni nel tab STEP 1 — Codifica Umana (50)
  2. Identificate i post su cui non siete d’accordo
  3. Per ogni disaccordo, discutete: perché avete classificato diversamente?
  4. Raggiungete un consenso — la classificazione condivisa

Il prodotto del consenso non è solo una lista di risposte corrette, ma una definizione più precisa di AI slop — con criteri espliciti e casi limite risolti.

Documentare la definizione raffinata

Nel tab CODEBOOK del foglio post_metadata, registrate:

Elemento Cosa scrivere
Definizione di AI slop Criteri espliciti emersi dal consenso
Criteri di inclusione Cosa rende un post AI slop (lista)
Criteri di esclusione Cosa NON è AI slop, anche se ha immagini AI
Casi limite Decisioni prese sui post ambigui, con motivazione
Esempi 2-3 post concordati come AI slop, 2-3 come non AI slop

Step 1: Classificazione con Gemini

Dal consenso al prompt

Struttura del prompt per Step 1

Sezione Contenuto
Ruolo Analista di contenuti social media
Definizione [definizione raffinata di AI slop dal CODEBOOK]
Criteri [criteri di inclusione/esclusione dal consenso]
Esempio AI slop [post concordato — testo + descrizione immagine]
Esempio Non AI slop [post concordato — testo + descrizione immagine]
Compito Per ogni post (testo + immagine), classifica come AI_SLOP o NON_AI_SLOP
Output Tabella: id_post, classificazione, certezza, motivazione_breve

Classificare i post rimanenti

Passo Azione
1. Prompt Copiare il prompt dal tab PROMPT in una nuova chat Gemini
2. Caricare Allegare un batch di 20-30 post (testo + immagini)
3. Verificare Controllare i primi 5 risultati — coerenti con il consenso?
4. Registrare Copiare i risultati nel tab STEP 1 — Gemini + Decisione
5. Ripetere Nuova chat → stesso prompt → prossimo batch

Nuova chat per ogni batch. Il contesto accumulato può far driftare il modello (Cosenza, 2025).

Dopo la classificazione: il filtro

Una volta classificati tutti i 420 post:

Cosa osservare

  • Quanti post sono AI slop? Quanti non AI slop?
  • La proporzione è plausibile?
  • I post con certezza bassa — sono concentrati in una zona specifica?

Il prossimo passo

  • Domani: validazione con kappa
  • Se il kappa è accettabile → filtrare
  • Solo i post AI slop passano allo Step 2
  • Lo Step 2 userà le categorie tematiche del vostro pilot

Pattern Preliminari

Distribuzione binaria e engagement

I post AI slop hanno engagement diverso dai non AI slop? Compilate:

Metrica AI slop (media) Non AI slop (media)
Reazioni ? ?
Condivisioni ? ?
Visualizzazioni ? ?
N. commenti ? ?

Questa prima analisi sarà approfondita nello Step 2 con le categorie tematiche.

Lavoro Pratico

Istruzioni per il lavoro di gruppo

Obiettivo del lab (90 minuti)

Completare lo Step 1: codifica umana → consenso → prompt Gemini → classificazione binaria di tutti i 420 post.

Timeline della sessione

Fase Tempo Attività Tab
1. Codifica umana 25 min Ogni membro codifica 50 post (indipendente) STEP 1 — Codifica Umana
2. Consenso 20 min Confronto, discussione disaccordi, definizione raffinata CODEBOOK
3. Prompt + pilot 10 min Costruire il prompt con one-shot, testare su 5-10 post PROMPT
4. Classificazione 30 min Batch con Gemini, tutti i 420 post STEP 1 — Gemini + Decisione
5. Pattern 5 min Conteggio AI slop / non AI slop

Checklist di fine lab

Prima di uscire, ogni gruppo verifica:

Per domani: calcoleremo il kappa (umano-umano e umano-IA) per validare lo Step 1. Se accettabile, filtreremo i post AI slop e inizieremo lo Step 2.

Grazie!

Prossima lezione: Validazione — Umano vs Macchina (25 Marzo 2026)

📧 fabio.giglietto@uniurb.it

🌐 blended.uniurb.it

Riferimenti

Cosenza, V. (2025). Esercizi di Intelligenza Aumentata: Imparare a Collaborare con le I.A.
Marino, G., & Giglietto, F. (2024). Integrating Large Language Models in Political Discourse Studies on Social Media: Challenges of Validating an LLMs-in-the-loop Pipeline. Sociologica, 18(2), 87–107. https://doi.org/10.6092/issn.1971-8853/19524