Lab: Classificazione su Scala con IA

Roadmap del lab

Pipeline completa — i due step della classificazione
Step 1: codifica umana — 50 post, giudizio indipendente
Step 1: consenso — discussione sui disaccordi e definizione raffinata
Step 1: Gemini — dal consenso al prompt, classificazione automatica
Primi pattern — proporzione di AI slop nel dataset
Lavoro pratico — codifica, consenso e classificazione per gruppi

La Pipeline Completa

Il foglio di codifica: post_metadata

post_metadata — 8 tab, 4 operativi + 4 di supporto:

Tab operativi (oggi usiamo questi)

Tab	Colore
STEP 1 — Codifica Umana (50)	🔵
STEP 1 — Gemini + Decisione	🟠
CODEBOOK	—
PROMPT	—

Tab di supporto / Step 2

Tab	Colore
ISTRUZIONI	—
DATI (sola lettura)	—
STEP 2 — Codifica Umana (50)	🔵
STEP 2 — Gemini + Decisione	🟠

Due step, un obiettivo

La classificazione procede in due step sequenziali:

	Step 1 — Binario	Step 2 — Tematico
Domanda	È AI slop?	Che tipo di AI slop?
Categorie	AI slop / Non AI slop	Le vostre categorie (da mercoledì)
Applicato a	Tutti i 420 post	Solo i post classificati come AI slop
Validazione	Kappa umano-umano + umano-IA	Kappa umano-umano + umano-IA

AI slop vs. immagine AI

Un’immagine AI può non essere slop. Ma l’AI slop è sempre generato dall’IA. Valutate sempre testo e immagine insieme.

Immagine AI, non slop

Foto profilo generata con IA
Illustrazione editoriale dichiarata
Contenuto artistico esplicitamente AI

AI slop

Engagement bait con immagini generate
Contenuto virale non dichiarato come AI
Immagini emotive progettate per reazioni

Distinzione fondamentale per lo Step 1. Non tutte le immagini generate dall’IA sono AI slop. Il termine “slop” implica contenuto di bassa qualità prodotto in massa per generare engagement, spesso senza dichiarare la natura sintetica. Un’immagine AI usata come foto profilo o come illustrazione dichiarata non è slop. La valutazione deve sempre considerare testo e immagine insieme: il testo fornisce contesto sull’intento del post. Per esempio, un’immagine AI di un paesaggio accompagnata da “Guardate cosa ha creato l’IA!” non è slop; la stessa immagine con “Il tramonto più bello che abbia mai visto” potrebbe esserlo. Riferimento al dataset di Terenzi & Giglietto (2025): i post sono stati pre-selezionati come probabili contenuti AI, ma non tutti necessariamente sono slop.

Il workflow per ogni step

Ogni step segue lo stesso pattern — prima gli umani, poi Gemini:

Codifica umana (50 post) → Consenso sui disaccordi → Definizione raffinata → Prompt Gemini (con one-shot) → Classificazione automatica

Collegamento con il seminario Paroni

Come avete praticato con le 20 headline: codifica individuale → confronto → raffinamento del prompt → classificazione Gemini. Lo stesso principio, su scala più ampia e con dati multimodali (Marino & Giglietto, 2024).

Oggi: Step 1

Oggi facciamo

Codifica umana: 50 post (individuale)
Discussione disaccordi → definizione raffinata
Prompt Gemini con one-shot examples
Classificazione binaria di tutti i 420 post

Domani faremo

Validazione Step 1 (kappa)
Matrice di confusione
Filtrare → sottoinsieme AI slop
Iniziare Step 2 (tematico)

Step 1: Codifica Umana

Codifica individuale: le regole

Ogni membro codifica 50 post pre-selezionati in modo indipendente nel tab STEP 1 — Codifica Umana (50).

Per ogni post: guardate testo + immagine insieme
Scelta binaria: AI slop oppure Non AI slop
Nessuna discussione con gli altri membri del gruppo
Non guardate le risposte degli altri
Se siete incerti, scegliete comunque e annotate il dubbio

Cosa rende un post AI slop?

Indicatori visivi

Artefatti tipici dell’IA generativa (dita, testo, texture)
Iperrealismo innaturale, illuminazione impossibile
Stile ricorrente di generazione (es. modelli diffusivi)

Indicatori contestuali

Testo del post emotivo o generico (“Amen”, “Chi ricorda?”)
Nessuna attribuzione della fonte dell’immagine
Pattern di engagement bait (inviti a condividere, commentare)

Attenzione: questi criteri sono un punto di partenza. La vostra definizione si raffinerà durante la fase di consenso.

Consenso sui disaccordi

Dalla codifica al consenso

Dopo che tutti hanno codificato i 50 post:

Confrontate le vostre classificazioni nel tab STEP 1 — Codifica Umana (50)
Identificate i post su cui non siete d’accordo
Per ogni disaccordo, discutete: perché avete classificato diversamente?
Raggiungete un consenso — la classificazione condivisa

Il prodotto del consenso non è solo una lista di risposte corrette, ma una definizione più precisa di AI slop — con criteri espliciti e casi limite risolti.

Documentare la definizione raffinata

Nel tab CODEBOOK del foglio post_metadata, registrate:

Elemento	Cosa scrivere
Definizione di AI slop	Criteri espliciti emersi dal consenso
Criteri di inclusione	Cosa rende un post AI slop (lista)
Criteri di esclusione	Cosa NON è AI slop, anche se ha immagini AI
Casi limite	Decisioni prese sui post ambigui, con motivazione
Esempi	2-3 post concordati come AI slop, 2-3 come non AI slop

Step 1: Classificazione con Gemini

Dal consenso al prompt

Struttura del prompt per Step 1

Sezione	Contenuto
Ruolo	Analista di contenuti social media
Definizione	[definizione raffinata di AI slop dal CODEBOOK]
Criteri	[criteri di inclusione/esclusione dal consenso]
Esempio AI slop	[post concordato — testo + descrizione immagine]
Esempio Non AI slop	[post concordato — testo + descrizione immagine]
Compito	Per ogni post (testo + immagine), classifica come AI_SLOP o NON_AI_SLOP
Output	Tabella: id_post, classificazione, certezza, motivazione_breve

Classificare i post rimanenti

Passo	Azione
1. Prompt	Copiare il prompt dal tab PROMPT in una nuova chat Gemini
2. Caricare	Allegare un batch di 20-30 post (testo + immagini)
3. Verificare	Controllare i primi 5 risultati — coerenti con il consenso?
4. Registrare	Copiare i risultati nel tab STEP 1 — Gemini + Decisione
5. Ripetere	Nuova chat → stesso prompt → prossimo batch

Nuova chat per ogni batch. Il contesto accumulato può far driftare il modello (Cosenza, 2025).

Dopo la classificazione: il filtro

Una volta classificati tutti i 420 post:

Cosa osservare

Quanti post sono AI slop? Quanti non AI slop?
La proporzione è plausibile?
I post con certezza bassa — sono concentrati in una zona specifica?

Il prossimo passo

Domani: validazione con kappa
Se il kappa è accettabile → filtrare
Solo i post AI slop passano allo Step 2
Lo Step 2 userà le categorie tematiche del vostro pilot

Pattern Preliminari

Distribuzione binaria e engagement

I post AI slop hanno engagement diverso dai non AI slop? Compilate:

Metrica	AI slop (media)	Non AI slop (media)
Reazioni	?	?
Condivisioni	?	?
Visualizzazioni	?	?
N. commenti	?	?

Questa prima analisi sarà approfondita nello Step 2 con le categorie tematiche.

Lavoro Pratico

Istruzioni per il lavoro di gruppo

Obiettivo del lab (90 minuti)

Completare lo Step 1: codifica umana → consenso → prompt Gemini → classificazione binaria di tutti i 420 post.

Timeline della sessione

Fase	Tempo	Attività	Tab
1. Codifica umana	25 min	Ogni membro codifica 50 post (indipendente)	STEP 1 — Codifica Umana
2. Consenso	20 min	Confronto, discussione disaccordi, definizione raffinata	CODEBOOK
3. Prompt + pilot	10 min	Costruire il prompt con one-shot, testare su 5-10 post	PROMPT
4. Classificazione	30 min	Batch con Gemini, tutti i 420 post	STEP 1 — Gemini + Decisione
5. Pattern	5 min	Conteggio AI slop / non AI slop	—

Checklist di fine lab

Prima di uscire, ogni gruppo verifica:

50 post codificati da ogni membro in STEP 1 — Codifica Umana (50)
Disaccordi discussi e risolti — consenso raggiunto
Definizione raffinata documentata in CODEBOOK
Prompt salvato in PROMPT (con one-shot examples)
420 post classificati da Gemini in STEP 1 — Gemini + Decisione
Conteggio AI slop / Non AI slop annotato

Per domani: calcoleremo il kappa (umano-umano e umano-IA) per validare lo Step 1. Se accettabile, filtreremo i post AI slop e inizieremo lo Step 2.

Grazie!

Prossima lezione: Validazione — Umano vs Macchina (25 Marzo 2026)

📧 fabio.giglietto@uniurb.it

🌐 blended.uniurb.it

Riferimenti

Cosenza, V. (2025). Esercizi di Intelligenza Aumentata: Imparare a Collaborare con le I.A.

Marino, G., & Giglietto, F. (2024). Integrating Large Language Models in Political Discourse Studies on Social Media: Challenges of Validating an LLMs-in-the-loop Pipeline. Sociologica, 18(2), 87–107. https://doi.org/10.6092/issn.1971-8853/19524