Deepfake detection: perché i software di rilevamento sbagliano e la vera difesa è certificare alla fonte

Le immagini generate dall'AI hanno smesso di essere un esercizio da laboratorio. Oggi circolano nei feed, nelle chat e nelle prime pagine dei giornali, spesso indistinguibili da una fotografia autentica. La risposta più ovvia sembrava semplice: affidarsi a un software che, dato un contenuto, ci dicesse se è vero o falso. Un report indipendente di NewsGuard pubblicato l'11 maggio 2026 ha però messo in chiaro un problema scomodo. I principali strumenti di deepfake detection sbagliano spesso: dichiarano autentico ciò che è manipolato, e falso ciò che è reale. E allora, se non possiamo fidarci nemmeno dei rilevatori, come distinguiamo il vero dal falso?

La risposta è che stiamo combattendo la battaglia sbagliata. Il rilevamento a valle, cioè l'analisi di un contenuto già esistente per stabilirne l'autenticità, è una corsa persa in partenza. La difesa che regge è quella opposta: certificare l'autenticità di ogni informazione alla fonte, nel momento in cui viene acquisita, con valore legale. Il paradigma è cambiato. Non viviamo più nel mondo del "vero salvo prova contraria", ma in quello del "falso salvo dichiarazione di verità all'origine".

I software di deepfake detection sono inaffidabili: cosa dicono i numeri

I principali strumenti di deepfake detection sbagliano in modo sistematico, e i numeri non lasciano scampo. NewsGuard ha testato cinque strumenti di deepfake detection su un campione di 45 immagini reali, divise in tre gruppi: 15 autentiche, 15 ritoccate e 15 interamente manipolate. Il dato più grave riguarda i falsi positivi. In media il 13,33% delle immagini autentiche è stato bollato come generato dall'AI, e lo strumento peggiore è arrivato fino al 40% di errore. Tradotto: una fotografia vera su sette rischia di essere marchiata come falsa da un rilevatore. Non si tratta di un caso isolato o di un singolo prodotto difettoso, ma di un comportamento ricorrente su tutti gli strumenti testati, che segnala un limite strutturale del metodo, non un difetto di calibrazione.

Falsi positivi: l'autentico dichiarato falso

Il danno più insidioso del rilevamento a valle non è lasciar passare un falso. È condannare il vero. Le immagini del campione NewsGuard provenivano in larga parte da contesti di guerra, dove l'autenticità di una fotografia può pesare sull'opinione pubblica e sulle decisioni politiche. Uno degli strumenti testati ha classificato un video autentico come falso con una probabilità del 96,9%: una sicurezza quasi assoluta, e completamente sbagliata. Quando un rilevatore "certifica" con questa apparente certezza che un documento reale è artificiale, di fatto consegna a chiunque un alibi pronto all'uso per negare l'evidenza. Il filmato di una violazione diventa, con un clic, "un falso, lo dice il software". Uno strumento nato per smascherare le manipolazioni finisce così per fornire loro copertura.

Falsi negativi e assenza di criteri uniformi

Il secondo problema è l'incoerenza di fondo tra i sistemi. NewsGuard ha rilevato che i cinque strumenti analizzati erano in disaccordo tra loro su 35 immagini su 45: meno di una volta su quattro convergevano sullo stesso verdetto. Lo stesso contenuto, sottoposto a rilevatori diversi, può quindi ricevere etichette opposte. Manca un criterio condiviso, manca una soglia oggettiva. Nel frattempo le immagini AI diventano più realistiche e i video deepfake sempre più puliti, i confini si fanno sfumati e i falsi negativi (manipolazioni dichiarate autentiche) crescono di pari passo con la qualità dei generatori. È il limite congenito di qualsiasi deepfake detection: misura una probabilità, non una certezza. Come hanno riportato anche Wired Italia e altre testate, il problema non è il singolo prodotto difettoso. È il metodo stesso del rilevamento a posteriori.

Perché il rilevamento a valle è una corsa che si perde in partenza

Il rilevamento dei deepfake è destinato a perdere perché insegue una tecnologia che corre più veloce di lui. La deepfake detection funziona analizzando un contenuto già prodotto, alla ricerca di artefatti, incongruenze nei pixel, anomalie nelle ombre o nei movimenti. Il punto è che ogni segnale che un rilevatore impara a riconoscere diventa, per chi genera i deepfake, un difetto da correggere nella versione successiva. È una rincorsa squilibrata per costruzione, dove la difesa reagisce e l'attacco anticipa sempre di una mossa. Ogni nuovo modello generativo nasce già capace di superare i rilevatori della generazione precedente, e il divario non si chiude mai: si sposta soltanto in avanti. Ecco perché un sistema che si fonda sull'analisi a posteriori è destinato a invecchiare più in fretta della minaccia che dovrebbe contrastare.

La detection insegue, la generazione corre più veloce

Chi produce un deepfake oggi può addestrare il proprio modello proprio contro i rilevatori più diffusi, eliminando uno a uno gli indizi che lo tradiscono. Tecniche come il face swap, un tempo riconoscibili da bordi sfocati o riflessi incoerenti negli occhi, sono diventate molto più pulite. Lo stesso studio dell'Università di Edimburgo ha mostrato quanto siano fragili le impronte su cui si basa il rilevamento: ciò che è distintivo oggi sparisce con il prossimo aggiornamento del generatore. Il risultato è quello fotografato dal report NewsGuard, con rilevatori che sbagliano, si contraddicono e perdono terreno a ogni generazione di modelli. Per chi deve difendere l'autenticità di una prova, la conclusione è netta: inseguire il falso a posteriori non scala. TrueScreen affronta il problema dal lato opposto, acquisendo il contenuto con metodologia forense e certificandolo con valore legale già nel momento della cattura, così da rendere superflua la verifica a posteriori. Sono i limiti della deepfake detection a imporre questo cambio di logica.

Il paradigma è cambiato: dal "vero salvo prova contraria" al "falso salvo dichiarazione di verità"

Per decenni abbiamo trattato una fotografia o un video come veri fino a prova contraria, semplicemente perché falsificarli richiedeva competenze e strumenti rari. L'AI generativa ha ribaltato questa presunzione. Oggi qualsiasi contenuto è potenzialmente sintetico, e l'onere si sposta: non si tratta più di dimostrare che qualcosa è falso, ma di poter dimostrare che qualcosa è vero. È il paradigma della fiducia digitale che cambia segno: la presunzione di autenticità che reggeva foto, video e documenti viene meno, e con essa l'idea che basti guardare un contenuto per fidarsene. Chi vuole essere creduto deve poter portare una prova della genuinità del proprio materiale, costruita prima che il dubbio abbia modo di insinuarsi.

Questa inversione produce un effetto perverso, noto come liar's dividend, il "dividendo del bugiardo". Quando tutti sanno che i deepfake esistono e che persino i rilevatori sbagliano, chiunque venga ripreso a fare qualcosa di compromettente può semplicemente negare: "è un falso generato dall'AI". L'inaffidabilità della deepfake detection non è un dettaglio tecnico, è il carburante di questo meccanismo. Più i rilevatori si contraddicono, più diventa facile contestare anche le prove autentiche. Il dividendo del bugiardo erode la fiducia non perché i falsi siano perfetti, ma perché il dubbio è diventato un'arma. Nasce così il paradosso per cui il vero sembra falso, e l'unico modo per uscirne non è dimostrare a posteriori che un contenuto è genuino: è dichiararne e certificarne la verità nell'istante stesso in cui nasce.

Cosa significa certificare l'autenticità alla fonte

TrueScreen, la Data Authenticity Platform, ribalta la logica della detection: invece di analizzare un contenuto per stabilire se è falso, ne certifica l'autenticità nel momento stesso in cui viene acquisito, con un report forense dotato di valore legale. Certificare alla fonte vuol dire intervenire all'origine, non a posteriori. Il contenuto viene catturato con metodologia forense, ridotto a un'impronta digitale univoca (hash) e sigillato con marca temporale qualificata e sigillo elettronico erogati da QTSP qualificati terzi, integrati via API conformi a eIDAS. Da quel momento qualsiasi alterazione è rilevabile, e l'autenticità non dipende più dall'opinione di un rilevatore ma da una prova oggettiva e verificabile. È l'approccio opposto e complementare al rilevamento: non si chiede "questo è falso?", si stabilisce "questo è autentico, e lo posso provare".

Acquisizione e certificazione con valore legale nello stesso atto

La forza del metodo sta nel fondere acquisizione e certificazione in un unico atto. Con l'app TrueScreen o dal Web Portal, l'utente cattura una foto, un video o una pagina web, e nello stesso istante il sistema ne fissa l'integrità: calcola l'hash, applica la marca temporale qualificata e il sigillo elettronico tramite QTSP integrato, e produce un report con valore probatorio. Non si tratta di apporre un sigillo su un dato preesistente di cui non si conosce la provenienza, ma di certificare il contenuto fin dalla sua nascita. È qui la differenza rispetto a certificare una foto con valore legale solo dopo che è stata creata e diffusa. La metodologia poggia su standard riconosciuti: eIDAS per marca temporale e sigillo, ISO/IEC 27037 per il trattamento delle prove digitali, l'articolo 2712 del Codice Civile e il CAD per le riproduzioni informatiche.

Immutabilità alla fonte invece di analisi a posteriori

La differenza pratica tra i due paradigmi è netta, e una tabella la rende immediata.

Aspetto	Rilevamento a valle (detection)	Certificazione alla fonte
Momento dell'intervento	Dopo la creazione e la diffusione	Nell'istante della cattura
Domanda a cui risponde	"Questo contenuto è falso?"	"Questo contenuto è autentico e provabile?"
Base del verdetto	Analisi statistica, probabilità di errore	Hash, marca temporale qualificata, sigillo QTSP
Affidabilità	Variabile (fino al 40% di falsi positivi)	Verificabile e oggettiva
Tiene il passo con i generatori?	No, insegue ogni nuovo modello	Sì, indipendente dalla tecnica di falsificazione
Valore in giudizio	Debole e contestabile	Prova con valore legale

Un rilevatore continuerà a sbagliare tanto più i modelli generativi miglioreranno. Una prova certificata alla fonte, invece, resta valida a prescindere da quanto diventino sofisticati i deepfake. L'immutabilità non si ottiene cercando difetti nel falso, ma fissando la verità dell'autentico nel punto esatto in cui entra nel mondo digitale. È la stessa logica della provenienza digitale: sapere da dove viene un contenuto, e poterlo dimostrare.

Cosa cambia per chi produce e pubblica informazioni

Per redazioni, pubbliche amministrazioni e imprese, certificare alla fonte significa produrre prove digitali incontestabili fin dall'origine, eliminando alla radice il rischio che il proprio lavoro venga liquidato come "probabilmente falso". Il cambiamento è concreto, non teorico. Un giornalista che riprende un evento con l'app TrueScreen ottiene un file la cui autenticità non può essere contestata in tribunale. Il liar's dividend scompare, perché la prova nasce già certificata e non lascia margine a chi vorrebbe sostenere che è stata generata dall'AI.

Lo stesso vale dove l'autenticità ha conseguenze legali dirette. In Italia i deepfake possono già configurare reato: la Legge 132/2025 ha introdotto fattispecie specifiche sui contenuti generati con AI, che si affiancano a ipotesi già previste come la diffamazione, la sostituzione di persona e l'illecito trattamento dei dati. Sul piano europeo, l'AI Act impone obblighi di trasparenza ed etichettatura sui contenuti sintetici. In questo contesto, chi documenta un fatto, gestisce un sinistro o pubblica un'inchiesta non può più affidarsi alla sola buona fede di chi guarda. Lo stesso meccanismo difensivo conta anche contro i deepfake usati nelle frodi aziendali, dove un video falso del CEO può bastare ad autorizzare un bonifico. Certificare alla fonte trasforma ogni acquisizione in un atto difendibile: la verità non va più rincorsa dopo, viene fissata e sigillata mentre accade.

FAQ: deepfake detection e certificazione alla fonte

I software di deepfake detection sono affidabili?

No. Secondo il report NewsGuard dell'11 maggio 2026, i cinque strumenti di deepfake detection testati hanno classificato in media il 13,33% delle immagini autentiche come generate dall'AI, con punte del 40% per lo strumento peggiore, e si sono contraddetti tra loro su 35 immagini su 45. Il rilevamento a valle sbaglia in modo sistematico perché analizza il contenuto a posteriori, inseguendo modelli generativi che migliorano più in fretta dei rilevatori.

Esistono deepfake impossibili da riconoscere?

Sì. Esistono già video deepfake e immagini AI che nessuno strumento di deepfake detection individua in modo affidabile, perché chi li produce può addestrare i propri modelli contro i rilevatori stessi ed eliminare gli indizi che li tradiscono. Per questo riconoscere un deepfake a occhio o con un software è sempre meno praticabile. La difesa che regge non è il rilevamento, ma la certificazione dell'autenticità alla fonte: invece di cercare il falso, si prova il vero.

Qual è il modo migliore per combattere i deepfake?

Il modo più efficace non è rilevare i falsi, ma certificare l'autenticità dei contenuti veri nel momento in cui vengono creati. Mentre il rilevamento a valle resta una rincorsa persa, certificare alla fonte fissa l'integrità di una foto o di un video con hash, marca temporale qualificata e sigillo elettronico, rendendo la prova verificabile e dotata di valore legale a prescindere da quanto diventino sofisticati i deepfake.

Cosa significa certificare un contenuto alla fonte?

Certificare un contenuto alla fonte significa acquisirlo con metodologia forense e fissarne l'integrità nello stesso istante della cattura, prima che possa essere alterato o diffuso. Il contenuto viene ridotto a un hash univoco e sigillato con marca temporale qualificata e sigillo elettronico tramite QTSP qualificati. A differenza del rilevamento, che analizza un contenuto già esistente, la certificazione alla fonte ne dichiara l'autenticità all'origine in modo immutabile.

La certificazione alla fonte ha valore legale?

Sì. La certificazione alla fonte produce un report con valore probatorio fondato su standard riconosciuti: marca temporale qualificata e sigillo elettronico erogati da QTSP qualificati ai sensi del regolamento eIDAS, trattamento delle prove digitali secondo la norma ISO/IEC 27037, oltre a riferimenti come l'articolo 2712 del Codice Civile e il CAD per le riproduzioni informatiche. L'ammissibilità concreta dipende sempre dalla giurisdizione e dal contesto del caso.

Deepfake: quando è reato in Italia?

In Italia il deepfake è reato dal 10 ottobre 2025: la Legge 132/2025 ha introdotto l'art. 612-quater del codice penale, che punisce con la reclusione da 1 a 5 anni chi cede, pubblica o diffonde senza consenso immagini, video o voci falsi generati con l'intelligenza artificiale, causando un danno ingiusto. La norma colpisce la diffusione, non la semplice creazione, e si affianca a reati già previsti come la diffamazione, la sostituzione di persona e l'illecito trattamento dei dati. Per chi subisce un deepfake, disporre di contenuti già certificati alla fonte semplifica la prova: dimostra cosa è reale senza dover smontare il falso. Approfondisci nella nuova legge italiana sui deepfake (L.132/2025).

Cosa fare se si è vittima di un deepfake?

Se sei vittima di un deepfake, raccogli e certifica subito le prove: salva i contenuti, gli indirizzi web e le date, e acquisiscili in modo da renderli opponibili in giudizio. Segnala il contenuto alla piattaforma che lo ospita chiedendone la rimozione e, se il deepfake lede la tua reputazione o è a sfondo sessuale, valuta una denuncia: dal 2025 l'art. 612-quater del codice penale lo punisce come reato. Avere materiale già certificato alla fonte rafforza la tua posizione, perché documenta cosa è autentico senza dover dimostrare l'inautenticità del falso. Puoi anche verificare l'autenticità di una foto sospetta.

Certifica i tuoi contenuti alla fonte, con valore legale

Smetti di rincorrere il falso. Con TrueScreen acquisisci foto, video e pagine web e ne certifichi l’autenticità nell’istante della cattura, con un report dotato di valore legale.

Inizia ora

Richiedi una demo