Ce sunt videoclipurile Deepfake și detectarea clipirii unui ochi

O nouă formă de dezinformare este pregătită să se răspândească prin comunitățile online, pe măsură ce campaniile electorale de la jumătatea perioadei din 2018 se încălzesc. Numit „deepfakes” după cont online pseudonim care a popularizat tehnica - care poate și-a ales numele deoarece procesul folosește o metodă tehnică numită „învățare profundă” - aceste videoclipuri false arată foarte realiste.

Până acum, oamenii au folosit videoclipuri deepfake în pornografie și satiră pentru a face să pară că oamenii celebri fac lucruri pe care nu le-ar face în mod normal.

Dar este aproape sigur deepfakes vor apărea în timpul sezonului de campanie, pretinzând să descrie candidați spunând lucruri sau să meargă în locuri pe care adevăratul candidat nu le-ar face.

Este Barack Obama - sau este?

{youtube}cQ54GDm1eL0{/youtube}

Deoarece aceste tehnici sunt atât de noi, oamenii au probleme cu diferența dintre videoclipurile reale și videoclipurile deepfake. Munca mea, cu colegul meu Ming-Ching Chang și doctoratul nostru studentul Yuezun Li, a găsit o cale de a spuneți în mod fiabil videoclipuri reale din videoclipuri deepfake. Nu este o soluție permanentă, deoarece tehnologia se va îmbunătăți. Dar este un început și oferă speranță că computerele vor putea ajuta oamenii să spună adevărul din ficțiune.


innerself abonare grafică


Ce este oricum un „deepfake”?

Realizarea unui videoclip deepfake seamănă mult cu traducerea între limbi. Servicii precum Traducerea Google utilizați învățarea automată - analiza computerizată a zeci de mii de texte în mai multe limbi - la detectează modele de utilizare a cuvintelor pe care le folosesc pentru a crea traducerea.

Algoritmii Deepfake funcționează la fel: utilizează un tip de sistem de învățare automată numit a rețea neuronală profundă pentru a examina mișcările feței unei persoane. Apoi sintetizează imagini ale feței altei persoane făcând mișcări similare. Dacă faceți acest lucru în mod eficient, se creează un videoclip cu persoana vizată care pare să facă sau să spună lucrurile pe care le-a făcut persoana sursă.

Cum sunt realizate videoclipurile deepfake.

{youtube}8LhI-e2B8Lg{/youtube}

Înainte ca acestea să poată funcționa corect, rețelele neuronale profunde au nevoie de o mulțime de informații sursă, cum ar fi fotografiile cu persoanele care sunt sursa sau ținta imitării. Cu cât sunt folosite mai multe imagini pentru a antrena un algoritm deepfake, cu atât va fi mai realistă imitarea digitală.

Detectarea clipirii

Există încă defecte în acest nou tip de algoritm. Una dintre ele are legătură cu modul în care fețele simulate clipesc - sau nu. Oamenii adulți sănătoși clipesc undeva între fiecare 2 și 10 secunde, și o singură clipire durează între o zecime și patru zecimi de secundă. Asta ar fi normal să vezi într-un videoclip al unei persoane care vorbește. Dar nu este ceea ce se întâmplă în multe videoclipuri deepfake.

O persoană reală clipește în timp ce vorbește.

{youtube}https://www.youtube.com/watch?v=-MMXXEA3UaM{/youtube}

O față simulată nu clipeste așa cum o face o persoană reală.

{youtube}EttSA9-YIuI{/youtube}

Când un algoritm deepfake este instruit pe imaginile feței unei persoane, acesta depinde de fotografiile disponibile pe internet care pot fi folosite ca date de antrenament. Chiar și pentru persoanele care sunt fotografiate des, sunt disponibile puține imagini online care arată ochii închiși. Nu numai că fotografiile de acest gen sunt rare - deoarece ochii oamenilor sunt deschiși de cele mai multe ori - dar fotografii nu publică de obicei imagini în care ochii subiectelor principale sunt închise.

Fără imagini de antrenament ale oamenilor care clipesc, algoritmii deepfake sunt mai puțin susceptibili de a crea fețe care clipesc normal. Când calculăm rata globală de clipire și comparăm cu intervalul natural, am constatat că personajele din videoclipurile deepfake clipesc mult mai puțin frecvent în comparație cu oamenii reali. Cercetarea noastră folosește învățarea automată examinați deschiderea și închiderea ochilor în videoclipuri.

Acest lucru ne oferă o inspirație pentru a detecta videoclipuri deepfake. Ulterior, dezvoltăm o metodă pentru a detecta când persoana din videoclip clipește. Pentru a fi mai specific, scanează fiecare cadru al unui videoclip în cauză, detectează fețele din acesta și apoi localizează ochii automat. Apoi utilizează o altă rețea neuronală profundă pentru a determina dacă ochiul detectat este deschis sau aproape, folosind aspectul, trăsăturile geometrice și mișcarea ochiului.

Știm că munca noastră profită de un defect în tipul de date disponibile pentru a instrui algoritmi deepfake. Pentru a evita căderea pradă unui defect similar, ne-am instruit sistemul cu o bibliotecă mare de imagini atât cu ochii deschiși, cât și cu ochii închiși. Această metodă pare să funcționeze bine și, ca urmare, am atins o rată de detectare de peste 95%.

Desigur, acesta nu este ultimul cuvânt despre detectarea falsificărilor profunde. Tehnologia este îmbunătățindu-se rapid, iar concurența dintre generarea și detectarea videoclipurilor false este similară cu un joc de șah. În special, clipirea poate fi adăugată videoclipurilor deepfake prin includerea imaginilor feței cu ochii închiși sau folosind secvențe video pentru antrenament. Oamenii care doresc să confunde publicul se vor descurca mai bine la realizarea de videoclipuri false - iar noi și alții din comunitatea tehnologică va trebui să continuăm să găsim modalități de a le detecta.Conversaţie

Despre autor

Siwei Lyu, profesor asociat de informatică; Director, Laborator de viziune computerizată și învățare automată, Universitatea din Albany, Universitatea de Stat din New York

Acest articol a fost publicat inițial Conversaţie. Citeste Articol original.

Cărți conexe

at InnerSelf Market și Amazon