Deepfake
Deepfake (בעברית: דיפ-פייק או דיפייק) היא טכנולוגיה מבוססת בינה מלאכותית ליצירת סרטוני וידאו, צילומים או קטעי אודיו מזוייפים. הייחוד של דיפ-פייק הוא שהתוכן המזוייף נראה אמיתי בשל שילוב תמונות וסרטונים קיימים על פני תמונות וקטעי וידאו מקוריים. בשל יכולות אלו, נעשה בטכנולוגיה שימוש להפקת פייק ניוז, ומתיחות זדוניות [1] כמו גם ספינים תקשורתיים להטיית דעת הקהל.
הביטוי הוא הלחם של המילים "Deep learning" (למידה עמוקה) ו-fake ("מזויף")[1] והשתמשו בו לראשונה בשנת 2017 באתר רדיט.
היסטוריה
התפתחות טכנולוגיית הדיפ-פייק התרחשה במידה רבה בשני מישורים: מחקר במוסדות אקדמאיים ופיתוח על ידי חובבים בקהילות מקוונות.
מחקר אקדמי
שורשי המחקר האקדמי של טכנולוגיית הדיפ-פייק טמונים בעיקר בתחום הראייה הממוחשבת, תת-תחום של מדעי המחשב המבוסס לעיתים קרובות על בינה מלאכותית, שמתמקד בעיבוד ממוחשב של תמונות וסרטונים דיגיטליים. ציון דרך מוקדם היה תוכנית מחשב לשכתוב וידאו שפורסמה בשנת 1997; התוכנית שינתה קטעי וידאו קיימים של אדם מדבר והתאימה את הדיבור שלו לרצועת אודיו שונה[2]. זו הייתה המערכת הראשונה שביצעה שינויים בהבעות פנים באופן אוטומטי לחלוטין, והיא עשתה זאת באמצעות טכניקות למידת מכונה בכדי ליצור קשרים בין הסאונד שמופק על ידי דמות בוידאו וצורת הפנים שלה.
פרויקטים אקדמאיים עדכניים התמקדו ביצירת סרטוני וידאו ריאליסטיים יותר והפיכת הטכניקות לפשוטות, מהירות ונגישות יותר. בשנת 2016 פורסמה תוכנית המחשב "Face2Face", שהתאימה קטעי וידאו של פני אדם כך שיחקו הבעות פנים של אדם אחר בזמן אמת[3]. התוכנית התמקדה בחיקוי הבעות פנים בזמן אמת באמצעות מצלמה שלא תופסת עומק שדה ובכך מאפשרת להשתמש בטכנולוגיה במצלמות צרכנים נפוצות. בשנת 2017 פורסמה תוכנית מחשב בשם "Synthesizing Obama", שלקחה קטעי וידאו של נשיא ארצות הברית לשעבר ברק אובמה והתאימה את הדיבור שלו לרצועת אודיו נפרדת[4]. התוכנית התמקדה ביצירת טכניקה פוטו-ריאליסטית לסינתזת צורות פה מאודיו.
פיתוח חובבים
מקור הביטוי דיפ-פייק לקוח ממשתמש רדיט אנונימי בשם "deepfakes"[5][1]. הוא, כמו אחרים בקהילת r/deepfakes ברדיט, שיתפו סרטוני דיפ-פייק שהם יצרו.
תופעת הדיפ-פייק דווחה לראשונה בדצמבר 2017 במדור המדעי והטכני של מגזין Vice , מה שהוביל לסיקור נרחב בכלי תקשורת נוספים. סמנתה קול פרסמה מאמר על קהילת r/deepfakes שיצרה ושיתפה דיפ-פייקים[6], ושישה שבועות לאחר מכן היא כתבה מאמר נוסף [5]. בפברואר 2018, קהילת r/deepfakes נסגרה על ידי אתר רדיט בשל שיתוף חומרים לא צנועים ללא הסכמת המשתתפים. אתרים נוספים אסרו הפצה ושיתוף חומרי דיפ-פייק, ביניהם טוויטר ו-Pornhub[7]. קהילות מקוונות שלא משתפות חומרי דיפ-פייק לא צנועים נותרו, כולל קהילת רדיט r/SFWdeepfakes שחולקת חומרים בטוחים לסביבת העבודה (safe for work deepfakes)[8].
שימושים
פוליטיקה
טכנולוגיית דיפ-פייק משמשת ליצירת ייצוג שקרי ולא הולם של פוליטיקאים. כך למשל הוחלפו פניו של נשיא ארגנטינה מאוריסיו מאקרי בפניו של אדולף היטלר, ופניה של אנגלה מרקל בפניו של דונלד טראמפ. קווין סיסטרום, מייסד אינסטגרם, הביע דאגה מתופעת הדיפ-פייק ואמר "זה נראה קרוב מאוד לאמיתי, בעולם שבו אפשר להפיץ לעולם מידע במהירות רבה ולגרום לו להדהד, מה קורה אם אתה חושב שדמות פוליטית כלשהי אמרה משהו שבעצם לא נאמר?"[9]
ארצות הברית
במרץ 2018, חברת ASI Data Science פיתחה אלגוריתם עבור ועדה של הBBC שממיר טקסט כתוב לסאונד בקולו של טראמפ. בניסוי מקוון הוקראו בקול שישה משפטים על ידי האלגוריתם ועל ידי חקיינים של טראמפ, ביניהם אלק בולדווין וג'ון די דומניקו . מתוך 267 משתתפים, 90% מצאו את הגרסה שנוצרה על ידי האלגורתים כיותר משכנעת וקרובה למציאות מאשר דגימות הקול האנושיות של החקיינים[10].
באפריל 2018, הבמאי והקומיקאי ג'ורדן פיל ומנכ"ל באזפיד ג'ונה פרטי יצרו סימולציית דיפ-פייק של אובמה בה הוא מסביר על על הסכנה של פייק ניוז[11]. התשדיר הויראלי נפתח במילים: "We’re entering an era in which our enemies can make it look like anyone is saying anything at any point in time" (בעברית: אנו נכנסים לעידן בו האויבים שלנו יכולים לגרום לזה להיראות כאילו כל אחד אומר כל דבר בכל נקודה בזמן)[12]. הסרטון נוצר באמצעות אפליקציית החלפת הפנים FakeApp ותוכנת אפטר אפקטס[13].
בספטמבר 2018, שלושה נציגים מבית הנבחרים של ארצות הברית שלחו מכתב לראש המודיעין הלאומי בו ביקשו ממנו להעריך את האיום שדיפ-פייקים מהווים על הביטחון הלאומי של ארצות הברית. במכתב תיארו את הדיפ-פייק כזיוף דיגיטלי היפר-ריאליסטי והזהירו כי הטכנולוגיה יכולה להוביל לסחיטה ודיסאינפורמציה[1].
ישראל
תהילה שוורץ אלטשולר, חוקרת במכון הישראלי לדמוקרטיה, אמרה על תופעת הדיפ-פייק "אנחנו בעולם של פוסט אמת, נתקלים בהרבה דיסאינפורמציה, ולתכנים הללו יש נטייה להתפזר ברשתות החברתיות אפילו מהר יותר ממידע אמיתי" והוסיפה בהקשר של מערכות הבחירות בישראל "החשש הוא שניתן יהיה להטות את תוצאות הבחירות על ידי פרסום מידע לא נכון, מידע ערוך, ושזה ישפיע על דעת הקהל. [...] הטכנולוגיה הזאת מערערת את האמון שלנו כחברה בעצם היכולת שלנו לברר את המציאות."[14].
במרץ 2019, המפתח הישראלי בר היללי יצר מודל תלת ממדי של בנימין נתניהו בשם "Synthesizing Bibi" (פרפרזה לתוכנית המחשב "Synthesizing Obama" משנת 2017)[15]. היללי הודיע כי אין בכוונתו לפרסם את הקוד בגלל ״רגישויות של פרויקטים מהסוג הזה״[15].
טכנולוגיה
מבחינה טכנולוגית דיפ-פייק מבצעת סינתזת דימוי אנושי מבוססת בינה מלאכותית. באמצעות סופראימפוזיציה וטכניקת למידת מכונה הידועה כרשת אדברסרית גנרטיבית [16].
בדיקת אמיתות
ככל שטכנולוגיית דיפ-פייק מתפתחת נעשה קשה יותר ויותר להבחין בין זיוף למקור. בשל כך, חוקרים החלו לפתח כלים לאימות תוכן ואיתור דיפ-פייק: הסטארט-אפ Truepic פיתח אלגוריתם לאימות תמונות באמצעות אפליקציה[17]; חוקרים מאוניברסיטת אולבני פיתחו גלאי זיופים על סמך דפוסים לא טבעיים של מצמוצים[18]; חוקרים מאוניברסיטת דרום קליפורניה בשיתוף עם המכון לטכנולוגיות יצירתיות בלוס אנג'לס בנו אלגוריתם לזיהוי בינה מלאכותית בסרטוני וידאו של פוליטיקאים שעוקב אחר הבעות פנים זעירות הידועות גם כביומטריה רכה [18].
דרפ"א - סוכנות המחקר הטכנולוגי של הצבא האמריקאי החלה לפתח טכנולוגיות אוטומטיות לאיתור זיופים ואימות אותנטיות של סרטוני וידאו באמצעות מעבדת מדיה פורנזית[14], דוגמת זיהוי חוסר עקביות בתאורה על פני המשתמש[1] בעוד הוועדה הטרנס-אטלנטית ליושר בבחירות מפתחת כלים למניעת התערבות דיפ-פייקים בבחירות לנשיאות[1].
תוכנות Deepfake
בינואר 2018, הושקה תוכנה קניינית (להבדיל מתוכנה חופשית) בשם "FakeApp". האפליקציה מאפשרת למשתמשים ליצור ולשתף בקלות יחסית סרטוני וידאו עם פנים שהוחלפו. האפליקציה משתמשת ברשת עצבית מלאכותית, מעבד גרפי ושטח אחסון של בין 3 ל-4 ג'יגה-בייט ליצירת וידאו מזויף. התוכנה זקוקה לחומר ויזאולי רב של האדם שאת פניו רוצים להכניס לווידאו המקורי בכדי שאלגוריתם למידה עמוקה ילמד איזה היבטים בתמונה יש להחליף. התוכנה משתמשת בשלד "TensorFlow" של גוגל, שבין היתר משמש בתוכנית המחשב "DeepDream" .
באוגוסט 2018, חוקרים מאוניברסיטת קליפורניה בברקלי פרסמו מאמר שהציג אפליקציית ריקוד מזויף שיוצרת את הרושם של יכולות ריקוד מקצועי באמצעות בינה מלאכותית[19][20].
יש חלופות קוד פתוח לתוכנת FakeApp המקורית, דוגמת: DeepFaceLab[21], FaceSwap[22] ו-myFakeApp[23].
זיוף סאונד
במקביל לפיתוח תוכנות שמייצרות זיופים ויזואליים, פותחו גם תוכנות לעיבוד וזיוף סאונד.
בסוף שנת 2016, אדובי הכריזה על יצירת אב טיפוס לתוכנה חדשה בשם "VoCo" שתאפשר לקחת הקלטה של קול אנושי ולהוסיף לה בהקלדה מילים ומשפטים חדשים שיישמעו כאילו נאמרו על ידי הדובר המקורי. התוכנה זקוקה לדגימת קול בת 20 דקות[24].
סטארט-אפ קנדי בשם Lyrebird מפתח מוצר שיאפשר ליצור הקלטה מלאכותית על סמך דגימת קול בת 60 שניות[24].
בסוף 2017, חברת באידו הסינית הכריזה על פיתוח Deep Voice, מטקסט לדיבור בזמן אמת, תוכנה לשיבוט קול שזקוקה לדגימת קול מקורית בת שניות אחדות בלבד[24][25].
בשנת 2019 נגנבו כמעט רבע מיליון דולר על ידי זיוף קול[26].
ביקורת
קישורים חיצוניים
- אושרית גן-אל, הכלי המפחיד שמאפשר לשתול את הפנים שלכם בכל סרטון, באתר גלובס, 1 בפברואר 2018
- אושרית גן-אל, DeepFake: מי יעצור את הדור הבא של הסרטונים המזויפים, באתר גלובס, 9 באוקטובר 2018
- טל שחף, מזייפים: הישראלים שעושים דיפ פייק, באתר ynet, 6 באוגוסט 2019
- עדן יואל, כשזה עמוק, באתר מאקו, 16 באוגוסט 2019
הערות שוליים
- 1 2 3 4 5 6 אושרית גן-אל, DeepFake: מי יעצור את הדור הבא של הסרטונים המזויפים, באתר גלובס, 9 באוקטובר 2018
- ↑ Bregler, Christoph; Covell, Michele; Slaney, Malcolm, Video Rewrite: driving visual speech with audio, ACM Digital Library, 1997 (באנגלית)
- ↑ Justus Thies, Michael Zollhöfer, Marc Stamminger, Christian Theobalt, Matthias Nießner, Face2Face: Real-Time Face Capture and Reenactment of RGB Videos, IEEE Xplore, יוני 2016 (באנגלית)
- ↑ Supasorn Suwajanakorn, Steven M. Seitz, Ira Kemelmacher-Shlizerman, Synthesizing Obama: learning lip sync from audio, ACM Digital Library, יולי 2017 (באנגלית)
- 1 2 Samantha Cole, We Are Truly Fucked: Everyone Is Making AI-Generated Fake Porn Now, Vice, 24 בינואר 2018 (באנגלית)
- ↑ Samantha Cole, AI-Assisted Fake Porn Is Here and We’re All Fucked, Vice, 11 בדצמבר 2017 (באנגלית)
- ↑ Jay Hathaway, Here’s where ‘deepfakes,’ the fake celebrity porn, went after the Reddit ban, The Daily Dot, 8 בפברואר 2018 (באנגלית)
- ↑ r/SFWdeepfakes, רדיט (באנגלית)
- ↑ הגר בוחבוט, דיפ פייק: לכו תסבירו שזה לא וידאו שלכם, באתר ynet, 23 בנובמבר 2018
- ↑ Ryan Browne, Anti-election meddling group makes A.I.-powered Trump impersonator to warn about ‘deepfakes’, CNBC, 7 בדצמבר 2018 (באנגלית)
- ↑ גיא לוי, כשאובמה קילל את טראמפ אל מול המצלמות, באתר ynet, 18 באפריל 2018
- ↑ Aja Romano, Jordan Peele’s simulated Obama PSA is a double-edged warning against fake news, Vox, 18 באפריל 2018 (באנגלית)
- ↑ אובמה קילל את טראמפ? ג'ורדן פיל מדגים כיצד מייצרים פייק ניוז, באתר כלכליסט, 18 באפריל 2018
- 1 2 נירית אנדרמן, זהירות, מתחזה דיגיטלי: האם טכנולוגיית "דיפ פייק" תשפיע על הבחירות בישראל, באתר הארץ, 25 בפברואר 2019
- 1 2 עידן בן טובים, מפתח ישראלי יצר ”פייק ביבי”, וזה מרשים ומדאיג באותה מידה, גיקטיים, 19 במרץ 2019
- ↑ Oscar Schwartz, You thought fake news was bad? Deep fakes are where truth goes to die, The Guardian, 12 בנובמבר 2018 (באנגלית)
- ↑ David Axton, Truepic VS Deepfake; a War Against Fake News, TechNadu, 21 ביוני 2018 (באנגלית)
- 1 2 James Vincent, Deepfake detection algorithms will never be enough, The Verge, 27 ביוני 2019 (באנגלית)
- ↑ רפאל קאהאן, פיתוח מגניב: בינה מלאכותית שהופכת אתכם לרקדנים מושלמים, באתר כלכליסט, 27 באוגוסט 2018
- ↑ Peter Farquhar, An AI program will soon be here to help your deepfake dancing - just don't call it deepfake, Business Insider, 27 באוגוסט 2018 (באנגלית)
- ↑ DeepFaceLab, GitHub, יוני 2019 (באנגלית)
- ↑ faceswap, GitHub, יולי 2019 (באנגלית)
- ↑ MyFakeApp, Bitbucket, פברואר 2018 (באנגלית)
- 1 2 3
- ↑ TechTalksTV, Deep Voice: Real-time Neural Text-to-Speech, vimeo, 31 באוקטובר 2017 (באנגלית)
- ↑ הכותב=Jesse Damiani A Voice Deepfake Was Used To Scam A CEO Out Of $243,000, Forbes, 3 בספטמבר 2019 (באנגלית)

רישיון cc-by-sa 3.0