AI-Deepfake合成技術精湛,破解Deepfake的攻防戰宛如貓抓老鼠
TAcc+新創分析師 許雅音
Deepfake開始無處不在,從名人臉部被移花接木到政治人物的冒名頂替,層不出窮。應對Deepfake的解決方案之一,或許就是運用AI本身。
- Deepfake議題不斷發酵,防守方提出深度防禦(DID)強化偽造影像辨識技術 — Deepfake常被用來偽造名人發表不當言論或復仇式色情影片,影響媒體業、操控選舉,例如近期網路發表的「偽阿湯哥」系列影片(參考下圖),令人感到毫無破綻。
TikTok 最近發表一系列「偽湯姆克魯斯」影片,讓人以為這位大明星也玩 TikTok。
根據2021年3月份發表在Arxiv.org的論文顯示,Deepfake的精湛合成技術,有極大的機率能騙過臉部識別API。研究人員選擇對Microsoft和Amazon的臉部識別API進行基準測試,結果發現所有API都容易被Deepfake欺騙。Microsoft Azure認知服務(Azure Cognitive Services)有78%的比例誤以為Deepfake產生的名人臉孔是真的,而Amazon的Rekognition則有68%的比例會發生誤認。
這個現象表示Deepfake將對臉部識別帶來巨大的衝擊,目前大公司和新創公司紛紛提出相應的解決方案,包含Microsoft在Video Authenticator中推出了自己的Deepfake-combing解決方案,這個工具可以分析照片或視頻,詳細的技術內容,是可以在視頻播放時提供每一幀圖片的灰階元素,以提供可信度的評分。另外,還開發了內建在Microsoft Azure中,類似Blockchain的工具,令其產生的內容能夠在線上轉發時,能自帶數位哈希值(Digital Hash)及匹配哈希值的憑證(Certificate),還有另一個檢查用工具,使人們能夠準確地檢測數位哈希值及憑證,以確認該照片或影片是否為真。
另一方面,新創公司看到檢測Deepfake的商機,全球約有100家新創公司投入該領域,其中,特別值得一提的是,愛沙尼亞的Sentinel,是開發基於深度防禦(Defence-in-Depth, DID)的檢測型AI來幫助政府和媒體抵制虛假內容,主要的技術內涵有別於Microsoft僅用檢測圖片的方法,Sentinel採用了4個Deepfake防禦層,包含(1)數位哈希層(Digital hashes, 又稱數位散列);(2)解析原始數據源的機器學習模型;(3) 檢查音訊,尋找是否有合成聲音,及(4)逐幀分析臉部影像,試圖尋找人為操控痕跡的模型。這四層防禦層如同濾網,能層層過濾可疑的資訊,並依權重評估,提升準確性。而以色列的Cyabra則是運用生成對抗網路(GAN)創立了名為FAM(Facial Reenactment Manipulation)的演算法,該算法能夠區分真實照片和偽造照片。目前Cyabra的檢測技術能夠識別91%的偽造影像。
其實用來比對的Deepfake數據量的重要性遠超過任何用來解決Deepfake問題的特定技術;許多小眾平台的數據難以全部納入數據庫,仍是Deepfake檢測有漏網之魚的因素,加上Deepfake能夠不斷優化更新,開發完成的Deepfake檢測器有時反而還作為Deepfake繞過監測的靈感。這也讓Deepfake議題不斷發酵,攻擊方總是比防守方具有優勢,注定是一場貓抓老鼠的遊戲。
參考資料:
- “Study warns deepfakes can fool facial recognition,” Venturebeat, 2021.
- “Discover 5 Top Startups Tackling Deepfakes,” StartUs, 2021.
- “Deepfake Software Startups That are Commercializing the Technology,” HACKERNOON, 2020.
- “Tom Cruise deepfake creator says public shouldn’t be worried about ‘one-click fakes’,” The Verge, 2021.