AI檢測AI：“矛”更利還是“盾”更堅

【大中小】【打印】

【第1頁第2頁第3頁】

	AI檢測AI：“矛”更利還是“盾”更堅
	http://www.CRNTT.com 2024-08-16 15:03:10

　　AIGC相對套路化的創作，可能會影響人類的用語習慣。“隨著越來越多人用AI創作或潤色文字，人類會受到潛移默化的影響，這或將影響整個社會對語言的使用。”鮑光勝說。

　　三種路徑識別文本

　　如何準確識別AI生成內容？鮑光勝介紹，目前主要有三種技術路徑進行檢測，分別是模型訓練分類器法（也被稱為監督分類器法）、零樣本分類器法、文本水印法。“三種檢測方法本質上都是利用AI檢測AI，且各有優劣。”鮑光勝說。

　　模型訓練分類器法，首先要收集大量人類創作內容與AIGC，然後以此為基礎訓練一個能區分兩類內容的分類器。“這是目前被廣泛使用的一種方法，但缺點較為明顯。”鮑光勝解釋，用於訓練分類器的數據有限，很難覆蓋所有類型和語言的文本。分類器在訓練數據覆蓋的文本領域或語言上檢測準確率較高，反之準確率則較低。而且，模型訓練往往需要較高成本，數據規模越大，訓練成本越高。

　　相比之下，零樣本分類器法不需要對機器進行訓練，也無需收集數據。它利用已訓練好的大模型，抽取語言模型生成文本的特徵，據此來區別人類與機器。“似然函數是零樣本檢測法中比較常用的基準之一，它可以簡單理解為一段文本在某個模型的建模分布中出現的概率。概率是一種特徵，不同的概率體現了人類創作內容與AIGC的差異。”鮑光勝進一步解釋，“零樣本分類通過綜合考慮多種函數特徵來區分人類創作內容與AIGC。”

　　如今，很多大語言模型幾乎覆蓋了互聯網上的全部數據。因此，相比於模型訓練分類器，零樣本分類器在不同領域、不同語言的文本上表現較為一致。

　　不過，零樣本分類器也存在明顯缺點。一方面，現有零樣本分類器依賴生成文本的源語言模型進行檢測，這意味著如果是未知源模型生成的文本，分類器就無法準確檢測。另一方面，為提高檢測準確率，零樣本分類器往往需要多次調用模型，這增加了模型的使用成本和計算時間。

　　“文本水印法則是一類‘主動方法’。區別於前兩類方法，它不是檢測已生成的文本，而是在AI生成文本時加入水印。人類雖然看不出這些水印，但卻能通過技術手段檢測出來。”鮑光勝說，文本水印法的準確率較高，但缺點在於水印可能被人為弱化甚至移除。此外，對於無法訪問模型內部結構的大語言模型，技術人員可能無法在生成內容時成功加入水印。

　【第1頁第2頁第3頁】　

【大中小】【打印】掃描二維碼訪問中評社微信

相關新聞：

新AI算法“望舌診病”成功率達98% (2024-08-16 14:58:57)
防範人工智能風險要有安全閥 (2024-08-15 14:54:29)
未來教育重點：培養學生面對未知的能力 (2024-08-14 18:07:15)
人民網“夢幻靈境”AI展演中心開館 (2024-08-14 11:10:06)
人工智能或加劇社會發展鴻溝 (2024-08-12 13:14:02)
《決定》聚焦服貿創新　港拓AI突圍 (2024-08-11 17:50:34)
網評：善用制度優勢　建構人工智能監管框架 (2024-08-10 18:09:07)
朱立倫晤AIT新處長谷立言　盼深化台美關係 (2024-08-09 16:10:28)
AI交流會　兩岸青少年同台競技 (2024-08-08 16:46:49)