來(lái)源:文匯報(bào) | 劉琦 時(shí)間 : 2025-03-14
分享到:
隨著DeepSeek、ChatGPT等AI大語(yǔ)言模型的飛速進(jìn)化,機(jī)器生成內(nèi)容越來(lái)越“擬人”,“真假美猴王”的經(jīng)典橋段正在人工智能領(lǐng)域上演。日前,西湖大學(xué)教授張?jiān)李I(lǐng)銜的自然語(yǔ)言處理實(shí)驗(yàn)室研發(fā)出一款能夠識(shí)別機(jī)器生成內(nèi)容的AI程序Fast-DetectGPT,能夠以96%的準(zhǔn)確率識(shí)別ChatGPT生成文本,對(duì)DeepSeek生成文本的檢測(cè)準(zhǔn)確率達(dá)89%。
“真假美猴王”上演,誰(shuí)是“如來(lái)”?
2023年12月發(fā)表在國(guó)際期刊上的一項(xiàng)研究,討論了頂級(jí)期刊的語(yǔ)言學(xué)家能夠在多大程度上區(qū)分AI寫(xiě)作和人工寫(xiě)作。72位語(yǔ)言學(xué)家參與了這項(xiàng)調(diào)研,結(jié)果顯示正確率不足40%。
事實(shí)上,機(jī)器生成的文本與人類生成的文本雖然看起來(lái)很像,但在語(yǔ)義、語(yǔ)法、用詞習(xí)慣等細(xì)節(jié)處理上存在許多不同。張?jiān)澜忉專瑱C(jī)器的思考偏向“統(tǒng)計(jì)性”,而人類的思考里除了“統(tǒng)計(jì)性”,還有“因果性”。具體體現(xiàn)在當(dāng)遇到困難,人類會(huì)反思,但這種能力大模型尚不具備。
張?jiān)肋M(jìn)一步解釋,以寫(xiě)文章為例,AI的寫(xiě)法是學(xué)習(xí)現(xiàn)有的數(shù)據(jù),從中挑選最“安全”的詞,也就是按照概率高低來(lái)選詞,這和人類寫(xiě)作的創(chuàng)造性有本質(zhì)區(qū)別。例如在“我吃了一頓××”這個(gè)句式中,機(jī)器往往會(huì)在“吃”這一動(dòng)詞后使用搭配概率較高的“飯”,但人類可能會(huì)說(shuō):“我吃了一頓美味?!?/p>
研究團(tuán)隊(duì)認(rèn)為,人類和機(jī)器在給定上下文的情況下,詞匯選擇存在明顯差異,而機(jī)器與機(jī)器之間的這種差異并不明顯,這就是Fast-DetectGPT的工作原理。
另辟蹊徑,“以子之矛,攻子之盾”
有了原理,那么該如何操作?Fast-DetectGPT研發(fā)者之一、西湖大學(xué)博士生鮑光勝解釋,面對(duì)一句話或者一篇文章,F(xiàn)ast-DetectGPT會(huì)從AI的角度出發(fā)先想想,如果是自己寫(xiě)會(huì)怎么寫(xiě)?然后根據(jù)這個(gè)自問(wèn)自答的參考答案,比對(duì)原文看看重合度有多高,相當(dāng)于“以子之矛,攻子之盾”。
具體而言,當(dāng)Fast-DetectGPT接收到一個(gè)文本片段,首先會(huì)在不改變?cè)獾那闆r下進(jìn)行改寫(xiě),把局部的同義詞替換掉,再將這份替換后的文本與原始文本進(jìn)行對(duì)比。如果原始文本是AI寫(xiě)的,兩者的相似度會(huì)比較高。簡(jiǎn)單來(lái)說(shuō),AI對(duì)AI寫(xiě)的內(nèi)容更熟悉,可以“深入敵后”認(rèn)出同類作品。
據(jù)介紹,出于對(duì)AI安全性和可信賴方面的擔(dān)憂,歐美等國(guó)已有不少用AI檢測(cè)AI的研究,比如普林斯頓大學(xué)學(xué)生開(kāi)發(fā)的GPTZero、斯坦福大學(xué)研究團(tuán)隊(duì)推出的DetectGPT等。此次由西湖大學(xué)研發(fā)的Fast-DetectGPT相較于DetectGPT的檢測(cè)速度提高了340倍,準(zhǔn)確率提升75%。
Fast-DetectGPT不僅對(duì)不同語(yǔ)種和內(nèi)容有良好的適用性,還能識(shí)別AI潤(rùn)色和翻譯的文章。無(wú)論是人寫(xiě)的經(jīng)由AI潤(rùn)色或翻譯的文字,還是AI寫(xiě)的經(jīng)由人潤(rùn)色或翻譯的文字,都逃不過(guò)它的“法眼”。
AI持續(xù)進(jìn)化,矛更利還是盾更堅(jiān)?
盡管當(dāng)前的技術(shù)大幅提高了對(duì)AI生成文本識(shí)別的準(zhǔn)確性,但張?jiān)捞寡?,不久的將?lái),AI可能會(huì)發(fā)展出“反偵察”技術(shù),從而提高內(nèi)容識(shí)別難度,人與機(jī)器之間這種“矛”與“盾”的攻防角色會(huì)不斷互換、演進(jìn)。
另一個(gè)擔(dān)憂在于,當(dāng)人類吸收的語(yǔ)料中越來(lái)越多混入AI生成內(nèi)容,人類寫(xiě)作會(huì)不會(huì)越來(lái)越接近AI?對(duì)此,張?jiān)辣硎?,隨著互聯(lián)網(wǎng)上AI生成內(nèi)容的不斷增加,一批與AI相伴而生的年輕人可能也會(huì)逐步“學(xué)習(xí)”AI的表達(dá)風(fēng)格,但人類的表達(dá)始終具有“因果性”,與AI存在本質(zhì)區(qū)別。而在更遠(yuǎn)的未來(lái),AI可能學(xué)會(huì)像人一樣思考,屆時(shí)識(shí)別難度可能更高。
湖南省作家協(xié)會(huì) | 版權(quán)所有 : 湘ICP備05001310號(hào)
Copyright ? 2005 - 2012 Frguo. All Rights Reserved