您的位置:首頁(yè) > 資訊 >

他做了一個(gè)「ChatGPT 殺手」,a16z 搶著投

比「GPT 偵探」更重要的是,AI 生成內(nèi)容在不同行業(yè)的「容忍度」。

最近兩個(gè)月,科技圈最熱的話題,無(wú)疑是 OpenAI 推出的對(duì)話式 AI 應(yīng)用 ChatGPT,不僅可以讓它給你寫(xiě)一首詩(shī)、回答你的任何問(wèn)題,甚至可以讓它幫忙寫(xiě)沒(méi)那么復(fù)雜的代碼。業(yè)內(nèi)甚至認(rèn)為,ChatGPT 甚至有取代谷歌的潛力。

為 ChatGPT 歡呼的還有另一群人,就是「社畜」和學(xué)生 —— 他們發(fā)現(xiàn)月度總結(jié)、學(xué)校論文和作業(yè)這樣的任務(wù),也可以讓 ChatGPT 代勞了,后者甚至寫(xiě)得有模有樣,不比真人寫(xiě)得差多少。


【資料圖】

ChatGPT 似乎讓學(xué)生們的日子更輕松了,但卻讓教師更「頭疼」了,因?yàn)楹笳吆茈y確認(rèn),眼前這些文字,到底是學(xué)生寫(xiě)的,還是出自 OpenAI 的產(chǎn)品之手。為此,紐約教育部甚至禁止公立學(xué)校使用 ChatGPT。

在這樣的混亂中,一位普林斯頓大學(xué)的學(xué)生,Edward Tian 推出了一個(gè)專殺 ChatGPT 的應(yīng)用 ——「GPTZero」,有了這面「照妖鏡」,內(nèi)容是人寫(xiě)的,還是機(jī)器寫(xiě)的,真相馬上就揭曉。

「GPTZero」在網(wǎng)絡(luò)迅速爆紅,吸引了 a16z 在內(nèi)的硅谷創(chuàng)投的目光。但是應(yīng)用創(chuàng)造者本人 Tian 卻認(rèn)為,最重要的事,是「讓 AI 更加透明」。

01、「ChatGPT 殺手」

在 ChatGPT 成為學(xué)生們「偷懶」的神器后,教育和科研機(jī)構(gòu)不得不開(kāi)始抵制這個(gè)新的噩夢(mèng)。

紐約教育部宣布禁止學(xué)生在公立學(xué)校使用 ChatGPT ;全球知名機(jī)器學(xué)習(xí)會(huì)議之一的 ICML 也宣布禁止發(fā)表包含由 ChatGPT 和其他類似系統(tǒng)生成內(nèi)容的論文,以免出現(xiàn)「意外后果」。

出于對(duì)學(xué)術(shù)界,使用 ChatGPT 相關(guān)道德問(wèn)題的擔(dān)憂,華人小哥 Edward Tian 在一家當(dāng)?shù)氐目Х鹊昀铮艘粋€(gè)寒假的時(shí)間,研發(fā)了 GPTZero,希望能讓學(xué)術(shù)界恢復(fù)嚴(yán)謹(jǐn)性。

Tian 年僅 22 歲,目前仍是美國(guó)普林斯頓大學(xué)的大四學(xué)生,主修計(jì)算機(jī)科學(xué)專業(yè),專門(mén)研究自然語(yǔ)言處理,同時(shí)輔修認(rèn)知科學(xué)和新聞學(xué)。

GPTZero 的開(kāi)發(fā)者 Edward Tian|網(wǎng)絡(luò)

他還曾是英國(guó)廣播公司和開(kāi)源情報(bào)網(wǎng)站 Bellingcat 的研究員,也曾是被微軟收購(gòu)的反恐初創(chuàng)公司 Miburo Solutions 的分析師。在那里,他監(jiān)測(cè)虛假信息和機(jī)器人檢測(cè)。Tian 說(shuō),「所有的這些經(jīng)歷,都是他研發(fā) GPTZero 的動(dòng)力」。

2023 年 1 月 2 日,Tian 將 GPTZero 發(fā)布到網(wǎng)絡(luò),預(yù)計(jì)只會(huì)有幾十個(gè)人嘗試它,完全沒(méi)有想過(guò),這會(huì)掀起一場(chǎng)世界級(jí)別的軒然大波。

在他把這款軟件上傳到互聯(lián)網(wǎng)上的幾個(gè)小時(shí)內(nèi),竟有超過(guò) 2000 人在 Steamlit 上測(cè)試了 GPTZero 的公開(kāi)版本。

1 月 5 日,也就是發(fā)布的第三天,Tian 對(duì) GPTZero 做出了更新和改善,還顯著降低了誤報(bào)率;此時(shí),新程序已有超過(guò) 1 萬(wàn)的用戶量了!Tian 也不禁對(duì)它的「爆炸性增長(zhǎng)」和「病毒式傳播」感到震驚。

據(jù) NPR 報(bào)道,一周內(nèi)有 3 萬(wàn)多人試用了 GPTZero,甚至「導(dǎo)致該應(yīng)用由于出乎意料的高網(wǎng)絡(luò)流量」而崩潰,托管 GPTZero 的免費(fèi)平臺(tái) Streamlit 此后介入,以更多的內(nèi)存和資源支持 Tian,以處理網(wǎng)絡(luò)流量。

Edward Tian 通過(guò)在視頻中展示其對(duì)一篇《紐約客》文章和 LinkedIn 上的 ChatGPT 生成器的帖子的分析,展示了該應(yīng)用如何區(qū)分人類和人工智能撰寫(xiě)的文本。

GPT Zero 的工作原理就是檢測(cè)文本的「困惑性」(Perplexity)和「突發(fā)性」(Burstiness)這兩項(xiàng)指標(biāo),并分別對(duì)其打分,根據(jù)統(tǒng)計(jì)學(xué)特征來(lái)確定,文本是由人工智能寫(xiě)的還是人類寫(xiě)的。總體來(lái)說(shuō),如果這兩項(xiàng)參數(shù)得分都很低,那么該文本很有可能出自 AI 之手。

這里所說(shuō)的「困惑性」,是指來(lái)自人類所寫(xiě)作品的語(yǔ)言的復(fù)雜性和隨機(jī)性。

這個(gè)指標(biāo)主要是衡量文本在一個(gè)句子中的隨機(jī)程度,以及一個(gè)句子的構(gòu)造方式是否會(huì)讓 GPTZero 感到困惑。

每當(dāng)用戶在 GPTZero 輸入一段測(cè)試內(nèi)容,它就會(huì)分別計(jì)算出:「文字總困惑度」、「所有句子的平均困惑度」、「每個(gè)句子的困惑度」。

這些數(shù)值越低,越能說(shuō)明這個(gè)文本對(duì) GPTZero 來(lái)說(shuō)是非?!甘煜ぁ沟?,那么它很可能是 AI 生成的;相反,如果這些數(shù)值越高,就越能說(shuō)明文本中句子的構(gòu)造或用詞方式讓 GPTZero 感到「驚訝」,那么它就更可能是出自人類之手。

這是因?yàn)椋斯ぶ悄芙邮苓^(guò)數(shù)據(jù)庫(kù)的訓(xùn)練,生成的文本在一段時(shí)間內(nèi),表現(xiàn)出的困惑度會(huì)更均勻和恒定,選詞的可預(yù)測(cè)性也更高;而人類書(shū)寫(xiě)的文本則不會(huì)這樣,真人的遣詞造句一般會(huì)比較隨機(jī),比機(jī)器更容易寫(xiě)比較出乎意料的詞句。

使用 GPTZero 檢測(cè)文字是否由 ChatGPT 生成|Twitter

而「突發(fā)性」,則是指來(lái)自人類使用的句子結(jié)構(gòu)的變化。

這個(gè)參數(shù)主要是比較句子復(fù)雜性的變化程度,衡量它們的一致性。

這是因?yàn)?,人類傾向于寫(xiě)高度復(fù)雜的文本;而人工智能產(chǎn)出的文本則是低復(fù)雜度的;此外,由于人類的思維結(jié)構(gòu)不是線性的,他們的句子結(jié)構(gòu)也遵循類似的模式。

這意味著,人類使用句子結(jié)構(gòu),會(huì)在長(zhǎng)而復(fù)雜的句子,和短而簡(jiǎn)單的句子之間搖擺不定,有著更多的句式變化,比如復(fù)雜和簡(jiǎn)單交替并存,一個(gè)長(zhǎng)難句之后接著出現(xiàn)更簡(jiǎn)短的句子;而機(jī)器生成的句子則傾向于更加統(tǒng)一,很少會(huì)有一系列長(zhǎng)度相差很大的句子。

簡(jiǎn)而言之,在選詞上「簡(jiǎn)單」而「熟悉」,并使用「統(tǒng)一整齊」的句子,是人工智能生成作品的標(biāo)志特征,而更復(fù)雜和多樣的東西,則表明是人類寫(xiě)的。這也是「困惑性」和「突發(fā)性」這兩項(xiàng)指標(biāo)可以作為衡量標(biāo)準(zhǔn)的原因。

除了 Edward Tian 本人對(duì) GPTZero 進(jìn)行測(cè)試之外,也有不少網(wǎng)友用它對(duì) ChatGPT、一些 GPT-3 衍生工具生成的內(nèi)容進(jìn)行了多次測(cè)試。最終結(jié)果顯示,GPTZero 每次都能抓住 AI 生成的文本,并在十多個(gè)案例中正確識(shí)別了人類寫(xiě)的文本。

GPTZero 的一炮而紅,讓 Tian 獲得了來(lái)自 a16z、 Menlo Ventures 和 Red Swan 等知名風(fēng)投的青睞。不過(guò),面對(duì)推特私信和電話轟炸,Tian 卻顯得異常冷靜,他謙遜地表示自己不會(huì)拒接投資者打來(lái)的電話,但他不會(huì)忘記自己仍然是一位即將畢業(yè)的大四學(xué)生。

同時(shí),他還表示自己的 GPTZero 尚未完成,仍需改進(jìn)和進(jìn)一步地開(kāi)發(fā),甚至計(jì)劃讓大家繼續(xù)免費(fèi)使用他的程序,用來(lái)支持各地新晉英文老師的工作。

02、急需的「AI 透明」

對(duì)于 GPTZero 這一甄別文字是否是 AI 寫(xiě)作的新程序,推特上的輿論褒貶不一,以教師為代表的成年人大多喜聞樂(lè)見(jiàn),而學(xué)生卻諷刺 GPTZero 的創(chuàng)造者 Tian 是「學(xué)術(shù)緝毒警察」。

的確,當(dāng) GPTZero 推出時(shí),Tian 收到了眾多教師對(duì)該應(yīng)用程序在檢測(cè) AI 寫(xiě)的文章方面的積極反饋,來(lái)自世界各地的無(wú)數(shù)教師也都對(duì) Tian 表達(dá)了他們的感激之情 —— 這讓他們的教學(xué)難度大大減輕了。

當(dāng)然,也不難理解,不少學(xué)生并不看好 Tian 這款打擊學(xué)術(shù)偷工減料、不勞而獲的軟件。

事實(shí)上,不只是 Tian,就連 ChatGPT 的開(kāi)發(fā)商 OpenAI 自己,也已經(jīng)表明了對(duì)防止人工智能剽竊的承諾。

2022 年 12 月,OpenAI 專注于人工智能安全的研究員 Scott Aaronson 透露,該公司正在努力開(kāi)發(fā)「緩解措施」,用一種「不易察覺(jué)的秘密信號(hào)」對(duì) GPT 生成的文本打上「水印」,以識(shí)別其來(lái)源,從而打擊作弊的系統(tǒng)。

這項(xiàng)技術(shù)將通過(guò)微妙地調(diào)整 ChatGPT 選擇的特定單詞選擇來(lái)發(fā)揮作用,讀者不會(huì)注意到這種方式,但對(duì)于任何尋找機(jī)器生成文本跡象的人來(lái)說(shuō),這在統(tǒng)計(jì)上都是可預(yù)測(cè)的。

公司發(fā)言人表示,「我們將 ChatGPT 作為新研究的預(yù)覽技術(shù),希望能從現(xiàn)實(shí)世界的應(yīng)用中進(jìn)行學(xué)習(xí)。我們認(rèn)為這是開(kāi)發(fā)和部署功能強(qiáng)大、安全的 AI 系統(tǒng)的關(guān)鍵部分。我們會(huì)不斷吸取反饋和經(jīng)驗(yàn)教訓(xùn),」。

GPTZero 首頁(yè)|GPTZero

此外,OpenAI 還聯(lián)合哈佛等高校機(jī)構(gòu)聯(lián)合打造了一款檢測(cè)器:GPT-2 Output Detector

作者們先是發(fā)布了一個(gè)「GPT-2 生成內(nèi)容」和 WebText 數(shù)據(jù)集,幫助 AI 理解機(jī)器語(yǔ)言和人類語(yǔ)言之間的差異。

隨后,用這個(gè)數(shù)據(jù)集對(duì) RoBERTa 模型進(jìn)行微調(diào),就得到了這個(gè) AI 檢測(cè)器。其中人類語(yǔ)言一律被識(shí)別為 True,AI 生成的內(nèi)容則一律被識(shí)別為 Fake。

值得一提的是,RoBERTa 是 BERT 的改進(jìn)版。原始的 BERT 使用了 13GB 大小的數(shù)據(jù)集,但 RoBERTa 使用了包含 6300 萬(wàn)條英文新聞的 160GB 數(shù)據(jù)集。

盡管如此,還是有不少人認(rèn)為,「AI 文本檢測(cè)器」注定是一場(chǎng)失敗的「軍備競(jìng)賽」,其實(shí)際效果并不理想,更無(wú)法阻擋 ChatGPT 等 AI 語(yǔ)言模型的發(fā)展。

然而,盡管 Tian 建立了 GPTZero,他并不反對(duì)使用 ChatGPT 等人工智能工具,他認(rèn)為 GPTZero 應(yīng)用程序的目的不是阻止這些新技術(shù)的使用,而是提供一種負(fù)責(zé)任地使用這些技術(shù)的方法,并提供必要的保護(hù)。

同時(shí),相對(duì)于對(duì)抗或者禁止一項(xiàng)技術(shù),也許更重要的是如何為其使用定下規(guī)范和標(biāo)準(zhǔn)。例如,在廣告、影視及娛樂(lè)等行業(yè),對(duì)于 AI 生成類內(nèi)容的容忍度可能適當(dāng)提高一些;而在學(xué)術(shù)、教育和科研領(lǐng)域,非常強(qiáng)調(diào)準(zhǔn)確性和原創(chuàng)性,毫無(wú)疑問(wèn),對(duì)于 AI 生成內(nèi)容的容忍度就要低一些。

而如何確定 AI 工具使用的「透明度」,可能要比研究如何「反 AI」,要更有效,也更有意義一些。

本文來(lái)自微信公眾號(hào):極客公園 (ID:geekpark),作者:美漪

標(biāo)簽: ChatGPT

相關(guān)閱讀