您的位置:首頁(yè) > 資訊 >

世界通訊!翻車(chē)的不止谷歌?微軟必應(yīng)聊天演示被指存在事實(shí)性錯(cuò)誤

北京時(shí)間 2 月 15 日上午消息,據(jù)報(bào)道,谷歌聊天機(jī)器人演示活動(dòng)現(xiàn)場(chǎng)翻車(chē)導(dǎo)致其股價(jià)當(dāng)天暴跌逾 7%,但微軟的演示活動(dòng)同樣出現(xiàn)了事實(shí)性錯(cuò)誤。

上周的科技圈掀起了一個(gè)聊天機(jī)器人的小高潮,微軟和谷歌都試圖通過(guò)展示早起版本的 AI 搜索來(lái)先發(fā)制人。微軟更是宣布,該公司的 AI 搜索僅用 48 小時(shí)就吸引 100 多萬(wàn)人注冊(cè)。

這種技術(shù)可以針對(duì)用戶(hù)的問(wèn)題直接給出答案,看起來(lái)就像是真人創(chuàng)作的一樣。微軟 CEO 薩提亞?納德拉(Satya Nadella)表示,該技術(shù)“或許會(huì)掀起知識(shí)工作的工業(yè)革命”。


(資料圖片)

但對(duì)于擔(dān)心準(zhǔn)確性的人來(lái)說(shuō),人工智能還有許多不足之處

在微軟進(jìn)行演示時(shí),這項(xiàng)嵌入在必應(yīng)搜索中的類(lèi) ChatGPT 技術(shù)分析了 Gap 和 Lululemon 的財(cái)報(bào)。但業(yè)內(nèi)人士將其給出的答案與財(cái)報(bào)原文對(duì)比后卻發(fā)現(xiàn),這款聊天機(jī)器人遺漏了一些數(shù)據(jù),甚至?xí)抛恍﹥?nèi)容。

“必應(yīng) AI 在演示過(guò)程中給出了一些完全錯(cuò)誤的答案,但卻沒(méi)人注意到?!豹?dú)立搜索引擎研究員德米特里?布里爾頓(Dmitri Brereton)寫(xiě)道,“相反,大家都對(duì)必應(yīng)的宣傳歡欣鼓舞?!?/p>

布里爾頓發(fā)現(xiàn),除了財(cái)務(wù)數(shù)據(jù)上的錯(cuò)誤外,微軟在演示中針對(duì)吸塵器規(guī)格和墨西哥旅行計(jì)劃的回答可能存在事實(shí)性錯(cuò)誤。布里爾頓最初并不是為了給微軟“挑刺”,他只是在細(xì)致對(duì)比微軟和谷歌的答案時(shí)意外發(fā)現(xiàn)了這些問(wèn)題。

人工智能專(zhuān)家稱(chēng)這一現(xiàn)象為“幻覺(jué)”,也就是說(shuō),基于大語(yǔ)言模型生成的工具有杜撰內(nèi)容的傾向。上周,谷歌推出了一款與之競(jìng)爭(zhēng)的人工智能工具,演示過(guò)程中同樣存在事實(shí)性錯(cuò)誤 —— 但當(dāng)時(shí)的錯(cuò)誤很快就被人發(fā)現(xiàn)。

這兩家公司都在加緊將新型生成式人工智能整合進(jìn)搜索引擎,希望在 ChatGPT 引爆行業(yè)熱潮后向世人展示自己在這方面的優(yōu)勢(shì)。ChatGPT 是去年 11 月由創(chuàng)業(yè)公司 OpenAI 推出的,他們已經(jīng)通過(guò)微軟融資百億美元,與之競(jìng)爭(zhēng)的 Stability AI 和 Hugging Face 等創(chuàng)業(yè)公司也在融資中獲得了數(shù)十億美元的估值。

谷歌與微軟對(duì)待這項(xiàng)技術(shù)的態(tài)度差異明顯:由于擔(dān)心聲譽(yù)風(fēng)險(xiǎn)和安全問(wèn)題,谷歌遲遲不愿將 AIGC(人工智能生成內(nèi)容)技術(shù)整合進(jìn)搜索引擎,而微軟卻在上周強(qiáng)調(diào),有可能在短期內(nèi)向部分公眾開(kāi)放這項(xiàng)技術(shù)

“我認(rèn)為不能讓這項(xiàng)技術(shù)躺在實(shí)驗(yàn)室里,”納德拉說(shuō),“應(yīng)該安全地推廣出去?!?/p>

但在必應(yīng) AI 的演示過(guò)程中,的確在公司財(cái)報(bào)數(shù)據(jù)上出現(xiàn)了一些問(wèn)題。

微軟營(yíng)銷(xiāo)高管約瑟夫?梅赫蒂(Yusuf Mehdi)在演示過(guò)程中訪(fǎng)問(wèn)了 Gap 的投資者關(guān)系網(wǎng)站,然后讓必應(yīng) AI 根據(jù)這家零售商 11 月發(fā)布的第三季財(cái)報(bào)總結(jié)出“要點(diǎn)”。

“很酷,節(jié)約了大量時(shí)間?!泵泛盏僬f(shuō)。

下面是微軟演示過(guò)程的屏幕截圖:

以下是這份總結(jié)中存在的錯(cuò)誤:

-Gap 報(bào)告的毛利率為 37.4%。但在去除與 Yeezy 有關(guān)的費(fèi)用后,調(diào)整后毛利率為 38.7%。

-Gap 的運(yùn)營(yíng)利潤(rùn)率為 4.6%,而非 5.9%。5.9% 這個(gè)數(shù)據(jù)在該公司的財(cái)報(bào)中根本沒(méi)有出現(xiàn)。

-調(diào)整后攤薄每股收益為 0.71 美元,而非 0.42 美元,后者同樣在財(cái)報(bào)中無(wú)法找到。Gap 的財(cái)報(bào)包含一個(gè)調(diào)整后所得稅收益,約為 0.33 美元。

-Gap 去年 8 月下調(diào)了全年預(yù)期,并在第三季度財(cái)報(bào)中表示,“第四季度銷(xiāo)售額可能同比下滑個(gè)位數(shù)左右”。由此看來(lái),全年?duì)I收應(yīng)該下滑,而非“較低的兩位數(shù)增長(zhǎng)”。并沒(méi)有營(yíng)業(yè)利潤(rùn)率或每股收益預(yù)期。

Gap2022 財(cái)年第三季度財(cái)報(bào)

微軟表示,該公司知道這些錯(cuò)誤,他們也預(yù)計(jì)必應(yīng) AI 會(huì)犯一些錯(cuò)誤。

“我們知道這份報(bào)告,并且已經(jīng)通過(guò)分析這一問(wèn)題來(lái)改善體驗(yàn)?!蔽④洶l(fā)言人說(shuō),“我們承認(rèn)仍然有一些工作要做,并且預(yù)計(jì)到該系統(tǒng)可能會(huì)在預(yù)覽期間犯一些錯(cuò)誤,正因如此,反饋才至關(guān)重要,這可以幫助我們學(xué)習(xí)和改進(jìn)模型?!?/p>

微軟隨后讓必應(yīng) AI 對(duì)比了 Gap 和 Lululemon 的財(cái)報(bào)。梅赫蒂希望必應(yīng)能將兩份財(cái)報(bào)的數(shù)據(jù)提取出來(lái),制作成一份表格。

“看看效果多么驚人?!彼f(shuō),“就像這樣,一張表格,這個(gè)問(wèn)題的答案有了。可以想象一下,用其他方法需要花多長(zhǎng)時(shí)間?!?/p>

下面是必應(yīng) AI 的結(jié)果:

下面是表格中出現(xiàn)的幾項(xiàng)錯(cuò)誤,從利潤(rùn)率開(kāi)始:

-Lululemon 的毛利率是 55.9%,不是 58.7%。

-該公司的運(yùn)營(yíng)利潤(rùn)率是 19%,不是 20.7%

-Lululemon 的攤薄每股收益為 2 美元,調(diào)整后每股收益為 1.62 美元,必應(yīng)顯示的攤薄每股收益為 1.65 美元。

-Gap 現(xiàn)金及現(xiàn)金等價(jià)物為 6790 萬(wàn)美元,不是 14 億美元。

-Gap 庫(kù)存為 30.4 億美元,不是 19 億美元。

標(biāo)簽: ChatGPT

相關(guān)閱讀