您的位置:首頁 > 財經(jīng) >

網(wǎng)易數(shù)帆發(fā)布對話式BI產(chǎn)品 試圖抓住垂類大模型的機會

8月10日,網(wǎng)易數(shù)帆發(fā)布了AIGC技術方向的對話式BI(商業(yè)智能)產(chǎn)品有數(shù)ChatBI,相較于目前正在流行的對話式產(chǎn)品,有數(shù)ChatBI主要想強調(diào)的屬性在于“數(shù)據(jù)的可信”。

網(wǎng)易數(shù)帆大數(shù)據(jù)產(chǎn)品線總經(jīng)理余利華表示,數(shù)字化時代,多個經(jīng)營環(huán)節(jié)需要用數(shù)據(jù)支撐決策已經(jīng)成為常態(tài),企業(yè)數(shù)據(jù)分析需求量大幅度上升。

以網(wǎng)易數(shù)帆某客戶為例,其月均數(shù)據(jù)分析需求量超過了200,策劃、運營、用戶體驗、QA等不同崗位都提出了用數(shù)的需求,其中運營相關的臨時或緊急的需求占比很高。但由于數(shù)據(jù)分析流程的專業(yè)性和分析人才的稀缺性,傳統(tǒng)數(shù)據(jù)分析顯得耗時而低效。


【資料圖】

AI產(chǎn)品盡管可以幫助提升效率,其答案的可信度卻很成問題。網(wǎng)易數(shù)帆方面表示,類ChatGPT產(chǎn)品并不能帶來完全準確的回答,主要原因在于兩點,首先,類ChatGPT產(chǎn)品更擅長處理自然語言文本數(shù)據(jù)相關任務,并非專門為數(shù)據(jù)分析而設計;其次,通用大模型可能存在捏造事實,也即“AI幻覺”,在BI領域可能是捏造字段,這在數(shù)據(jù)分析中可能成為致命問題。

于是,在數(shù)據(jù)分析領域?qū)埂癆I幻覺”出現(xiàn)的可能性,成為有數(shù)ChatBI團隊的首要任務之一。

余利華表示,“AI幻覺”的產(chǎn)生是由于訓練數(shù)據(jù)不足、文本與表示之間的編解碼錯誤等因素,于是團隊打造可信的ChatBI需要在需求理解、過程驗證、用戶干預和產(chǎn)品運營四個方面著手。

具體而言,網(wǎng)易數(shù)帆需要借助大模型的語言理解能力,先進行用戶的需求分析,并幫助BI初級使用者通過需求分析內(nèi)容判斷系統(tǒng)的取數(shù)步驟是否正確;過程驗證指的是借助基于大模型的NL2SQL能力實現(xiàn)復核,余利華介紹,為了提升NL2SQL能力,網(wǎng)易數(shù)帆有針對性地定制生成和優(yōu)化了超過30萬不同類型的問法和SQL,目前調(diào)優(yōu)出的NL2SQL領域模型,效果已達到GPT-3.5的水平;用戶干預即將數(shù)據(jù)模型和查詢條件結(jié)構(gòu)化,用戶可切換數(shù)據(jù)模型或者查詢條件;產(chǎn)品運營方面則構(gòu)建了運營反饋機制,用戶可反饋數(shù)據(jù)準確性,管理員通過運營知識庫、標記及優(yōu)化badcase提升數(shù)據(jù)可靠性。

在實際應用中,以大型連鎖超市的銷售部門場景為例,產(chǎn)品人員輸入“我想看今年上半年華北地區(qū)每個月的利潤”,有數(shù)ChatBI可給出相應結(jié)果,并用自然語言描述了查詢的邏輯與步驟。掌握SQL的專業(yè)人員可以點擊“更多”按鈕查看對應的SQL。如果邏輯有誤,例如用戶想看“訂單日期”在上半年的數(shù)據(jù),但是AI篩選的是“發(fā)貨日期”,用戶可點擊“修改查詢條件”進行對校正。

從產(chǎn)品發(fā)展的角度看來,網(wǎng)易數(shù)帆當下對于通用大模型和垂直行業(yè)大模型到底更偏向哪一方?

網(wǎng)易副總裁、網(wǎng)易杭州研究院執(zhí)行院長、網(wǎng)易數(shù)帆總經(jīng)理汪源對界面新聞等媒體表示,“原則上來講,我們現(xiàn)在的實際情況是既做通用的大模型,也做垂直的大模型,這兩者之間是支撐的關系,(但)最終的出口是做垂類的模型,而且是應用在我們所最關注的兩個領域,一個是軟件開發(fā)、一個是數(shù)據(jù)分析?!?/p>

他表示,為了做好垂類模型,團隊本身需要一個“公共底座”,也就是網(wǎng)易“玉言”模型。目前,該模型由網(wǎng)易的核心實驗室和杭研的人工智能團隊兩個團隊為主,后期會加入更多集團其他團隊共同打造網(wǎng)易集團的大模型底座。

(文章來源:界面新聞)

標簽:

相關閱讀