“自研+開源”雙引擎降低AIGC使用門檻商湯秒畫瞄準B端用戶|天天新視野

2023-04-28 20:39:48|

來源：每日經(jīng)濟新聞作者：

在此前的商湯技術(shù)交流日上，商湯公布了前沿的人工智能“日日新SenseNova”大模型體系，基于該體系的AI內(nèi)容創(chuàng)作社區(qū)平臺“商湯秒畫SenseMirage”也一并亮相。

(相關(guān)資料圖)

值得注意的是，對于有進階需求的模型創(chuàng)作者，秒畫平臺也可支持自行上傳數(shù)據(jù)集進行finetune、自訓練等功能，定制訓練屬于自己風格的LoRA模型。基于現(xiàn)有商湯自研的文生圖模型的高度泛化性，B端用戶只需要拖拽20張左右的圖片作為訓練集，最少僅需5分鐘就能完成一個高質(zhì)量模型的訓練，顯著降低模型的訓練門檻。

商湯集團智慧決策與游戲事業(yè)部總經(jīng)理兼高級研究總監(jiān)劉宇介紹，商湯的平臺想做的是集模型、訓練、推理和交流的一體化社區(qū)，相比于目前市面上直接去做純文字到圖像生成的產(chǎn)品，在目標和方向上有較大差別。

“自研+開源”共筑秒畫差異化優(yōu)勢

“我們的核心競爭力應(yīng)該在于我們打包了商湯自研的大模型、模型訓練跟推理的加速，以及我們整個底層的專利，對于用戶來說，使用、體驗的友好度都較好?！?/p>

在此前的商湯技術(shù)交流日上，商湯公布了前沿的人工智能研發(fā)成果“日日新SenseNova”大模型體系，以及基于該模型體系的多款AI應(yīng)用產(chǎn)品。

商湯科技董事長兼CEO徐立在現(xiàn)場演示了“商湯秒畫SenseMirage”基于商湯自研AIGC模型的作畫能力，也介紹了秒畫平臺基于商湯大裝置的GPU算力支撐，可幫助用戶免除本地化部署流程，既能使用商湯自研作畫模型高效地生成高質(zhì)量內(nèi)容，也可以將本地模型及其他第三方開源模型一鍵導入，生成更多樣的內(nèi)容。

同時，在市場AIGC產(chǎn)品普遍主打的文生圖能力之外，秒畫主要瞄準B端用戶，提供特異性推理優(yōu)化服務(wù)，用戶將開源模型導入后會自動采用秒畫底層的模型編譯技術(shù)進行加速，實測在本地RTX3070顯卡需要10秒生成的圖片通過秒畫加速技術(shù)只需要2秒的推理時間就可以生成。

此外，秒畫還支持用戶上傳本地圖像，結(jié)合商湯自研作畫模型或者開源模型來訓練定制化LoRA模型，高效地生成個性化內(nèi)容。

商湯集團智慧決策與游戲事業(yè)部總經(jīng)理兼高級研究總監(jiān)劉宇表示，除了商湯自研的文生圖能力，秒畫平臺還支持導入第三方的模型，并且能提供特異性加速功能，這也展示了商湯對于開源模型的加速能力。

通過“自研+開源”的模式，商湯的秒畫平臺將徹底區(qū)別于市面上現(xiàn)有的文生圖產(chǎn)品，拓展用戶服務(wù)的邊界。基于秒畫，用戶在簡單的文生圖功能之外，也能夠基于商湯的基模型，更低門檻地對自有小模型進行訓練、加速。

劉宇也表示，首先從產(chǎn)品層面來講，秒畫與市面上其他產(chǎn)品相比，AI繪圖只是其功能之一，“我們想做的事可能跟他們不太一樣，我們并不是想做一個輸入一句話，就能生成一張圖的功能。因為這種功能的商業(yè)價值并不是非常的大和完備，我們想做的是一個平臺。”

從平臺角度看，劉宇認為，秒畫具有三大核心能力。首先是來自商湯本身的自研大模型，除了文生圖能力之外，商湯更希望幫助用戶能夠基于商湯本身強大的平臺算力及大模型能力，去微調(diào)用戶自己的大模型，“從長期的商業(yè)價值上看，我們更想去給小B或者大B端客戶提供更強的基模型，使得他們能夠在自有領(lǐng)域基于商湯的基礎(chǔ)模型產(chǎn)生更好的垂類大模型，去產(chǎn)生他們的商業(yè)價值?！?/p>

秒畫的另一個優(yōu)勢則來自商湯自身強大的算力能力。劉宇介紹，基于商湯本身的算力能力，秒畫作為一個平臺，用戶能夠選擇使用商湯的模型、自訓練的模型，或開源模型，同時，秒畫將為用戶提供模型特異性加速服務(wù)，通過秒畫平臺的模型編譯技術(shù)，自動分析用戶上傳的模型結(jié)構(gòu)參數(shù)，把它和底層的GPU加速算子進行模型編譯，縮短模型的生成速度?！斑@是我們平臺的第二大優(yōu)勢，也是商湯的傳統(tǒng)優(yōu)勢，我們在大模型到小模型的推力加速方面有非常深厚的技術(shù)積累?！眲⒂畋硎?。

另外，商湯希望基于開源功能打造模型社區(qū)。“開源界現(xiàn)在有很多的討論，像AI作畫的模型，很多都是基于之前的模型去微調(diào)出來的?！眲⒂罱榻B，商湯想整合、健全目前相對復雜的AI作畫社區(qū)，未來基于秒畫平臺，用戶可以利用商湯的基模型或基于其他前置模型訓練自有模型，平臺內(nèi)部都會保留模型的依賴鏈條，進而保障原始模型作者的權(quán)益。

大模型+大算力超前布局

各家對于AIGC的競逐趨于白熱化，商湯的壁壘來自哪里？

劉宇認為，大模型要足夠好有三個核心要素，首先是模型參數(shù)量要夠大能保證泛化上限足夠高，二是在同等參數(shù)量下，網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計要足夠高效。“怎么保證在同等大的體量下，我們的模型能夠比其他的大模型性能要強，這需要我們在大模型神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計上做很多的工作?！?/p>

第三，大模型的訓練穩(wěn)定性需要被保障，劉宇介紹，“特別大的模型在優(yōu)化上有一個非常嚴重的問題，當這個模型特別大，訓練一個任務(wù)所需要的GPU就會非常多（上千張的時候），訓練的穩(wěn)定性就會變差，具體體現(xiàn)在大模型的收斂性、模型+數(shù)據(jù)3D并行的系統(tǒng)效率和千卡通信的穩(wěn)定性上。”而商湯已經(jīng)在大模型方面有非常多的技術(shù)積累，使得包括秒畫在內(nèi)的AIGC大模型，能夠在一個很長的周期內(nèi)，保持平穩(wěn)訓練狀態(tài)，進而保證模型訓練的效率。

算法、算力、數(shù)據(jù)，如今已經(jīng)成為人工智能領(lǐng)域的寶藏，而商湯的布局則更加前瞻。這也是商湯如今在大模型領(lǐng)域快速建立差異化優(yōu)勢的核心原因。

在算力層面，2018年開始，商湯在自建算力中心的基礎(chǔ)上，打造了SenseCore商湯AI大裝置的“原型機”，開始攻克算力難題。到2020年，商湯再度斥資56億元，在上海臨港建設(shè)AIDC人工智能計算中心。2022年1月，AIDC正式開始運營。

目前，商湯SenseCore AI大裝置持續(xù)擴建，完成了2.7萬塊GPU的部署并實現(xiàn)了5.0 exaFLOPS的算力輸出能力，以AI-as-a Service（AIaaS）的模式面向行業(yè)伙伴提供服務(wù)。目前最多可支持20個千億參數(shù)量大模型（以千卡并行）同時訓練，最高可支持萬億參數(shù)超大模型的訓練。

基于商湯自研的AI大裝置，在大模型站上風口之前，商湯對于大模型的推理部署、增量訓練已經(jīng)是其常規(guī)業(yè)務(wù)。目前，商湯大模型的推理部署可以將推理的效率提升100%以上；基于大裝置，商湯將大模型微調(diào)的成本降低至原來的1/10。

未來，大裝置有望成為人工智能大模型時代的重要基礎(chǔ)設(shè)施。扎根“大模型+大裝置”的技術(shù)路徑，商湯在這一輪AIGC機遇來臨時，也更加得心應(yīng)手。

顯著降低B端使用門檻

商湯正在加速向其“賦能百業(yè)”的愿景靠近，AIGC時代，包括秒畫在內(nèi)的系列平臺，將成為其中的重要一環(huán)。

劉宇認為，秒畫是一個更快且效果更好的基模型，同時商湯更進一步，為B端用戶提供SaaS和API的推理服務(wù)。“基于秒畫平臺的推理、特異性加速模型編譯技術(shù)和商湯大算力的基礎(chǔ)設(shè)施，服務(wù)下游的客戶，把我們的推理能力和模型能力用在它的垂類里面，這是我們的一個愿景。”劉宇表示。

從秒畫目前建立的差異化優(yōu)勢來看，秒畫對于B端用戶而言，將是一個更加“友好”的AIGC平臺，這也意味著商湯面臨的商業(yè)化前景將更加明朗。

在企業(yè)數(shù)字化轉(zhuǎn)型的過程中，中小企業(yè)面臨的數(shù)字化門檻成為其轉(zhuǎn)型的阻礙之一。劉宇認為，商湯提供的秒畫等平臺，核心目的就是為了降低AIGC和大模型的微調(diào)訓練門檻，讓技術(shù)能夠在不具有這么多GPU或者甚至不具有這類專業(yè)知識的中小B端的廠商、用戶里產(chǎn)生價值。

劉宇介紹，去年商湯在AIGC層面已經(jīng)有非常多的B端用戶，“當時更多的是他們給需求，我們給他定制化，用商湯的技術(shù)能力和集成訓練模型交付給他們，這也是AI平臺型行業(yè)的傳統(tǒng)做法。”劉宇表示，“現(xiàn)在商湯希望能夠通過秒畫這樣的平臺，讓用戶自身可以以更低的門檻，不需要采購GPU、不需要技術(shù)的理解和能力，僅僅通過一個網(wǎng)站的UI就可以生產(chǎn)自己的模型做推理部署。”

成本層面，劉宇算了一筆賬，用最小的訓練大模型的硬件加上研究員的人力成本來計算，“基于生成質(zhì)量相對較差的開源大模型，然后招一個研究員，買上幾臺服務(wù)器把它訓練成企業(yè)自己的模型，至少應(yīng)該百萬以上的成本。但是如果利用商湯的平臺，在數(shù)據(jù)一致的情況下，可能就只需要付出幾千甚至幾百元的成本，就可以得到一個相同甚至更好的模型?！?/p>

劉宇認為，商湯的產(chǎn)品從使用門檻和資金成本門檻上，都對B端用戶有了一個非常大的體驗上的飛躍。

浙商證券認為，以“秒畫”為例，產(chǎn)品實現(xiàn)了2秒出圖，不需要額外編程和調(diào)試，用戶可自定義生成圖片的數(shù)量、分辨率、長寬比等，生成效果優(yōu)越，整體體驗可對標Midjourney?！拔覀冋J為，商湯因其發(fā)展歷史和業(yè)務(wù)特點，在CV領(lǐng)域擁有行業(yè)領(lǐng)先地位，是其跨模態(tài)模型三維化表現(xiàn)超預期的核心原因，可將其與文心一言等產(chǎn)品區(qū)別開來?！?/p>

在算力、算法等核心能力層面，商湯優(yōu)勢明顯，對于商湯而言，通過“大模型+大算力”提供解決方案，能夠吸引更多下游用戶投入模型迭代，也有助于商湯進一步積累相關(guān)數(shù)據(jù)，提升產(chǎn)品迭代速率與產(chǎn)品體驗，進而加速商業(yè)化布局，反哺公司業(yè)績。

（文章來源：每日經(jīng)濟新聞）

標簽：