字節(jié)跳動將參與語言生成大模型研發(fā)，原阿里 M6 帶頭人楊紅霞被曝加盟 AI Lab

2023-03-22 12:30:33|

來源：IT之家作者：

IT之家 3 月 22 日消息，阿里 M6 大模型的原帶頭人楊紅霞已于去年 9 月因個人家庭原因從阿里巴巴達摩院智能計算實驗室離職。36 氪從多處獨立信源獲悉，楊紅霞現(xiàn)已加入字節(jié) AI Lab（人工智能實驗室），參與語言生成大模型的研發(fā)。

有知情人士稱，楊紅霞在語言生成大模型團隊中處于領導地位，直接向字節(jié)跳動副總裁楊震原匯報。

據(jù)公開資料，楊紅霞 2007 年本科畢業(yè)于南開大學，后前往美國杜克大學統(tǒng)計科學系攻讀博士學位，師從 David Dunson 教授。博士畢業(yè)后，楊紅霞先入職 IBM 全球研發(fā)中心任 Watson 研究員，之后入職雅虎公司，擔任首席數(shù)據(jù)科學家。

【資料圖】

據(jù)IT之家所知，她在人工智能領域國際會議、頂級期刊有上百篇頂級論文。2022 年 6 月，楊紅霞入選 2022 福布斯中國科技女性 50 榜。

2016 年，楊紅霞結束了她在美國近 10 年的留學及工作生涯回國，去往杭州加入阿里巴巴集團。而阿里大模型 M6 正是楊紅霞在任期間的最突出成就，在她離職之前一直是阿里達摩院超大規(guī)模多模態(tài)預訓練模型 M6 的技術負責人。

楊紅霞領導的阿里巴巴達摩院 M6 團隊致力于認知智能方向，此前已經研發(fā)出了 AliGraph、M6、洛犀等較為有影響力的人工智能開源平臺和系統(tǒng)，在美國和中國注冊的專利超過 30 項。

M6 是一項通用性 AI 大模型，擁有多模態(tài)、多任務能力，尤其擅長設計、寫作、問答，在電商、制造業(yè)、文學藝術、科學研究等領域都具有廣泛應用前景。

M6 于 2021 年 3 月首次發(fā)布，是國內首個千億參數(shù)多模態(tài)大模型，后續(xù)又通過 480 塊 GPU 更迭至萬億參數(shù)，再在 512 GPU 的基礎上成功在 10 天內訓練出 10 萬億模型，與 GPT-3 具有同等參數(shù)規(guī)模，但能耗僅為其 1%。

值得一提的是，OpenAI 前政策主管 Jack Clark 當時曾贊揚道：這個模型的規(guī)模和設計都非常驚人。這看起來像是眾多中國的 AI 研究組織逐漸發(fā)展壯大的一種表現(xiàn)。

值得一提的是，阿里巴巴技術副總裁賈揚清昨日也宣布從阿里巴巴畢業(yè)，表示將走向職業(yè)生涯的下一個挑戰(zhàn)。據(jù)稱，其計劃創(chuàng)業(yè)的方向屬于是 AI 基礎設施提供商，關注包括大模型在內的 AI 應用。

據(jù)公開資料，賈揚清為浙江紹興人，本科和研究生階段就讀于清華大學自動化專業(yè)，后赴加州大學伯克利分校攻讀計算機科學博士。他在博士期間創(chuàng)立并開源了如今業(yè)內耳熟能詳?shù)纳疃葘W習框架 Caffe，被微軟、雅虎、英偉達、Adobe 等公司采用。

標簽：