9久热久爱免费精品视频在线观看_97视频在线免费播放_女人被男人桶免费软件_狠狠操夜夜操天天操_欧美最猛性xxxxx乱大交

“源1.0”大模型領(lǐng)跑多類綜合語言場景

來源: 環(huán)球網(wǎng) 2022-06-10 05:24:20

【環(huán)球網(wǎng)科技綜合報道】近日,浪潮“源1.0”大模型登頂中文語言能力理解和生成評測基準(zhǔn)CUGE總榜榜首,并獲得語言理解(篇章級)、語言生成、對話交互、多語言、數(shù)學(xué)推理等5項評測最佳成績。這是繼源1.0攬獲權(quán)威中文語言評測基準(zhǔn)CLUE榜單的零樣本學(xué)習(xí)和小樣本學(xué)習(xí)兩類總榜冠軍后,再次在評測中展現(xiàn)強大實力。

據(jù)悉,CUGE(Chinese Language Understanding and Generation Evaluation)智源指數(shù)是由清華大學(xué)、北京大學(xué)、北京智源研究院等高校機構(gòu)共同建立的中文機器語言能力評測基準(zhǔn),該基準(zhǔn)針對當(dāng)前自然語言處理和人工智能發(fā)展新范式,面向具有“通用語言能力”的預(yù)訓(xùn)練模型,全面系統(tǒng)、多層次、多維度地評測大模型能力。

在語言理解(篇章級)評測中,源1.0僅用時11分鐘,便完成數(shù)千篇閱讀理解回答4000多個問題,以86.9高分的成績位居榜首,展現(xiàn)出頂尖的語言理解能力。在語言生成評測中,源1.0僅用時70秒,就完成近800條摘要內(nèi)容的生成,登頂該項榜單。在多語言機器翻譯評測中,基于源1.0大模型蒸餾出來的翻譯模型在完成近4000千對中英文互譯后,登頂榜首,領(lǐng)先第二名15%。在對話交互評測中,基于源1.0大模型蒸餾出來的對話模型回答了電影、音樂、旅行3個領(lǐng)域共近萬個主題對話,成績位居榜首,領(lǐng)先第二名成績30%,展現(xiàn)了極強的智能對話能力。

當(dāng)前,智能對話普遍存在內(nèi)容乏味、主題不連貫等問題,往往幾輪對話后,回答便空洞重復(fù),大大降低用戶體驗。知識驅(qū)動的對話模型直接連接到廣泛的知識庫,大大增加對話內(nèi)容的豐富度,在一定知識背景下也不會偏題,更趨向于人類之間的交談。不久前,源開發(fā)者社區(qū)的一位開發(fā)者基于源的對話模型創(chuàng)建了一位能與人類玩劇本殺的AI虛擬玩家,一位人類玩家與AI虛擬玩家聊天到深夜凌晨仍興趣盎然。以知識驅(qū)動的對話模型,可廣泛應(yīng)用于各類虛擬人、智能助手、智能客服等場景,并極大提升對話的智能水平和用戶體驗。

目前,浪潮“源1.0”已經(jīng)將模型API、高質(zhì)量數(shù)據(jù)集、模型訓(xùn)練代碼、推理代碼和應(yīng)用代碼等等工具和能力開源開放,超過300家行業(yè)用戶和開發(fā)者,通過“源1.0”提供的數(shù)據(jù)和API顯著提升了金融、互聯(lián)網(wǎng)、醫(yī)療和自動駕駛等行業(yè)應(yīng)用的精度。浪潮源1.0將持續(xù)助力行業(yè)用戶和開發(fā)者,攜手推動技術(shù)創(chuàng)新、場景融合、應(yīng)用開發(fā),共同促進大模型的健康發(fā)展與產(chǎn)業(yè)落地,加速AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化發(fā)展。

標(biāo)簽:

猜你喜歡