“1024 直接對(duì)標(biāo) ChatGPT!”科大訊飛星火大模型立 Flag、一手實(shí)測(cè)來了
來源: CSDN 2023-05-07 20:57:23
短短半年之內(nèi),在大模型賽道上,國(guó)內(nèi)外 AI 頭部玩家陸續(xù)帶著自己的 AIGC 產(chǎn)品迅速就位并“開跑”。 現(xiàn)如今,誰能打造出中國(guó)版 ChatGPT,已經(jīng)不再是一個(gè)問題。但是,誰能做出更好的中國(guó)版 ChatGPT,成為業(yè)界關(guān)注的重點(diǎn)。
北京時(shí)間 5 月 6 日下午 2:00,作為人工智能“國(guó)家隊(duì)”的科大訊飛,如約揭曉了其認(rèn)知大模型——訊飛星火的真實(shí)面紗, 并帶來了豐富的應(yīng)用成果,為中國(guó)生成式 AI 市場(chǎng)再添一位猛將。
目前,訊飛星火認(rèn)知大模型已經(jīng)開啟內(nèi)測(cè)( https://xinghuo.xfyun.cn )。CSDN 在早前已經(jīng)獲得了內(nèi)測(cè),下文中,我們也將與大家一起探測(cè)「訊飛星火認(rèn)知大模型」的真實(shí)情況,以及它的與眾不同之處。
(資料圖片僅供參考)
帶著 7 大類 481 個(gè)細(xì)分的任務(wù)類型, 訊飛星火認(rèn)知大模型來了!
在發(fā)布會(huì)現(xiàn)場(chǎng),科大訊飛董事長(zhǎng)劉慶峰表示,認(rèn)知大模型的技術(shù)階躍和快速進(jìn)化,讓人工智能在全球掀起全新熱潮。當(dāng)前,認(rèn)知大模型成為通用人工智能的“曙光”。與此同時(shí),認(rèn)知大模型的“智能涌現(xiàn)”將帶來解決人類剛需的全新機(jī)遇。
具體來看,智能涌現(xiàn)的通用人工智能系統(tǒng)具有七大能力,包括 文本生成、語言理解、知識(shí)問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力?;诖?, 人類只要做畫龍點(diǎn)睛的加工,就能得到 “懂你所言,答你所問,創(chuàng)你所需,解你所難,學(xué)你所教”的所有內(nèi)容。
訊飛星火認(rèn)知大模型是基于科大訊飛 12 年的技術(shù)積累,打造而成,實(shí)現(xiàn)了 通用 人工智能系統(tǒng)七大能力中的 481 個(gè)細(xì)分任務(wù)。其還在 2022 年 12 月 15 日,正式啟動(dòng)“1+N”認(rèn)知大模型專項(xiàng)攻關(guān),其中“1”就是指通用認(rèn)知智能大模型,“N”就是大模型在教育、辦公、汽車、人機(jī)交互等各個(gè)領(lǐng)域的落地。
對(duì)于先行者,劉慶峰表示,「向 OpenAI 致敬和學(xué)習(xí),快速追趕并努力超越」。
與此同時(shí),其更是在現(xiàn)場(chǎng)目標(biāo)明確,立下 2023 年內(nèi) 訊飛星火認(rèn)知大模型的 升級(jí) Flag:
6 月 9 日,訊飛星火認(rèn)知大模型將突破開放式問答、升級(jí)多輪對(duì)話能力、數(shù)學(xué)能力。
8 月 15 日,突破代碼能力、繼續(xù)升級(jí)多模態(tài)交互能力。
10 月 24 日,訊飛星火認(rèn)知大模型將在通用大模型領(lǐng)域直接對(duì)標(biāo) ChatGPT,并在中文維度實(shí)現(xiàn)超越。
話不多說,我們也將從七大能力直接開啟測(cè)試模式。
代碼能力:多功能、多語言
對(duì)于程序員而言,關(guān)注的重點(diǎn)當(dāng)然是大模型能給我們解決多少代碼、編程問題。
在此,我們便先測(cè)試一下。
譬如,捉 Bug。
寫代碼:“圍繞“給定一個(gè) 1-100 的整數(shù)數(shù)組,請(qǐng)找到其中缺少的數(shù)字”寫一段實(shí)現(xiàn)代碼”。
再來一個(gè)遞歸函數(shù):
挑戰(zhàn)難一 點(diǎn)的:「怎么用 C++ 編寫一個(gè)復(fù)數(shù)計(jì)算器?包括加減乘除、冪次方、取模、輻角、共軛。實(shí)部和虛部都是實(shí)數(shù)范圍?!?
對(duì)此,我們咨詢了 CSDN-AI 團(tuán)隊(duì)研發(fā)總監(jiān)對(duì)這段代碼進(jìn)行了點(diǎn)評(píng),其表示:訊飛星火認(rèn)知大模型生成的代碼, 復(fù) 數(shù)類的代碼基 本實(shí)現(xiàn)是對(duì)的,但是測(cè)試用例沒有一次性生成完整。和 GPT 生成的測(cè)試用例相比,這段代碼比較簡(jiǎn)潔完整。
其實(shí)在代碼能力上,劉慶峰坦言 ,訊飛星火大模型的這一功能和 ChatGPT 相比,還有很大差距,下一步升級(jí)的重點(diǎn)功能也是這一塊。
就連大模型自身也說道:“我的代碼生成功能仍然有限,可能無法滿足復(fù)雜的業(yè)務(wù)需求”。
簡(jiǎn)單的代碼問題,對(duì)于訊飛星火認(rèn)知大模型來說,不成問題。不過在涉及到一些復(fù)雜的工業(yè)互聯(lián)網(wǎng)、架構(gòu)時(shí),其生成的內(nèi)容只能供參考。作為開發(fā)者,更要自行檢查代碼正確性、可靠性和保密性等等。
文本生成能力:多風(fēng)格、多任務(wù)、長(zhǎng)文本
首先,先給我們介紹一下自己:旨在“星星之火,可以燎原”。
再來科普一下認(rèn)知大模型:
再讓訊飛星火認(rèn)知大模型來講個(gè)英文的故事:
直接翻譯成中文試試:
幾次實(shí)測(cè)下來,訊飛星火認(rèn)知大模型在不同語言的涌現(xiàn)能力表現(xiàn)都不錯(cuò):
繼續(xù)續(xù)寫一個(gè)故事:如果奧特曼出現(xiàn)在《西游記》故事中,會(huì)發(fā)生什么?
結(jié)果顯示,它對(duì)中國(guó)文化理解力也 不錯(cuò):
在這一功能上,劉慶峰表示,訊飛星火大模型在國(guó)內(nèi)明顯領(lǐng)先,并且在中文方面超過了 ChatGPT,并且在持續(xù)進(jìn)步中。
語言理解:多層次、跨語種
中華文化博大精深,這是否會(huì)難倒訊飛星火認(rèn)知大模型?
用現(xiàn)場(chǎng)的測(cè)試案例,先來一波直擊靈魂的提問: 「俗話說,男子漢大丈夫,寧死不屈。 但俗話 又 說,男子漢大文夫,能屈能伸。 這兩種說法哪種是對(duì)的」
追問:「如果有個(gè)小伙子和女朋友吵架了,他是應(yīng)該寧死不屈還是能屈能伸」。
語境理解:「女朋友生氣時(shí),說隨便,男朋友應(yīng)該怎么做?」
再來一個(gè):「烈日之下,我哭了。烈日之下,我看到我的爸爸在干活,我哭了。分別表達(dá)了什么心情」
不得不說,擁有訊飛星火大模型的情商和理解力,絕對(duì)能分分鐘拯救“每步都踩在女朋友的雷點(diǎn)上”的他。
再來試試英文:「這句話有問題嗎:Each of the boys have a pen.」
結(jié)果顯示,此大模型不僅能識(shí)別出錯(cuò)誤,也能直接給出正確的語句答案。
知識(shí)問答:泛領(lǐng)域、開放式
先問一下關(guān)于醫(yī)學(xué)問題:
提問:刺繡里面的\"水路”、“落繃\"是什么?
再問:「\"螞蟻上樹”這道菜怎么做?」
這一次,我們終于沒有看到真實(shí)的螞蟻被做成菜的“指南”了:
不妨再來一場(chǎng)辯論試試:「以\"AI創(chuàng)作的繪畫是/不是藝術(shù)\"為主題,進(jìn)行辯論,正方:是藝術(shù),反方:不是藝術(shù),最終得出結(jié)論」
劉慶峰表示,訊飛的大模型也正在逐步學(xué)習(xí)專業(yè)的科學(xué)文獻(xiàn),未來回答也會(huì)更加專業(yè)。
邏輯推理
來一道經(jīng)典的“過河”推理 問題:
一個(gè)人帶著一匹狼、一只羊和一捆卷心菜來到了河邊。他需要過河,但是河邊只有一條船,而且他只能帶一樣?xùn)|西上船。他不能把狼和羊一起留在河邊,也不能讓羊和卷心菜一起留在河邊,因?yàn)樵谶@兩種情況下,前者都會(huì)吃掉后者。那么,如何用最少的渡河次數(shù)把所有東西都帶到河對(duì)岸呢?解釋得詳細(xì)一些
根據(jù)我們的需求以及提問,訊飛星火認(rèn)知大模型能夠盡可能提供詳盡的解答:
繼續(xù)提問:
數(shù)學(xué)能力
在數(shù)學(xué)能力上,先來一個(gè)簡(jiǎn)單的“雞兔同籠”試試水。我們發(fā)現(xiàn),相比其他大模型,訊飛星火似乎更善用方程來解決問題:
接下來,我們又用了此前在其他三四款大模型上提過的問題來進(jìn)行了測(cè)試,但是彼時(shí)只有 ChatGPT 回答出來了。
提問: 某廠一車間有 64 人,二車間有 56 人,現(xiàn)因工作需要,要求第一車間人數(shù)是第二車間人數(shù)的一半,問需從第一車間調(diào)多少人到第二車間?(列方程解答)
訊飛星火認(rèn)知大模型并沒有讓我們失望,成功做出了解答:
再來測(cè)試一下不 動(dòng)腦筋就會(huì)想錯(cuò)的問題:「公司的股票昨天漲了 10%,今天又跌了 10%,請(qǐng)問是漲了還是跌了」。
多模態(tài)能力
截至目前,雖然星火認(rèn)知大模型不是國(guó)內(nèi)第一個(gè)發(fā)布的,但在多模態(tài)能力上,功能還是頗為全面的,具有語音、圖文理解、虛擬人合成、多模態(tài)交互等多種能力。
不過,有些遺憾的是,這些功能目前處于科大訊飛內(nèi)部測(cè)試階段,尚未公開。根據(jù)其官方計(jì)劃,公測(cè)用戶應(yīng)該能在 8 月份用上。
當(dāng)前,倒是可以通過現(xiàn)場(chǎng)演示一飽眼福。如上傳一張英文菜單圖片,直接翻譯為中文:
也可以暢想一下,對(duì)于英文不好的技術(shù)人而言,是不是可以通過大模型,無障礙閱讀很多英文文獻(xiàn)、論文了。
下面進(jìn)一步交互,表現(xiàn)力也不錯(cuò):
也能直接語音輸出:
還能直接生成虛擬人。這個(gè)虛擬人能夠結(jié)合文字?jǐn)⑹龅谋尘?,配上相?yīng)的背景圖、手勢(shì)、語氣,實(shí)現(xiàn)寓意貫穿。
暢想一下未來
綜合以上,訊飛星火認(rèn)知大模型在情商、智商、逆商不錯(cuò)的表現(xiàn)能力,有目共睹。不過,這也引發(fā)了不少?gòu)臉I(yè)者的焦慮,現(xiàn)在不妨也讓它來與我們一起暢想一下未來。
當(dāng)問及和人類的智慧相比,誰更勝一籌時(shí),星火認(rèn)知大模型給出了中肯的回答:在某些情況下,還需要人類的判斷和智慧。
面對(duì)現(xiàn)在很多程序員都要問上一句的“取代潮”,它表示自己不太可能完全取代程序員的工作。
暢想未來,它也能很現(xiàn)實(shí)地告知,理想中的 AGI 離我們還有很遠(yuǎn),甚至可以說是遙不可及。
這對(duì)于很多新聞播報(bào)的自媒體工作者而言,無疑是福音來了。
與此同時(shí),當(dāng)問及未來開源 AI 大模型的發(fā)展趨勢(shì)時(shí),其中立地回答道: 各有優(yōu)劣,未來的發(fā)展趨勢(shì)將取決于具體的應(yīng)用場(chǎng)景和技術(shù)需求。
最后
整體測(cè)試下來,訊飛星火認(rèn)知大模型給我們帶來的驚喜遠(yuǎn)遠(yuǎn)大于預(yù)期,這也是訊飛大模型在今天發(fā)布之后頻頻獲得好評(píng)的原因。不過,劉慶峰也表示,目前純大模型技術(shù)在新知識(shí)獲取、事實(shí)類問答、史實(shí)與傳統(tǒng)典籍理解等方面還有一定的缺陷。
不過正如文章伊始所述,這些難題攻克都已經(jīng)提上日程。
如今,訊飛星火認(rèn)知大模型技術(shù)也已經(jīng)從單一的大模型本身,成功擴(kuò)展到 教育、辦公、汽車、數(shù)字員工等 N 個(gè)方向,在不斷迭代中,我們也期待 星 火認(rèn)知大模型更加亮眼的表現(xiàn)。
標(biāo)簽:
猜你喜歡

“1024 直接對(duì)標(biāo) ChatGPT!”科大訊飛星火大模型立 Flag、一手實(shí)測(cè)來了
2023-05-07 20:57:23

心煩睡不著覺吃什么藥效果好_睡不著覺吃什么藥效果好
2023-05-07 20:58:19

環(huán)球微頭條丨輔機(jī)設(shè)備概念股有哪些?輔機(jī)設(shè)備概念股一覽表2023
2023-05-07 20:54:30

現(xiàn)代物流管理屬于哪個(gè)大類 物流管理屬于哪個(gè)大類 最新資訊
2023-05-07 20:19:04

每日精選:銀河麒麟桌面系統(tǒng)升級(jí)V10 SP1 2303:固若金湯 真心好用!
2023-05-07 19:52:00

焦點(diǎn)信息:移動(dòng)電子商務(wù)的特點(diǎn)_移動(dòng)電子商務(wù)
2023-05-07 20:02:12

全球今日訊!荷蘭的花的名字_荷蘭的花
2023-05-07 19:04:56

環(huán)球關(guān)注:新華三集團(tuán)舉辦成立7周年慶,未來幾年加速向千億目標(biāo)邁進(jìn)
2023-05-07 19:20:11

金價(jià)刷新歷史紀(jì)錄 銀行猛推貴金屬積存產(chǎn)品 值得上車嗎 世界觀焦點(diǎn)
2023-05-07 19:06:28

全球看點(diǎn):億萬盛寵只為你全文免費(fèi)閱讀
2023-05-07 18:54:10

南方強(qiáng)降雨今逐漸收尾 中東部明開啟晴朗升溫模式_獨(dú)家焦點(diǎn)
2023-05-07 18:18:49

損失或超1.6億,保險(xiǎn)能為這面墻買單嗎?
2023-05-07 17:56:31

當(dāng)前最新:盜賊走進(jìn)派出所報(bào)警:我的錢丟了,警察:請(qǐng)進(jìn)
2023-05-07 17:50:40

小學(xué)三年級(jí)英語繪本閱讀_小學(xué)三年級(jí)英語繪本
2023-05-07 17:56:30

艾弗里nba_艾弗里 約翰遜
2023-05-07 17:08:10

ChatGPT背后的外包工人:在美時(shí)薪超15美元,干的都是苦力活
2023-05-07 16:58:16

泉州自來水:追尋革命足跡 錘煉黨性修養(yǎng) 全球焦點(diǎn)
2023-05-07 16:50:13

看美劇學(xué)英語的正確方法_看美劇學(xué)英語的方法
2023-05-07 17:06:50

天天視訊!qq共同好友具體是誰怎么查看 qq共同好友具體是誰怎么查
2023-05-07 16:18:47

多音字手抄報(bào)(多音字手抄報(bào))_今日?qǐng)?bào)
2023-05-07 16:10:52

【評(píng)測(cè)-人文3.8星】深圳灣,不止總部、錢和體育,還有孩子另一種未來
2023-05-07 16:05:18

每日熱聞!動(dòng)漫游戲、音頻視頻……這些成果也可以評(píng)職稱了
2023-05-07 16:04:21

春天竹筍的做法?|世界快資訊
2023-05-07 15:19:09

卡馬文加俱樂部生涯大滿貫 19位隊(duì)友皇馬生涯大滿貫-世界熱消息
2023-05-07 15:23:18

非遺、特斯拉和賴聲川選角來“擺攤” 上海首屆潮文化生活節(jié)在東·劇場(chǎng)舉行 熱點(diǎn)評(píng)
2023-05-07 15:03:25