近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI多模態(tài)大模型首輪評估。商湯日日新SenseNova融合模態(tài)大模型在所有模型中,獲得當(dāng)前最高評級——4+級,成為國內(nèi)首家獲得最高評級的大模型。

可信AI多模態(tài)大模型評估2025年1月啟動,由中國信通院人工智能研究所牽頭,依據(jù)由業(yè)界60余家單位共同編制的《多模態(tài)大模型技術(shù)要求和評估方法》標(biāo)準(zhǔn)開展,是國內(nèi)最影響力和權(quán)威的多模態(tài)大模型測評之一。
評估包含基礎(chǔ)能力、理解能力、生成能力、專項(xiàng)測試四個模塊,共計(jì)2個能力域,30余個能力項(xiàng),為多模態(tài)大模型的技術(shù)研發(fā)、應(yīng)用落地等方面提供規(guī)范與指導(dǎo)。
結(jié)果顯示,在基礎(chǔ)能力方面,商湯日日新融合模態(tài)大模型在多模態(tài)融合、多模態(tài)轉(zhuǎn)換、跨模態(tài)感知、跨模態(tài)理解、跨模態(tài)生成能力項(xiàng)中表現(xiàn)優(yōu)異,具備扎實(shí)的技術(shù)能力。在模型應(yīng)用方面,商湯日日新融合模態(tài)大模型在行業(yè)覆蓋度、場景支持度、應(yīng)用形態(tài)多樣性、易用性能力項(xiàng)中表現(xiàn)優(yōu)異,具備穩(wěn)健的應(yīng)用能力。
早在今年 1 月,商湯科技推出日日新融合大模型,在行業(yè)率先實(shí)現(xiàn)原生融合模態(tài),引領(lǐng)了大語言模型和多模態(tài)大模型的一統(tǒng)化大潮。今年4月,商湯升級日日新SenseNova V6版本,通過多模態(tài)長思維鏈訓(xùn)練、全局記憶、強(qiáng)化學(xué)習(xí)等關(guān)鍵技術(shù),實(shí)現(xiàn)多模態(tài)推理能力突破。由此商湯日日新V6可自然融合文本、圖像、視頻、語音等多形態(tài)信息,解決復(fù)雜場景下的綜合問題。
例如,在實(shí)時音視頻交互方面,商湯日日新V6擁有強(qiáng)大的實(shí)時交互、視覺識別、記憶思考、持續(xù)對話和復(fù)雜推理等能力,能幫助AI與人類更自然、更流暢地交流,帶來創(chuàng)新人機(jī)交互體驗(yàn)。在視頻生成方面,商湯日日新V6具備多模態(tài)視頻解析能力,支持10分鐘級視頻全幀率解析,并可根據(jù)解析內(nèi)容產(chǎn)出新的視頻內(nèi)容。
目前,商湯日日新大模型已在教育、金融、工業(yè)等多個領(lǐng)域?qū)崿F(xiàn)場景落地。此次首批通過可信AI多模態(tài)大模型評估并獲最高評級認(rèn)證,意味著商湯日日新不僅已具備行業(yè)領(lǐng)先的多模態(tài)推理能力,還能很好地滿足各行各業(yè)真實(shí)場景中對模型通用性、泛化性和專業(yè)性的嚴(yán)格要求,為行業(yè)可信發(fā)展提供堅(jiān)實(shí)基礎(chǔ)。