掃一掃
下載數(shù)字化報APP
近日,上海AI實驗室和上海市數(shù)字醫(yī)學創(chuàng)新中心聯(lián)合推出的MedBench評測更新榜單,云知聲山海大模型醫(yī)療行業(yè)版(UNIGPT-MED) 以綜合得分54.7的優(yōu)異成績登頂榜首,充分彰顯其硬核醫(yī)療實力。
醫(yī)療領域中文大模型不斷涌現(xiàn),如何對它們進行專業(yè)、科學的評測成為行業(yè)眼下亟待解決的問題。在此背景下,上海AI實驗室和上海市數(shù)字醫(yī)學創(chuàng)新中心基于OpenCompass大模型開放評測體系,聯(lián)合推出中文醫(yī)療大語言模型開放評測平臺MedBench,吸引了螞蟻、商湯、百川、智譜等諸多大模型企業(yè)和研究機構參與其中,共同推進醫(yī)療大語言模型全面、專業(yè)、互認的評測體系建設。
基于醫(yī)學語言理解、醫(yī)學語言生成、醫(yī)學知識問答、復雜醫(yī)學推理、醫(yī)療安全和倫理5大維度,MedBench設置15項任務、20個數(shù)據(jù)集及30萬道題目,為中文醫(yī)療大模型提供了客觀科學的性能評測參考。
此次云知聲參與評測的醫(yī)學行業(yè)版大模型UNIGPT-MED在山海大模型升級的基礎上,通過多年深耕醫(yī)療行業(yè)所積累的海量行業(yè)數(shù)據(jù)進行增量訓練,并結(jié)合RLHF和RLAIF方法,生成大量符合偏好的醫(yī)學數(shù)據(jù),顯著提升了模型在醫(yī)學領域的專業(yè)性能和準確性,使其在MedBench的多個評測維度中展現(xiàn)出出色的實力,并在醫(yī)學知識問答、醫(yī)學語言理解兩大關鍵維度中拔得頭籌。
醫(yī)學知識問答評測得分
醫(yī)學語言理解評測得分
這一成績的取得,是云知聲在大模型賽道持續(xù)深耕、不斷技術創(chuàng)新的成果體現(xiàn)。
作為中國AGI技術產(chǎn)業(yè)化的先行者,云知聲于2016年開始打造Atlas人工智能基礎設施,并以此為基礎,構建云知大腦(UniBrain)技術中臺——以山海(UniGPT)通用認知大模型為核心,結(jié)合多模態(tài)感知與生成、知識圖譜、物聯(lián)平臺等智能組件,為云知聲智慧物聯(lián)、智慧醫(yī)療、智慧座艙、智慧交通等業(yè)務提供高效的產(chǎn)品化支撐,持續(xù)推動“U(云知大腦)+X(應用場景)”戰(zhàn)略布局,致力推動千行百業(yè)的智慧化升級。
作為云知大腦的核心,山海大模型具備語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學能力、安全合規(guī)能力七項通用能力及插件擴展、領域增強、企業(yè)定制三項行業(yè)落地能力,且目前已由大語言模型升級至多模態(tài)大模型,拓展出文生圖、文生視頻、圖片問答等多模態(tài)能力,能夠滿足更多場景的應用需求。
目前,最新版本的山海大模型通用大模型能力已超越GPT-3.5,并在上個月的OpenCompass大模型評測中排名國產(chǎn)大模型廠商第四、全球大模型廠商第六,其在中英文雙語客觀評測中的語言、知識、推理能力,在綜合性中文主觀評測中的創(chuàng)作能力更是超越了GPT-4,躋身通用大模型第一梯隊。
在醫(yī)療專業(yè)能力上,山海大模型于2023年6月的MedQA任務中超越Med-PaLM 2,取得87.1%的優(yōu)異成績;在臨床執(zhí)業(yè)醫(yī)師資格考試中提升至523(總分600分),超過99%的考生水平。其基于山海大模型孵化的醫(yī)療大模型,也在CCKS 2023 PromptCBLUE醫(yī)療大模型評測中奪得通用賽道一等獎。
此次登頂MedBench評測榜,再次證實了云知聲山海大模型在醫(yī)療領域的突出實力,也將鞭策云知聲持續(xù)迭代大模型技術底座,實現(xiàn)大模型技術在多領域場景下的滲透和應用,以技術創(chuàng)新為各行各業(yè)帶來更多智能化變革。
未經(jīng)數(shù)字化報網(wǎng)授權,嚴禁轉(zhuǎn)載或鏡像,違者必究。
特別提醒:如內(nèi)容、圖片、視頻出現(xiàn)侵權問題,請發(fā)送郵箱:tousu_ts@sina.com。
風險提示:數(shù)字化報網(wǎng)呈現(xiàn)的所有信息僅作為學習分享,不構成投資建議,一切投資操作信息不能作為投資依據(jù)。本網(wǎng)站所報道的文章資料、圖片、數(shù)據(jù)等信息來源于互聯(lián)網(wǎng),僅供參考使用,相關侵權責任由信息來源第三方承擔。
本文地址: http:///news/60601.shtml
數(shù)字化報(數(shù)字化商業(yè)報告)是國內(nèi)數(shù)字經(jīng)濟創(chuàng)新門戶網(wǎng)站,以數(shù)字技術創(chuàng)新發(fā)展為中心,融合數(shù)字經(jīng)濟和實體經(jīng)濟發(fā)展,聚焦制造業(yè)、服務業(yè)、農(nóng)業(yè)等產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,致力為讀者提供最新、最權威、最全面的科技和數(shù)字領域資訊。數(shù)字化報并非新聞媒體,不提供新聞信息服務,提供商業(yè)信息服務;
商務合作:Hezuo@szhww.com
稿件投訴:help@szhww.com
Copyright ? 2013-2023 數(shù)字化報(數(shù)字化報商業(yè)報告)
數(shù)字化報并非新聞媒體,不提供新聞信息服務,提供商業(yè)信息服務
浙ICP備2023000407號數(shù)字化報網(wǎng)(杭州)信息科技有限公司 版權所有浙公網(wǎng)安備 33012702000464號