在中央網(wǎng)信辦網(wǎng)絡(luò)安全協(xié)調(diào)局指導(dǎo)下,中國(guó)網(wǎng)絡(luò)安全產(chǎn)業(yè)聯(lián)盟 (CCIA) 主辦“2024年網(wǎng)絡(luò)安全優(yōu)秀創(chuàng)新成果大賽”。在大賽中,永信至誠(chéng)“春秋AI大模型測(cè)評(píng)「數(shù)字風(fēng)洞」平臺(tái)”憑借技術(shù)創(chuàng)新能力、行業(yè)應(yīng)用價(jià)值榮獲網(wǎng)絡(luò)安全創(chuàng)新產(chǎn)品優(yōu)勝獎(jiǎng)。
本次大賽旨在挖掘具備國(guó)際或國(guó)內(nèi)領(lǐng)先技術(shù)水平、應(yīng)用前景廣闊、符合行業(yè)發(fā)展方向的網(wǎng)絡(luò)安全創(chuàng)新產(chǎn)品和解決方案,激發(fā)網(wǎng)絡(luò)安全企業(yè)加強(qiáng)自主創(chuàng)新能力,推動(dòng)網(wǎng)絡(luò)安全產(chǎn)業(yè)高質(zhì)量發(fā)展。
春秋AI大模型測(cè)評(píng)「數(shù)字風(fēng)洞」平臺(tái)是永信至誠(chéng)針對(duì)通用大模型產(chǎn)品綜合能力測(cè)評(píng)打造的技術(shù)平臺(tái)。平臺(tái)以春秋AI大模型為核心,基于動(dòng)態(tài)問(wèn)題檢測(cè)與海量測(cè)試題庫(kù),能夠針對(duì)大模型的智能度、安全度、匹配度三個(gè)維度進(jìn)行能力測(cè)試,精準(zhǔn)評(píng)估大模型在智能水平、應(yīng)對(duì)安全攻擊以及任務(wù)匹配上的表現(xiàn),幫助用戶(hù)識(shí)別潛在風(fēng)險(xiǎn)并優(yōu)化系統(tǒng)性能。
智能度測(cè)評(píng):平臺(tái)針對(duì)不同場(chǎng)景下的任務(wù)表現(xiàn)進(jìn)行智能性測(cè)試,涵蓋基礎(chǔ)認(rèn)知、邏輯推理等方面,衡量模型在復(fù)雜任務(wù)中的認(rèn)知能力,并支持與市面主流大模型進(jìn)行智能水平的橫向?qū)Ρ葴y(cè)評(píng);
安全度測(cè)評(píng):平臺(tái)從攻擊者視角出發(fā),基于安全行業(yè)垂直語(yǔ)料數(shù)據(jù)集和測(cè)試載荷,實(shí)現(xiàn)對(duì)通用大模型基礎(chǔ)設(shè)施安全、內(nèi)容安全、數(shù)據(jù)與應(yīng)用安全等方面深度體檢,及時(shí)發(fā)現(xiàn)AI大模型的脆弱性及數(shù)據(jù)缺陷;
匹配度測(cè)評(píng):平臺(tái)通過(guò)對(duì)AI大模型在特定應(yīng)用場(chǎng)景下的任務(wù)執(zhí)行效果進(jìn)行深入分析,確保模型的輸出與業(yè)務(wù)需求匹配,避免大模型在應(yīng)用過(guò)程中偏離業(yè)務(wù)目標(biāo)或在關(guān)鍵任務(wù)中失效。
隨著AI等新技術(shù)在各行業(yè)的廣泛落地,安全風(fēng)險(xiǎn)與能力評(píng)估的需求也不斷攀升。作為數(shù)字安全測(cè)試評(píng)估賽道領(lǐng)跑者、網(wǎng)絡(luò)靶場(chǎng)和人才建設(shè)領(lǐng)軍者,永信至誠(chéng)依托「數(shù)字風(fēng)洞」產(chǎn)品體系,持續(xù)為行業(yè)用戶(hù)提供專(zhuān)業(yè)測(cè)評(píng)服務(wù)和專(zhuān)有人才支撐,推動(dòng)新技術(shù)與新產(chǎn)品安全應(yīng)用,共同助力行業(yè)生態(tài)健康發(fā)展。
評(píng)論