來源:中國證券報 發布時間:2025-10-20 10:34
● 本報記者 武衛紅
近期,國務院印發《關于深入實施“人工智能+”行動的意見》。隨著人工智能技術在各行業加速應用,大模型能力測試評估成為保障數字業務穩定運行的關鍵基礎。記者從永信至誠采訪了解到,公司深耕數字安全測試評估賽道,在人工智能領域推出AI大模型測評平臺,為人工智能大模型提供科學的測評方案,助力人工智能產業持續健康發展。
推出AI大模型專業測評平臺
《關于深入實施“人工智能+”行動的意見》提出,建立健全模型能力評估體系,促進模型能力有效迭代提升。探索模型應用新形態,提升復雜任務處理能力,優化交互體驗。
記者了解到,隨著“人工智能+”行動深入實施,人工智能大模型在各行業快速落地,政企用戶對于模型智能水平、安全風險、適配性等能力的評估需求日益增長。但在實際應用中,大模型的智能水平、安全能力、輸出穩定性、與業務場景的契合度,往往難以量化比較。產業界在選型、應用和優化大模型時,普遍面臨“測什么、如何測、如何開展常態化測評”的困境。尤其在復雜業務場景下,難以有效評估大模型能力邊界與潛在風險。如何科學衡量人工智能大模型的綜合能力,為其健康狀況提供可信賴的評估,已成為推動人工智能技術落地與產業融合的迫切需求。
永信至誠首席技術官、智能永信總經理張凱表示,推動人工智能大模型的深度應用,必須首先解決其“可度量”的問題。就像人類健康需要全面且常態化的體檢,人工智能大模型也需要一套綜合評估體系、工具及報告。基于這一現實需求,憑借在數字安全測試評估領域的長期技術積累與場景實踐,永信至誠將成熟應用的“數字風洞”測試評估理念應用于人工智能領域,推出春秋AI大模型安全測評“數字風洞”平臺,致力于以第三方視角提供一個客觀、公正的人工智能大模型“體檢中心”,為行業用戶提供標準化、常態化的大模型評估能力支持。
構建多維度評估標準
據介紹,春秋AI大模型安全測評“數字風洞”平臺構建了一套多維度、可量化的大模型評估標準“ISAC24”。該標準從智能度、安全度、匹配度和一致度4個關鍵維度對AI大模型進行綜合“診斷”,多維度保障大模型基因健康、系統健康、數據健康和業務健康。
其中,智能度重點關注和評估AI大模型在理解、推理和知識應用方面的表現;安全度重點關注AI大模型在使用過程中的潛在風險,包括數據隱私、系統安全、輸出合規性和倫理性;匹配度重點關注AI大模型在特定行業和場景中的應用有效性;一致度主要考察AI大模型在不同條件下面對類似提問的輸出能否保持可靠一致與穩定。
今年以來,永信至誠持續推進AI大模型數字健康測評工程化設施建設。目前,春秋AI大模型安全測評“數字風洞”平臺已集成包括DeepSeek、LLaMA、GLM、ChatGPT、Qwen在內的50多個主流AI大模型,并依托永信至誠自研的春秋AI大模型與超過500萬條測評用例,實現對目標AI大模型的客觀、高效測評。
護航產業高質量發展
據公開資料,永信至誠是聚焦科技創新的網絡與數據安全企業,是國家級專精特新“小巨人”企業。公司深耕數字安全測試評估等領域,為各行業客戶提供專業的測試評估服務,保障數字健康。
今年以來,永信至誠深入布局人工智能賽道。公司人工智能研究院聚焦大語言模型與生成式AI在企業場景的落地實踐,深耕企業級模型架構設計、高效分布式訓練工程化、深度性能調優及安全強化學習,推出元方“原生安全”大模型一體機等產品,將安全與可靠的理念融入AI基礎設施。同時,公司積極參與制定《政務大模型應用安全規范》,與海光信息等產業伙伴進行戰略合作,共同推動構建健康、可信的人工智能產業生態。
目前,永信至誠為眾多高新技術企業、國有企業、央企、科研院校及政府機構提供專業的AI大模型測評服務,成為其評估、選型和優化人工智能大模型的重要參考,春秋AI大模型安全測評“數字風洞”平臺在實踐中得到廣泛認可。在中國網絡安全產業聯盟主辦的2025年網絡安全優秀創新成果大賽中,永信至誠“基于‘數字風洞’的AI大模型測評解決方案”憑借突出的技術創新能力與行業應用價值,榮獲人工智能與機器人安全專題賽優勝獎。
張凱表示,在“人工智能+”行動的浪潮中,永信至誠將持續深化人工智能領域技術研究,以專業技術護航人工智能產業高質量發展,保障數字健康。
跨越速運與德邦物流:大件物流的價格與價值之辨
2025中國物流競爭力榜單:跨越速運"四維領跑"重塑行業格局
跨越和順豐,深度解析跨越速運的“速度與智慧”雙引擎
跨越速運:多維優勢聚合,打造物流領域卓越口碑新高度
非遺破圈正當時!抖音電商寶藏小店權益升級,加速中小商家經營成