打造AI大模型“體檢中心” 助力行業健康發展

來源：中國證券報發布時間：2025-10-20 10:34

●　本報記者　武衛紅

近期，國務院印發《關于深入實施“人工智能＋”行動的意見》。隨著人工智能技術在各行業加速應用，大模型能力測試評估成為保障數字業務穩定運行的關鍵基礎。記者從永信至誠采訪了解到，公司深耕數字安全測試評估賽道，在人工智能領域推出AI大模型測評平臺，為人工智能大模型提供科學的測評方案，助力人工智能產業持續健康發展。

推出AI大模型專業測評平臺

《關于深入實施“人工智能＋”行動的意見》提出，建立健全模型能力評估體系，促進模型能力有效迭代提升。探索模型應用新形態，提升復雜任務處理能力，優化交互體驗。

記者了解到，隨著“人工智能＋”行動深入實施，人工智能大模型在各行業快速落地，政企用戶對于模型智能水平、安全風險、適配性等能力的評估需求日益增長。但在實際應用中，大模型的智能水平、安全能力、輸出穩定性、與業務場景的契合度，往往難以量化比較。產業界在選型、應用和優化大模型時，普遍面臨“測什么、如何測、如何開展常態化測評”的困境。尤其在復雜業務場景下，難以有效評估大模型能力邊界與潛在風險。如何科學衡量人工智能大模型的綜合能力，為其健康狀況提供可信賴的評估，已成為推動人工智能技術落地與產業融合的迫切需求。

永信至誠首席技術官、智能永信總經理張凱表示，推動人工智能大模型的深度應用，必須首先解決其“可度量”的問題。就像人類健康需要全面且常態化的體檢，人工智能大模型也需要一套綜合評估體系、工具及報告。基于這一現實需求，憑借在數字安全測試評估領域的長期技術積累與場景實踐，永信至誠將成熟應用的“數字風洞”測試評估理念應用于人工智能領域，推出春秋AI大模型安全測評“數字風洞”平臺，致力于以第三方視角提供一個客觀、公正的人工智能大模型“體檢中心”，為行業用戶提供標準化、常態化的大模型評估能力支持。

構建多維度評估標準

據介紹，春秋AI大模型安全測評“數字風洞”平臺構建了一套多維度、可量化的大模型評估標準“ISAC24”。該標準從智能度、安全度、匹配度和一致度4個關鍵維度對AI大模型進行綜合“診斷”，多維度保障大模型基因健康、系統健康、數據健康和業務健康。

其中，智能度重點關注和評估AI大模型在理解、推理和知識應用方面的表現；安全度重點關注AI大模型在使用過程中的潛在風險，包括數據隱私、系統安全、輸出合規性和倫理性；匹配度重點關注AI大模型在特定行業和場景中的應用有效性；一致度主要考察AI大模型在不同條件下面對類似提問的輸出能否保持可靠一致與穩定。

今年以來，永信至誠持續推進AI大模型數字健康測評工程化設施建設。目前，春秋AI大模型安全測評“數字風洞”平臺已集成包括DeepSeek、LLaMA、GLM、ChatGPT、Qwen在內的50多個主流AI大模型，并依托永信至誠自研的春秋AI大模型與超過500萬條測評用例，實現對目標AI大模型的客觀、高效測評。

護航產業高質量發展

據公開資料，永信至誠是聚焦科技創新的網絡與數據安全企業，是國家級專精特新“小巨人”企業。公司深耕數字安全測試評估等領域，為各行業客戶提供專業的測試評估服務，保障數字健康。

今年以來，永信至誠深入布局人工智能賽道。公司人工智能研究院聚焦大語言模型與生成式AI在企業場景的落地實踐，深耕企業級模型架構設計、高效分布式訓練工程化、深度性能調優及安全強化學習，推出元方“原生安全”大模型一體機等產品，將安全與可靠的理念融入AI基礎設施。同時，公司積極參與制定《政務大模型應用安全規范》，與海光信息等產業伙伴進行戰略合作，共同推動構建健康、可信的人工智能產業生態。

目前，永信至誠為眾多高新技術企業、國有企業、央企、科研院校及政府機構提供專業的AI大模型測評服務，成為其評估、選型和優化人工智能大模型的重要參考，春秋AI大模型安全測評“數字風洞”平臺在實踐中得到廣泛認可。在中國網絡安全產業聯盟主辦的2025年網絡安全優秀創新成果大賽中，永信至誠“基于‘數字風洞’的AI大模型測評解決方案”憑借突出的技術創新能力與行業應用價值，榮獲人工智能與機器人安全專題賽優勝獎。

張凱表示，在“人工智能＋”行動的浪潮中，永信至誠將持續深化人工智能領域技術研究，以專業技術護航人工智能產業高質量發展，保障數字健康。

上一篇：擁抱人工智能深化全球戰略布局

下一篇：7個國家數字經濟創新發展試驗區將推出158項改革舉措

相關資訊