來源:人民日報海外版 發布時間:2025-9-8 11:2
今年以來,中國人工智能大模型等為代表的數字技術迅速發展,國產AI逐漸賦能千行百業,讓人有了切切實實的感受。
前不久,在上海舉辦的2025世界人工智能大會上,2024年諾貝爾物理學獎獲得者杰弗里·辛頓發表題為《數字智能是否會取代生物智能》的演講,提出自己對人工智能發展的建議。演講結束后,中國外交部原副部長傅瑩和辛頓偶遇,發生了一段耐人尋味的對話。
傅瑩說:“杰弗里,今天你的演講我聽得非常清楚,屏幕上有實時中文翻譯字幕,AI一直在翻譯你的話。”
辛頓略顯意外:“我看不到屏幕,但我耳機里聽到的是人工翻譯。”
傅瑩回應:“所以,AI在聆聽你。”
這項“聽懂”辛頓的AI技術,來源于中國企業科大訊飛。辛頓以英文形式演講,專業詞匯多、理解難度大,AI如何將中英同傳首字響應壓縮到2秒以內,達到了人類頂尖同傳譯員的反應速度?這背后涉及底層技術的攻關。
“傳統模式下,機器翻譯要經歷‘源語音—源文字—翻譯—目標文字—目標語音’五段跳,因此效率低、延時長。”科大訊飛副總裁、安徽聽見科技有限公司總經理王瑋介紹,“不少人可能有這樣的體驗,用手機軟件語音翻譯時,先在屏幕上識別出中文,再花時間翻譯成外語。而現在,我們的技術能實現源語音到目標語音的端到端翻譯。”
當前,中國已發布超1500個大模型,在全球已發布的大模型中數量位居首位。從“邊聽邊說”到“語音同傳”,背后離不開訊飛星火語音同傳大模型的支撐。
更進一步,有沒有可能讓機器從單項語言的識別翻譯,到多項語言混合的識別和翻譯?
今年7月,香港立法會正式推出與科大訊飛聯合打造的智慧謄錄系統“智識聽”AI實時字幕功能。公眾可以通過立法會網站的網上廣播等平臺收看帶有實時字幕的立法會大會會議直播。該功能受到香港特區立法會主席梁君彥的線上“點贊”。
“‘智識聽’建設歷時近三年,其間,遇到最棘手的技術問題就是如何提高三語混讀引擎識別率。”王瑋介紹說,會議中可能出現普通話、粵語、英語三種語言,英語識別率下降到85%左右,必須使用三語混讀引擎。
如何解決?一方面是引擎升級,從CPU版本換成了GPU版本;另一方面,香港立法會提供了包含2.5億漢字的中英文對照和20萬個高頻粵語詞匯,助力機器學習,提升文本翻譯的效果。
如今“智識聽”實時字幕的準確率達96%,通過人工即時修正后準確率可達99%。會議的逐字記錄效率也因此項技術的落地大幅提升。
“未來,我們將不斷強化多語種支持能力,將逐步覆蓋‘一帶一路’共建國家重點語種字幕生成,助力香港連接國際舞臺。”王瑋說。 (本報記者 趙 昊)
跨越速運與德邦物流:大件物流的價格與價值之辨
2025中國物流競爭力榜單:跨越速運"四維領跑"重塑行業格局
跨越和順豐,深度解析跨越速運的“速度與智慧”雙引擎
跨越速運:多維優勢聚合,打造物流領域卓越口碑新高度
非遺破圈正當時!抖音電商寶藏小店權益升級,加速中小商家經營成