AI 治理與監管 · 2026-04-20 · 03:46

逾 250 名 AI 專家齊聚新加坡 共商全球測試標準

演講者
CNA
亞洲新聞臺報道
型別
行業領袖
來源
CNA

核心觀點

新加坡提出的 AI 安全測試標準成為 ISO 國際會議焦點,逾 250 名來自美、中、日、韓等國的專家與會,這是該標準工作組首次在東盟舉行。目前已釋出或在研的 AI 標準近百項,是一年前的三倍。

關鍵要點

  • 逾 250 名來自美、中、日、韓等國的專家齊聚新加坡,參加 ISO 人工智慧標準工作組首次在東盟召開的會議。
  • 已釋出或在研的 AI 標準近 100 項,是一年半前的三倍,覆蓋從生成式到代理型 AI 的快速演進。
  • 新加坡牽頭兩項標準:AI 紅隊測試規範,以及文本生成式 AI 應用的測試方法,後者預計明年完成。
  • 新加坡同步釋出開源工具 Project Moonshot,幫助測試 AI 模型的偏見、隱私與錯誤資訊風險。

內容摘要

新加坡提出的 AI 安全測試標準成為 ISO 國際會議焦點。逾 250 名來自美、中、日、韓等地的專家與會,這是該工作組首次在東盟召開。短短三年多,AI 從生成式發展到多模態再到代理型,標準必須跟上節奏。目前已釋出或在研的 AI 標準近 100 項,是一年半前的三倍。

新加坡聚焦兩項工作:一是規範 AI 紅隊測試,由人員主動誘導模型生成不當內容或洩露資訊;二是為文本生成式 AI 應用建立測試方法,針對 ChatGPT、DeepSeek 等聊天機器人,預計明年完成。同期,新加坡釋出開源工具 Project Moonshot 協助測試。

早期標準為初創和大企業提供護欄,讓它們有信心創新。負責人將這一過程比作建跑道——AI 創新像高效能飛機,沒有跑道就飛不起來。新加坡也藉此向國際社會證明自身定位,提升企業信任度。

完整字幕(原文整理)

字幕語言: zh-Hant · 抓取日期: 2026-05-02

歡迎回來。新加坡提出的人工智慧安全測試標準正在由來自全球250多位專家討論。這是國際標準化組織會議的一部分,參與者包括來自美國、中國、韓國和日本的代表。這是該組織首次在東盟地區召開會議。近100項人工智慧標準已釋出或正在制定中,是一年半前的三倍。鑑於人工智慧發展和應用的飛速進展,這些標準是必要的。在短短三年多的時間裡,我們見證了人工智慧從生成式AI發展到多模態AI,再到具備代理能力的AI。因此,標準工作必須跟上步伐。及早嵌入標準就像建設新的跑道。人工智慧創新就像一架高效能飛機,沒有安全且建造良好的跑道,其潛力將無法發揮。

早期標準為初創企業和大型企業提供了護欄,使其能夠自信地進行創新。Nicholas Ng 解釋了擬議標準如何使人工智慧系統更可靠,以及新加坡將如何從中受益。那麼,如何確保ChatGPT不會向你提供錯誤資訊呢?因為這正是使用生成式人工智慧系統可能帶來的風險之一,此外還包括對特定社會群體的偏見回答,或侵犯個人隱私等問題。解決這些問題需要測試,而如何進行測試是各國和企業一直在努力回答的問題,尤其是因為人工智慧模型不同於其他型別的軟體。它們擁有數百萬乃至數十億個引數,其行為的湧現更適合用複雜系統理論來理解。

想象一下沙漠。如果你只看一粒沙子,很難推斷出沙丘的位置及其移動方式等。這是由較小組成部分湧現出的行為。新加坡嘗試解決這一問題,釋出了一個名為“Project Moonshot”的開源工具,幫助測試過程,此外還採用其他方法尋找具體、明確且有效的人工智慧模型測試方式。國際標準化組織下設的人工智慧分委員會也在制定相關標準,已經發布了一些標準,例如評估此類系統的通用方法以及將軟體測試實踐應用於人工智慧環境。在新加坡,他們將重點開展兩項工作。第一項旨在規範人工智慧紅隊測試,即通過人員嘗試破壞產品來測試安全性。

例如,誘導模型生成不當內容或洩露資訊。另一項由新加坡去年提出,旨在標準化文本生成式人工智慧應用的測試方法。比如使用ChatGPT或DeepSeek的聊天機器人。定義這些標準解決了阻礙人工智慧開發者起步的問題,更不用說帶來其他更廣泛的益處。這將是一段艱難的旅程,需要完成大量工作,但絕對值得,因為我們認識到自己能夠為國際社會做出貢獻。當然,企業和商業機構也將瞭解新加坡在這方面的定位,這隻會增加信任度。

該標準包括關於建立基準測試以評估生成式人工智慧應用質量的指導,預計明年完成。

關聯影片