AI 治理与监管 · 2026-04-20 · 03:46

逾 250 名 AI 专家齐聚新加坡 共商全球测试标准

Over 250 AI experts gather in Singapore to set global testing standards

演讲者
CNA
亚洲新闻台报道
类型
行业领袖
来源
CNA

核心观点

新加坡提出的 AI 安全测试标准成为 ISO 国际会议焦点,逾 250 名来自美、中、日、韩等国的专家与会,这是该标准工作组首次在东盟举行。目前已发布或在研的 AI 标准近百项,是一年前的三倍。

关键要点

  • 逾 250 名来自美、中、日、韩等国的专家齐聚新加坡,参加 ISO 人工智能标准工作组首次在东盟召开的会议。
  • 已发布或在研的 AI 标准近 100 项,是一年半前的三倍,覆盖从生成式到代理型 AI 的快速演进。
  • 新加坡牵头两项标准:AI 红队测试规范,以及文本生成式 AI 应用的测试方法,后者预计明年完成。
  • 新加坡同步发布开源工具 Project Moonshot,帮助测试 AI 模型的偏见、隐私与错误信息风险。

内容摘要

新加坡提出的 AI 安全测试标准成为 ISO 国际会议焦点。逾 250 名来自美、中、日、韩等地的专家与会,这是该工作组首次在东盟召开。短短三年多,AI 从生成式发展到多模态再到代理型,标准必须跟上节奏。目前已发布或在研的 AI 标准近 100 项,是一年半前的三倍。

新加坡聚焦两项工作:一是规范 AI 红队测试,由人员主动诱导模型生成不当内容或泄露信息;二是为文本生成式 AI 应用建立测试方法,针对 ChatGPT、DeepSeek 等聊天机器人,预计明年完成。同期,新加坡发布开源工具 Project Moonshot 协助测试。

早期标准为初创和大企业提供护栏,让它们有信心创新。负责人将这一过程比作建跑道——AI 创新像高性能飞机,没有跑道就飞不起来。新加坡也借此向国际社会证明自身定位,提升企业信任度。

完整字幕(原文整理)

字幕语言:zh-CN · 抓取日期:2026-05-02 · 翻译日期:2026-05-02

欢迎回来。新加坡提出的人工智能安全测试标准正在由来自全球250多位专家讨论。这是国际标准化组织会议的一部分,参与者包括来自美国、中国、韩国和日本的代表。这是该组织首次在东盟地区召开会议。近100项人工智能标准已发布或正在制定中,是一年半前的三倍。鉴于人工智能发展和应用的飞速进展,这些标准是必要的。在短短三年多的时间里,我们见证了人工智能从生成式AI发展到多模态AI,再到具备代理能力的AI。因此,标准工作必须跟上步伐。及早嵌入标准就像建设新的跑道。人工智能创新就像一架高性能飞机,没有安全且建造良好的跑道,其潜力将无法发挥。

早期标准为初创企业和大型企业提供了护栏,使其能够自信地进行创新。Nicholas Ng 解释了拟议标准如何使人工智能系统更可靠,以及新加坡将如何从中受益。那么,如何确保ChatGPT不会向你提供错误信息呢?因为这正是使用生成式人工智能系统可能带来的风险之一,此外还包括对特定社会群体的偏见回答,或侵犯个人隐私等问题。解决这些问题需要测试,而如何进行测试是各国和企业一直在努力回答的问题,尤其是因为人工智能模型不同于其他类型的软件。它们拥有数百万乃至数十亿个参数,其行为的涌现更适合用复杂系统理论来理解。

想象一下沙漠。如果你只看一粒沙子,很难推断出沙丘的位置及其移动方式等。这是由较小组成部分涌现出的行为。新加坡尝试解决这一问题,发布了一个名为“Project Moonshot”的开源工具,帮助测试过程,此外还采用其他方法寻找具体、明确且有效的人工智能模型测试方式。国际标准化组织下设的人工智能分委员会也在制定相关标准,已经发布了一些标准,例如评估此类系统的通用方法以及将软件测试实践应用于人工智能环境。在新加坡,他们将重点开展两项工作。第一项旨在规范人工智能红队测试,即通过人员尝试破坏产品来测试安全性。

例如,诱导模型生成不当内容或泄露信息。另一项由新加坡去年提出,旨在标准化文本生成式人工智能应用的测试方法。比如使用ChatGPT或DeepSeek的聊天机器人。定义这些标准解决了阻碍人工智能开发者起步的问题,更不用说带来其他更广泛的益处。这将是一段艰难的旅程,需要完成大量工作,但绝对值得,因为我们认识到自己能够为国际社会做出贡献。当然,企业和商业机构也将了解新加坡在这方面的定位,这只会增加信任度。

该标准包括关于建立基准测试以评估生成式人工智能应用质量的指导,预计明年完成。

关联视频