蚂蚁集团大模型安全解决方案“蚁天鉴”升级,新增智能体安全评测工具
7月28日,世界人工智能大会(WAIC)期间,在由中国信息通信研究院举办的“大模型智塑全球产业新秩序论坛”上,蚂蚁集团大模型安全解决方案“蚁天鉴”宣布升级,新增智能体(AIAgent)安全评测工具,具备Agent对齐、mcp安全扫描、智能体安全扫描及零信任防御等四大核心功能。
世界数字科学院(WDTA)最新发布《AI智能体运行安全测试标准》提出将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境对应起来,分析智能体全链路风险。
“蚁天鉴”为蚂蚁集团联合清华大学共同研发推出的大模型安全一体化解决方案,确保大模型技术在安全可靠的环境中发挥效能,打造AI大模型的安全铠甲。“蚁天鉴”新增的智能体安全评测功能,正与WDTA标准框架契合。
据介绍,升级的“蚁天鉴”在Agent运行阶段,构建了一套智能安全扫描系统,通过一系列专用工具来检测Agent可能面临的安全风险,实现端到端扫描,确保工具与 Agent 的交互链路不被篡改或绕过,为复杂环境下的稳定运行提供可验证的安全基线。目前,“蚁天鉴”的风险研判Agent准确率可以达到96%以上,并可支持11个行业的智能体测试。
蚂蚁集团机器智能部总经理、安全实验室首席科学家王维强在WAIC论坛演讲
蚂蚁集团机器智能部总经理、安全实验室首席科学家王维强表示:“升级的‘蚁天鉴’基于‘以攻促防’的安全理念,通过构建‘对齐-扫描-防御’技术栈,形成全流程防护体系,从而为智能体提供风险扫描与实时防御能力,我们也将与行业共建,未来逐步开源开放安全工具。”
据了解,2024世界人工智能大会上,“蚁天鉴”2.0发布,形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。
1、保险股飙升!人身险6月暴增16.3%,年内295款分红险新品上市,超去年八成
2、突发!居然智家实控人汪林朋坠楼身亡,5天前刚解除留置,汪林朋如何拿下了居然之家
3、37年前,释永信的师父释行正,曾在弥留之际向上级举报释永信恶行,释永信是什么职务