蚂蚁集团大模型安全解决方案“蚁天鉴”升级,新增智能体安全评测工具
世界数字科学院(WDTA)最新发布《AI智能体运行安全测试标准》提出将输入输出、大模型、RAG、记忆和工具五个关键链路与运行环境对应起来,分析智能体全链路风险。
“蚁天鉴”为蚂蚁集团联合清华大学共同研发推出的大模型安全一体化解决方案,确保大模型技术在安全可靠的环境中发挥效能,打造AI大模型的安全铠甲。“蚁天鉴”新增的智能体安全评测功能,正与WDTA标准框架契合。
大模型安全解决方案“蚁天鉴”新增智能体安全评测工具
MCP安全扫描功能,则为行业内首个对外发布的MCP安全扫描工具,可自动化识别AI工具集成与数据交换链路中的安全漏洞及风险行为,覆盖工具投毒攻击、间接提示词注入、恶意代码注入等3大类共10项子类风险。
蚂蚁集团机器智能部总经理、安全实验室首席科学家王维强表示:“升级的‘蚁天鉴’基于‘以攻促防’的安全理念,通过构建‘对齐-扫描-防御’技术栈,形成全流程防护体系,从而为智能体提供风险扫描与实时防御能力,我们也将与行业共建,未来逐步开源开放安全工具。”
据了解,2024世界人工智能大会上,“蚁天鉴”2.0发布,形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。
1、特朗普借泰柬冲突,把手伸向中国周边,拿协议当筹码,是在帮倒忙,特朗普终于向中国求援
2、人社微百科|职场新人入职,这些事项要注意!,新人入职需要准备什么
3、雅虎刊登了战后日本政府为老美占领军紧急设立的慰安所的事,爆点很多