WAIC前线|声网发布新版对话式 AI 引擎,集成声纹识别、数字人与视觉理解功能
7月28日消息,2025世界人工智能大会(WAIC)上,声网正式发布其新版对话式 AI 引擎,该版本新增声纹识别、数字人与视觉理解三项核心功能,实现从“能说话”到“能理解、能共情”的跨越式升级,进一步拓展对话式 AI 在多模态交互中的边界。
据介绍,新版引擎引入声纹识别功能,可精准识别个体声音特征,有效区分多说话者并屏蔽背景噪音,为多用户并发对话提供技术支撑。
数字人能力方面,声网支持接入如商汤等主流方案,赋予 AI 拟人化表情与动作,适用于虚拟客服、教育陪伴等情境对话场景。
视觉理解功能则令 AI 能“看懂”用户环境与图像信息,支持拍照识图与实时手势识别,实现“所见即所说”。
在WAIC现场,声网同步展示了一系列搭载该引擎的 AI 硬件,包括 AI 毛绒宠物“芙崽 Fuzozo”、家庭陪伴机器人“赋之 EBO Air 2 Plus”,以及集成双屏/单屏对话式 AI 开发套件的玩具与教育终端,覆盖从儿童教育到智能陪伴的多样场景。(袁宁)
1、难怪汪峰二女儿不自信!从小就懂爸爸不能陪自己,每次就见1小时,汪峰女儿cici
2、今年北京检查检验结果互认惠及患者近70万人次 节约资金1900万元
3、斯诺克上海大师赛:张安达6-5逆转袁思俊,下轮对战丁俊晖,斯诺克上海大师赛前四名