7月2日消息,2026科大讯飞智能交互生态发布会在深圳举行。会上,科大讯飞同步升级AIUI交互平台、AIUI多语种交互平台和机器人超脑平台三大核心平台,进一步完善从设备端到云端、从国内到全球、从语音到多模态的AI交互能力体系,为智能硬件和机器人产业提供大模型时代的全球交互底座。
据了解,AIUI交互平台迎来近年来最大规模升级,平台定位由语音交互平台升级为多模态AI交互平台。
在语音交互方面,AIUI交互平台支持低功耗唤醒能力,可在100MHz主频、140KB存储芯片上稳定运行,-5dB场景下唤醒率达到97%。平台还推出产品级定制唤醒方案,据科大讯飞介绍,仅需50人音频录音即可实现94%的综合唤醒率,定制周期由数月缩短至数周。
同时,平台升级双流VAD全双工能力,在高噪环境下,聆听误响应降低95%、播报误打断降低93%、交互抢答率降低85%。此外,平台开放100余种超拟人音色,支持轻笑、喷嚏等副语言表达,并支持基于Prompt生成角色音色。
多模态方面,AIUI交互平台融合云端VAD、意图分发、图像理解回复、图像生成智能体及视觉语言模型,支持语音生图、画面描述、风格化创作等能力。同时发布AIUI Code和声学检测工具,形成覆盖能力接入、开发调试和体验验证的开发闭环。
面向智能硬件出海需求,科大讯飞同步发布AIUI多语种交互平台。
据介绍,该平台覆盖40余种语言,英语唤醒率达到97%,小语种唤醒率达到95%,语音识别端到端全场景准确率达到95%。平台围绕个性化聊天、命令控制、知识问答、多语种翻译和多模态交互五大场景进行了端到端优化。
同时,平台已在新加坡、东南亚、中东、欧洲、北美等区域部署服务节点,并适配GDPR、CCPA、PDPA等国际合规要求,为企业提供一站式全球化AI交互能力。
机器人超脑平台此次也完成升级,重点围绕机器人感知、理解和执行能力展开。据介绍,平台融合全景摄像头和环形麦克风阵列,实现360°全向拾音和视听融合感知,可在多人、高噪环境下精准锁定对话目标,并针对“鸡尾酒会”等复杂场景融合人脸识别、人体追踪、手势识别等多模态能力。
此外,机器人超脑平台进一步完善“通用能力+行业方案”体系,支持裸板接入、降噪板、封装麦板及多模态软核授权等多种接入方式,并面向陪伴机器人、扫地机器人、康养机器人、四足机器人及人形机器人推出针对性行业方案。
据科大讯飞介绍,目前机器人超脑平台已连接120家机器人客户和400家泛机器人客户。发布会上,搭载机器人超脑平台的专业级服务导览机器人Guide01同步亮相。该产品集成自主导航、实时避障和多模态感知能力,可应用于展馆、文旅、零售等场景,承担智能导览服务。
科大讯飞方面表示,此次三大平台同步升级后,AIUI交互平台实现从语音向多模态升级,多语种交互平台助力智能硬件全球化,机器人超脑平台则进一步推动机器人进入真实应用场景,共同构建覆盖设备端、云端及全球市场的AI交互能力体系。(易智)