当前位置: 首页 >  要文 > 正文

跨域复杂指令、免唤醒、抑干扰…长城汽车Coffee OS 2把语音场景摸透了|每日热闻

2023-04-13 19:59:01 来源:搜狐汽车

近日,在一场针对Coffee OS 2座舱系统的测试中,测试者一口气讲出了包含多领域、十意图的复杂口令。其中包括「播放陈奕迅的孤勇者、驾驶运动模式、空调风量3档,我想先去银行再去图书馆……」等完全不相干的指令,它们不仅均能被一一正确识别,而且识别速度也没有延时。


(资料图片仅供参考)

对于这款能够在语音交互上做到高阶水准的座舱系统,长城方面特意举办了一场公开课,来讲解其研发框架及原理。

「1+2=N」

所谓1+2=N,就是长城汽车Coffee OS 2以自研框架层作为「1个自研中间件」,立足App 和HAL这两个自研统一接口,可实现「N种硬件配置+应用服务生态」。这种底层架构让其向下兼容多种高算力平台,向上可适配长城汽车旗下各大品牌车型。

同时,Coffee OS 2配备了运行流畅的16G大内存、以及实现高速读写速度的UFS 2.1储存协议、可集成适配不同AI算法的千兆级以太网接口等硬件,以及座舱OS、自研语音、自研地图/导航、自研视觉算法等全链路软件。

通过这样的1+2架构,Coffee OS 2实现较快的软件研发周期,可快速适应市场变化,同时支持互联网和第三方开发者资源快速接入,能高效建立软硬件生态,具备快交付、可成长、可插拔、生态互换、软硬件兼容等特点。

对槽点的解决方案

智能座舱内卷到现在,有越来越多被人诟病的问题正在被逐步改善,例如后排乘员闲聊干扰驾驶员交互、多指令执行反应慢乃至遗漏、下达指令要先唤醒等等。

在本次公开课上,长城汽车针对这些车内语音交互常见槽点,同样进行了系列测试,验证Coffee OS 2在多指令执行、多音区识别、后排抗干扰、免唤醒、模糊指代语义理解等更高阶语音交互能力上均有所突破。

作为长城汽车基于V3.5平台打造的新一代全自研智能座舱系统,Coffee OS 2的语音产品规划覆盖全车功能领域控制与对话场景功能高达940个,包含车控车设、系统设置、导航、多媒体等各模块,并具备四大领先行业的语音交互功能:

瞬间响应Coffee OS 2仅需250毫秒的唤醒速度,远超行业第一梯队300-350毫秒的平均速度,毫秒级的响应速度也同样秒杀行业第一梯队1-1.5秒的平均速度;

多领域多意图指令精准识别执行Coffee OS 2可支持一句话包含多领域十意图复杂口令,行业超一流体验让语音功能操作变得便捷而高效;

后排抑制Coffee OS 2通过多音区声源定位,后排闲聊不影响前排语音交互,大大降低语音控制误报、漏报率;

语音车控Coffee OS 2具备超强的上下文理解和泛化理解能力,极限逼近真实口语习惯,全面领先行业。

此外,Coffee OS 2还拥有可见即可说、免唤醒、全双工多轮对话、车机闲聊、跨域知识上下文等多项行业领先的语音交互能力,并支持触控交互、手势交互、头姿交互等各种自然交互模式,为用户带来更便捷、更本能、更好玩的智能交互体验。

长城汽车Coffee OS 2搭载的车机和系统全部自研,不仅解决了智能座舱关键部件供货及成本问题,避免被外界“卡脖子”,还能够在长城汽车森林生态赋能下,将终端市场、产品与研发结合在一起,以用户需求为核心,以“1+2=N”高包容性、可生长性的架构为基础,持续升级进化智能座舱。

标签:

<  上一篇

下一篇 >