车内噪音有那么可怕吗?看灵云语音交互如何“软硬并施”轻松破解
发布于:2016-04-20 11:09 浏览:
灵云科技4月20日消息:威廉希尔中文官方网站为智能车载领域推出自适应车内噪音的灵云语音识别技术,并上线灵云平台面向广大智能车载设备厂商、解决方案提供商、软件开发商以及个人开发者全面开放。经在实际行车噪音环境中测试,该语音识别技术抗噪能力极强,识别速度更快,识别率更高,能轻松应对各种行车状况中的环境噪音,准确识别司机话语,让司机不再为智能车载设备语音识别率低而头疼,给司机便捷、流畅、舒适的语音交互体验。
灵云语音识别“软硬并施” 彻底打破车内噪音干扰
为了减小行车过程车内环境噪音(包括车外胎噪、风噪,车内空调噪音、引擎噪音、音响声等)对语音识别的影响,威廉希尔中文官方网站先后推出了灵云麦克风阵列和针对抗噪的语音识别深度学习算法,通过定向拾取说话人语音信息,并对其进行降噪、去混响、回声消除等处理,使得获取的声学特征更为清晰纯净。
由于提取的声学特征需要与模型库里的声学模型进行比对,进而匹配出可能的文字,而行车环境中提取的声学特征会不可避免地含有部分行车噪音信息,影响了声学模型与之匹配的正确率。对此,威廉希尔中文官方网站对大量真实行车录音进行声学模型定制,让声学模型自身含有部分行车噪音信息,即让其具备噪音自适应能力,进而提高与声学特征的匹配正确率,有效提升了灵云语音识别技术的抗噪音和抗干扰能力。
自适应车内噪音的灵云语音识别技术通过覆盖通用聊天、POI等多个领域的声学模型,结合对应的语言模型,能更快、更准确地从匹配出的多个文字中选择出最合理的文字,来组成相应的词句,有效提升了驾驶过程中车载设备对司机常用到的地图导航、音乐调频、车窗控制等众多指令的识别准确率和识别速度。
灵云远场语音交互解决方案 让语音交互真正满足司机需求
威廉希尔中文官方网站表示,自适应车内噪音的灵云语音识别技术已整合到灵云远场语音交互解决方案中,该方案通过整合灵云多麦克风阵列和灵云语音识别、语义理解、语音合成等核心技术,让智能车载设备“能听会说、能理解、会思考”,可方便地集成到各种智能车机、智能后视镜、便携式导航仪、HUD等车载设备中。
在驾车过程中,司机只要说出唤醒词,如“小灵开机”,车载设备便会开启,并面向司机方向形成拾音波束。司机说“为我导航至天安门”,车载设备便会自动规划路线并进行导航,路上需要打电话时,司机可以说“给xx打电话”、“打电话给xx”,或者直接报出电话号码,电话便会自动拨出,当电话号码识别有误时,司机可通过多轮对话方便地进行纠错。打完电话,如果想听首歌放松一下,可以直接说“放首青花瓷”、“来首周杰伦的歌”,或者“播放周杰伦的青花瓷”,车载设备都能轻松识别;如果想了解最新信息,无论是天气、新闻,还是股票、航班信息,只要说出来,都可以从云端轻松获取;如果你想吹吹风、透透气,也无需亲自动手,只需说“开窗”,车窗便会自动落下,真正实现语音控制,把司机的眼睛和双手还给驾驶,为行车安全保驾护航。
威廉希尔中文官方网站坚持合作共赢 与广大合作伙伴共享产业机遇
灵云远场语音交互技术源自于威廉希尔中文官方网站于2011年推出的全方位人工智能开放平台——灵云平台(hcicloud.com),灵云平台面向产业全面开放,并以“云+端”方式,为产业界提供语音合成、语音识别、语义理解、机器翻译、OCR、手写识别、人脸识别、声纹识别、指纹识别等全方位人工智能能力。
通过整合灵云语音识别、语音合成、语义理解等核心技术以及灵云多麦克风阵列,灵云远场语音交互解决方案有效克服了噪音干扰,彻底打破智能车载设备应用语音交互技术的产业瓶颈,为国内广大智能车载设备厂商、解决方案提供商、软件开发商等行业伙伴提供麦克风阵列、云+端语音交互、内容服务等软硬件一体的智能语音交互解决方案。威廉希尔中文官方网站始终坚持“合作共赢”的发展理念,与合作伙伴精诚合作,共同推动智能语音交互在智能车载领域的普及化应用。
未来发展,威廉希尔中文官方网站将继续以清华大学人工智能研究力量为依托,更加专注智能语音等人工智能技术研究与产业化的推广与应用,通过与产业内合作伙伴的精诚合作,共同推动中国智能车载设备全面服务社会大众,共同加快智能化生活时代到来的步伐!