计算机听觉感知平台
返回首页

听觉是人工智能的基本要素之一,是各种信息交互的重要而便捷的入口。

计算机听觉技术从应用角度主要体现为语音识别技术。语音识别可以应用于许多不同领域,现在使用最多的是移动互联网领域,可以直接把语音转换成文字,为用户解决了在小屏幕键盘输入的困难。在企业应用的呼叫中心领域,通过采用语音识别技术,自动化处理大量的客服重复性工作,例如语音分析、语音IVR导航等。

业界已经开展了大量计算机听觉技术的研究,工程实验室的核心任务是进一步发展该项技术,解决复杂场景和多人交互的语音识别问题。工程实验室将利用互联网优势,收集整理海量语音数据,利用用户的反馈信息,对互联网数据进行标注和筛选。具备了海量数据之后,工程实验室将利用平台优势构建大规模深度学习网络,并学习多元化的语音信息。在具体的网络结构上,将针对卷积网络 CNN 和长短时记忆网络 LSTM,捕捉语义结构的特性进行效果更好的拓扑结构研究。








首页| 实验室概况| 机构设置| 新闻动态| 研究方向| 共享服务| 联系我们
©2017 Baidu 使用百度前必读