实验室简介 科研团队 科研方向 科研成果 联系我们

实验室主要研发方向为:

  语音音频及智能媒体处理,语音及音频搜索和哼唱识别、移动设备和嵌入式平台智能人机交互技术、文本挖掘。近年来实验室承担了国家自然科学基金、科技部、广东省、深圳市、香港特区政府以及国外知名机构和企业的重大研发项目。在跨平台中文多媒体资源建设、语音识别核心技术和智能人机交互等方向在国内外具有领先水平。实验室是IBM指定的大中国区本领域华南唯一的供货商。实验室2006年被国际最大的数据媒体中心美国LDC认定为大中国区唯一的合作伙伴。

核心技术:
1.语音识别技术
(1)语音识别:嵌入式语音识别,非特定人语音识别,带口音自然语音识别;
(2)语音增强;
(3)嵌入式车载语音识别与交互;
(4)跨平台:Windows CE、Windows Mobile、Linux、Symbian、DSP、Android等多种平台语音处理软件和系统设计。
2.语音音频检索
(1)海量语音文件中关键词检出与定位;
(2)哼唱识别;
(3)实时或离线敏感词汇或语音片段检出与监控。
3.海量多媒体数据处理及资源建设
(1)海量多媒体数据加工处理;
(2)中文语音和音频数据标注、收集、处理的行业标准制定;
(3)数据处理支撑软件和系统
4.文本挖掘
(1)题检测与跟踪及可视化;
(2)意见挖掘及文本情感极性分析;
(3)商业实体提取及商业关系分析;