设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

探秘小米声学实验室

2019/10/31 12:41:26 来源:网易科技 作者:张楠 责编:远洋

在小米科技园举办针对人工智能的媒体开放日,网易科技也第一次近距离地接触了小米“神秘”的人工智能实验室。小米集团副总裁、集团技术委员会主席崔宝秋博士、人工智能部总经理叶航军博士、AI实验室主任王斌博士,介绍了小米在AI领域的自主研发技术成果、技术人才引进情况。

叶航军、崔宝秋、王斌(从左至右)

探秘小米声学实验室

首先我们来到小米声学语音实验室,可以看到,各种以小米智能硬件生态链核心产品小爱音箱为中枢,四周布满了供声学语音测试使用的硬件设备,据介绍,小米的智能硬件产品中,所有具备麦克风、扬声器的语音交互设备,都要经过这个实验室测试后上线。目前,小爱音箱语音算法已经做到由小米全部自主研发,在这个实验室中,以小爱音箱为代表的小米全系智能语音设备,均会进行远场、近场、灵敏度等一系列详细测试并进行调试,其中近场测试,主要针对手机进行。

图:小米声学语音实验室

据现场工程师介绍,实验室中的人工模型及扬声器等设备,均会高度会模拟日常的人声及环境音、噪声干扰等,其中人声的测试,机器可以分别模拟不同性别、不同年龄的声音并反复进行机器还原测试,而无需人工测试,既节省了人力成本,又可以保证精准的测试效果。在这个实验室中,工程师会在测试过程中发现算法中可提升的部分,并反馈给小米研发团队进行优化和算法调试。

图:小米声学语音实验室

不同于前者,进入与硬件相关的声学实验室后,马上会感觉有些安静的不适应,房间四周布满了锥形吸引墙,房间整体重量约70吨,用料极其奢侈。据工程师介绍,该实验室内部各个角落,都不会产生声音的回波,所有声音都会被锥形墙体吸收,因此理论上讲,房间内,只存在源头声音一个干扰源。实验室包括三层墙体,均为实心砖墙,主要作用为在绝对安静的环境条件下,对设备进行高灵敏度的测试,以便准确找到硬件设备各类极值。

图:小米声学语音实验室

据介绍,语音识别的顶层为云识别算法,但是在硬件设备底层,要极大保证设备的灵敏度,如麦克风对于声音的采集,只有这样,才可以在云端更好地进行算法识别,小米不惜成本地打造声学语音实验室,原因也在于此。

图:小米智能厨卫

接下来,在体验了包括智能客厅、智能卧室、智能书房、智能厨卫等以小爱同学为智能家庭中枢的小米全系智能家居场景后,可以很直观地感受到,小米AIoT,已经把之前描绘的未来智能生活场景完全变为了现实。

图:小米智能客厅

Daniel Povey选择小米的三个理由

Daniel Povey是全球公认的国际语音识别和AI领域知名教授、语音识别开源工具Kaldi之父。他于1993年到2003在剑桥大学度过了自己的高等教育经历,获得语音识别的博士学位。2003年至2008年,他在IBM研究院负责计算机语音识别的工作,并且获得了Research Staff Member的角色;随后在2008年到2012年,Daniel Povey在微软研究院参与计算机语音识别方面的工作。2012年,Daniel Povey加入约翰霍普金斯大学,担任语言和语音处理中心的副教授。

图:崔宝秋与Daniel Povey

2019年,Daniel Povey在长达两周的中国之旅中,分别走访了包括清华、北大等顶级学府,以及多个中国的头部科技互联网公司,但其最终选择了加盟小米,崔宝秋认为,第一是因为Daniel Povey已经了解小米“手机+AIoT”双引擎战略生态的强大,同时他十分清楚语音识别在“手机+AIoT”双引擎战略中所扮演的重要角色;第二,Daniel Povey在参观了小米公司总部后,了解到小米对于人才和技术的重视,以及具备大批优秀的工程师,以及这也是吸引Daniel Povey加盟的重要原因;第三,小米从云计算、大数据到今天的AI,对于开源的拥抱,也是吸引Daniel Povey的关键点。

崔宝秋透露,在与Daniel Povey谈offer的过程中,Daniel Povey对于其他入职大部分细节基本不关心,他最关心的是保证Kaldi100%的开源,而崔宝秋给出的回答是:对于小米来说,这根本不是问题。Daniel Povey入职当天,崔宝秋表示,无论对于Daniel Povey本人、对于小米、对于中国的语音识别届,今天都是很重要的一天。

人工智能技术已实现广泛产品落地

目前,小米人工智能技术实现了广泛的产品落地,比如AI相机、小米电视、AI音箱、MIUI、搜索推荐、IoT设备等,涵盖声学、语音、深度学习、视觉等各个领域,一句话概括,AI在小米已经无处不在。此外,据了解,小米还承建了智能家居国家新一代人工智能开放创新平台。

说到小爱同学,其语音识别技术包括声学和语音,严格来说,这是两个不同的技术领域,小米人工智能的声学技术包括:回声消除,去混响,声源定位,多通道降噪以及多种麦克风阵列解决方案;而语音技术则包括:唤醒,识别,声纹以及语音合成。目前,小米小爱音箱语音算法已经实现全部自主研发。

在参观后的采访中,叶航军介绍,在小米“手机+AIoT”的双引擎战略里,AI扮演了非常重要的角色。在手机上,对于用户经常使用的拍照功能,叶航军认为“目前在整个行业,手机相机研发有一个明显的趋势,就是人工智能的深度整合,具体来讲有两个方面,一个就是手机相机的软件化和算法化,之前很多手机相机的体验是靠硬件去做,但是最近这两年,一些领先的体验是通过软件算法实现。第二个趋势就是算法AI化,越来越多的相机算法从传统图像处理算法转变成AI算法。”

王斌博士则分享了小米AI自主研发技术成果,目前小米已经在声学、语音、视觉,NLP、知识图谱、机器学习6大方向取得一系列成果。此外,王斌还介绍了小米在视觉、NLP、知识图谱、机器学习等技术上的进展。视觉方面,自研的人脸识别、美颜、魔法换天、场景识别在多款手机上落地应用。小米已经打造了自己的NLP平台和知识图谱,全面支撑公司的多项内容业务。小米面向移动端的深度学习开源计算平台MACE(Mobile AI Compute Engine)一推出便受到业界的广泛关注,目前广泛用于公司的各项产品中。

公开数据显示,2016年—2018年间,小米在AI领域申请专利684项,列居世界第11位。在宣布“手机+AIoT”双引擎战略为未来5年内小米的核心战略同时,雷军表示,未来5年小米将在AIoT领域持续投入超过100亿元,综合人才、技术积累以及资金投入等因素,不难推测,相对于竞品,小爱音箱的线下场景优势依然具备提升空间。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

软媒旗下网站: IT之家 辣品 - 超值导购,优惠券 最会买 - 返利返现优惠券 iPhone之家 Win7之家 Win10之家 Win11之家

软媒旗下软件: 魔方 云日历 酷点桌面 Win7优化大师 Win10优化大师 软媒手机APP应用