新闻动态

我系俞凯特别研究员领衔完成的“面向口语教育的智能语音技术及云服务平台”获多家媒体报道

发布时间:2014-11-13

在刚刚落幕的第四届吴文俊人工智能科学技术奖颁奖典礼上,我系特别研究员俞凯老师领衔完成的《面向口语教育的智能语音技术及云服务平台》项目成果获得吴文俊人工智能科学技术进步奖二等奖,是上海科研人员此次获得的最高奖项,获得了媒体的关注。


《文汇报》报道原文(链接:http://whb.news365.com.cn/whshx/201411/t20141111_1423967.html


语音产业,大数据下一座“金矿” 
日期:2014-11-11 作者:沈湫莎 来源:文汇报

如果机器人能听懂人话,世界将变成什么样? 语音产业,大数据下一座“金矿”

■本报记者 沈湫莎

《连线》杂志主编凯文·凯利说,机器人真正的变革还没有到来,或许是因为人机交互的方式还没有彻底改变,大多数时候我们还需要通过打字或手写输入命令,如果机器人能听懂人话,世界将变成什么样?

昨天,21个项目获得了第四届“吴文俊人工智能科学技术奖”,其中上海交通大学和苏州思必驰信息科技有限公司合作开发的“面向口语教育的智能语音技术及云服务平台”获得进步奖二等奖,这个能听懂人话的平台以及背后携风雨之势而来的语音产业,或许预示着我们离“巨变”并不遥远。


互联网领域的“慢”行业

相比移动互联网行业的嘈杂,智能语音行业的发展简直可以用慢来形容,没有公关战、没有BAT领头、至今也没出现“船票”级产品。然而,上海交通大学智能人机交互研究所的研究员俞凯,前年在广东湛江做的一个试验,分明让人体会到了语音产业的进步。在这个实验中,一台机器人和几十位老师分成两组,分别为相同数量的学生的英语口语打分,结果显示,机器人打分抽查满意度98%,与教师组一致率为99.8%。

机器人的优势还在于速度,俞凯说,如果按湛江11.7万考生参加英语口语测试计算,需要100位老师忙活12天,但用上机器人,只要2天。

目前,能提供这项语音服务的除了俞凯所在的上海交大,还有脱身于中国科技大学的科大讯飞,后者作为中国最早出现的语音类企业,却没有及时发展成一家互联网企业,事实上,这个圈子中的大多企业主要营收仍然来自软件授权,因此这些年并没有出现爆炸式增长。

不过,中国工程院院士、中国人工智能学会理事长李德毅却直言,“慢”并不会持续太久,语音类产业必将迅速崛起,这是大数据的下一座“金矿”。


将出现颠覆性的成果

机器人是怎样为学生打分的?其实他们只是事先学习了各位老师的打分方法:将某位老师的全部打分记录灌入机器人的“大脑”中,它就能分析出这位老师的打分习惯,当机器人的“大脑”中存储了多位老师的“习惯”后,它就能代替老师打分了。

这个过程有点像某家语音企业让机器人“学习”了邓丽君的所有歌声,再以邓丽君的方式唱出新歌,又或者和英国影片《黑镜子》中的那样,当某人在社交网站上留下了足够多的可供“学习”的音频,当他去世后,他的家人就能用软件合成他的声音以供慰藉。

俞凯透露,仅就机器人英语能力评估领域,目前的市场规模就在十几亿,而在语言识别、合成以及情绪和重音的识别技术都已成熟的情况下,他正在努力开拓更多新市场。


让机器人更“人性化”

中国已成为世界最大的机器人市场,但去年也只销售了3万多台,新松机器人自动化股份有限公司总裁曲道奎说,工业机器人的市场其实有限,现在全世界的眼光都盯着家用机器人市场。

要让机器人走进家庭还得更“人性化”,除了更精准的红外定位、更灵敏的传感器外,语言识别是给人们带来良好体验不可或缺的因素。

俞凯在手机上打开他们研发的一款名为“语音输入板”的APP,当某人的话音刚落,语音就转换成文字在屏幕上显示出来,这款软件能够做到自动收集人们的表达习惯,从而形成更高的辨识度,当移植到机器人上时,机器人就能更好地识别主人的指令;另一方面,当越多人下载这款APP,收集到的语言信息形成的大数据平台,也将为后期的产品开发带来便利。



解放网报道原文(链接:http://www.jfdaily.com/jizhe/201411/t20141110_946535.html):

吴文俊人工智能科学技术奖揭晓

来源: 解放网 | 2014-11-10 23:07 | 作者:俞陶然

今天下午,中国人工智能学会发起、以吴文俊院士命名的第四届吴文俊人工智能科学技术奖在沪揭晓。共评出成就奖1项、创新奖7项、进步奖13项。其中,上海交通大学智能人机交互研究所研究员俞凯领衔完成的“面向口语教育的智能语音技术及云服务平台”获进步奖二等奖,是上海科研人员此次获得的最高奖项。

俞凯介绍,语音交互机器人技术近年来发展迅速,在微信公众号等网络媒体中已有广泛应用,能听懂人的自然语言,并予以反馈。这类机器人在英语口语考试中也大有用武之地。俞凯团队与苏州思必驰信息科技有限公司合作,研制出一种机器人考官。它能利用数据库存储的英语口语大数据,对考生会话的语音、语调进行比对分析,并判断其会话内容与考题是否吻合。分析产生一系列数据后,机器人通过映射函数,能对考生给予评分。

机器人考官已应用于湛江市中考的英语口试,与教师考官的评分一致率达到90%。俞凯解释说,所谓“一致”,是指机器人给某个考生打出的分数,与多名教师考官评分的平均值相差0.5分以内。实践表明,机器人考官在评分的准确性上,超过教师考官的平均水平,在评分效率上则远超教师考官。据统计,80万中考考生参加英语口语考试,需要100多名老师工作一周以上,而机器人考官在2天内就能完成评分。随着口试在我国各省市英语考试中的推广,语音机器人将拥有更大的展示舞台。

联系我们 webmaster@cs.sjtu.edu.cn

上海交通大学计算机科学与工程系版权所有 @ 2013