教师名录

俞 凯 特别研究员

主页: [点击这里]

办公室电话:+86-21-34207864

办公地点:SEIEE-3-539

电子邮件:kai.yu@cs.sjtu.edu.cn

实验室: 智能语音技术实验室、 上海市教委智能交互与认知工程重点实验室

  • 研究兴趣
  • 教育背景
  • 工作经验
  • 教授课程
  • 论文发表
  • 项目资助
  • 获奖信息
  • 学术服务

长期从事交互式人工智能、语音及自然语言处理和机器学习的研究和产业化工作。主要研究兴趣包括:

  • 概率图模型、深度学习、迁移学习、强化学习
  • 统计语音信号处理、语音识别、说话人识别、音频事件分析、语音合成
  • 自然语言处理、语言模型、语义理解、问答
  • 对话管理、交互控制、人机混合智能


  • 清华大学学士(自动化)
  • 清华大学硕士(模式识别及智能系统)
  • 剑桥大学博士(语音识别)


  • 剑桥大学高级研究助理(Senior Research Associate)
  • 上海交通大学计算机系特别研究员
  • 思必驰公司首席科学家

  • 《智能语音技术
  • 《机器学习》
  • 《深度学习及其应用》


  • 译著


  1. Yoshua Bengio 著,俞凯,吴科译。人工智能中的深度结构学习,机械工业出版社,2017。
  2. 俞栋,邓力 著,俞凯,钱彦旻译。解析深度学习:语音识别实践,电子工业出版社,2016。



  • 代表性论文


  1. Kai Yu, Zijian Zhao, Xueyang Wu, Hongtao Lin and Xuan Liu, Rich Short Text Conversation Using Semantic Key Controlled Sequence Generation, IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 26, no. 8, pp. 1359-1368, Mar. 2018. 
  2. Zhehuai Chen, Yimeng Zhuang, Yanmin Qian and Kai Yu. Phone Synchronous Speech Recognition with CTC Lattices. IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 25, no. 1, 86-97, 2017.
  3. Tian Tan, Yanmin Qian and Kai Yu. Cluster Adaptive Training for Deep Neural Network Based Acoustic Model . IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 24, no. 3, 459-468, 2016.
  4. Kai Yu, Kai Sun, Lu Chen and Su Zhu. Constrained Markov Bayesian Polynomial for Efficient Dialogue State Tracking. IEEE/ACM Transactions on Audio, Speech and Language Processing, vol. 23, no. 12, 2177-2188, 2015.
  5. Yuan Liu, Yanmin Qian, Nanxin Chen, Tianfan Fu and Kai Yu. Deep Feature for Text-dependent Speaker Verification. Speech Communication, vol. 73, 1-13, 2015.
  6. Kai Yu and Steve Young. Continuous F0 modelling for HMM based statistical parametric speech synthesis. IEEE Transactions on Audio, Speech and Language Processing, vol.19, no.5, 1071-1079, 2011.
  7. Kai Yu, Mark Gales, and Philip Woodland. Unsupervised adaptation with discriminative mapping transforms. IEEE Transactions on Audio, Speech and Language Processing, vol. 17, no. 4, 714-723, 2009.
  8. Kai Yu and Mark Gales. Bayesian adaptive inference and adaptive training. IEEE Transactions on Audio, Speech and Language Processing, vol. 15, no. 6, 1932-1943, 2007.
近年的完整论文列表参见:https://speechlab.sjtu.edu.cn/papers






代表性科研项目:

  • 国家重点研发计划项目,大数据驱动的自然语言理解、问答和翻译
  • 国家自然科学基金优秀青年科学基金,人机口语对话系统
  • 国家自然科学基金面上项目,基于深度学习的鲁棒口语理解研究
  • 上海市科学技术委员会国际科技合作基金项目,可扩展并具有自适应能力的自然口语对话机器人
  • 欧盟第七框架ICT项目,Probabilistic Adaptive Real-Time Learning And Natural Conversational Engine (PARLANCE)
  • 上海交通大学-思必驰智能人机交互联合实验室


人才计划:
  • 青年千人,中组部
  • 优秀青年科学基金,国家自然科学基金委
  • 东方学者,上海市教委
机构奖励:
  • 2018 中国计算机学会 “青竹奖”
  • 2017 中国计算机学会 “杰出演讲者”
  • 2016 《科学中国人》年度人物
  • 2015 上海市 “IT新锐奖”
  • 2014 “吴文俊人工智能科技进步奖”
优秀论文奖:
  • ISCSLP Best Paper Award 2016
  • International Speech Communication Association (ISCA) Computer Speech and Language 2008-2012 Best Paper Award
  • InterSpeech Best Paper Award 2010
  • IEEE Spoken Language Technology Best Paper Award 2010


  • Senior Member of IEEE
  • Member of IEEE Speech and Language Processing Technical Committee
  • 中国人工智能产业发展联盟学术和知识产权组组长
  • 中国语音产业联盟技术工作组副组长
  • 中国计算机学会语音对话及听觉专业组副主任
  • 中国声学学会语音语言、听觉及音乐分会执委会委员



联系我们 webmaster@cs.sjtu.edu.cn

上海交通大学计算机科学与工程系版权所有 @ 2013