您现在的位置: 今日要闻 时政

解码声音!声音转化成文字不是梦

发布时间:2016-12-09 11:14  金山网 www.jsw.com.cn 【字体:放大 缩小 默认
    现代快报讯(记者 胡玉梅 金凤 赵杰 / 摄)打开 GPS,你可以选择明星 " 周星驰 " 或者 " 林志玲 " 为你导航。你是不是以为是导航公司请了这两个明星专程录制的声音呢?如果你以为那真的是周星驰和林志玲的声音,那就错了。那是合成的!12 月 8 日,在世界智能制造大会智能制造前沿技术专题论坛上,科大讯飞产业投资有限公司总裁起东风做了《认知智能最新进展》的报告,他说,现在合成的声音想模仿谁就模仿谁,真假难辨。目前,他还在研发一款机器人,将来可以走进考场,去考大学。

" 声纹 " 未来将代替指纹 " 人工智能现在可火了,和基因技术、火箭一样热门。" 一开口,祁东风就讲起了人工智能的火爆。他说,未来又两大产业发展机遇,分别是:以语言为主,键盘为辅的人机交互时代即将到来,另一个则是人工智能像水和电一样进入每一个行业,深刻改变世界。说到声音,它有些什么奥秘呢?祁东风说,每个人说话都有自己的特点,不论说话声音的大小、口音、口语,给人的感觉等等,这些都各不相同。不同人的声音采集、合成后,可以灵活运用,甚至你都辨别不出来。" 人工智能合成声音经历了三个阶段,第一阶段是运算智能,这时候的合成声音,一听就知道是机器人的;第二阶段是感知智能,这个阶段人工智能合成声音像小演员,甚至比人讲的好,第三阶段是认识智能,人工智能合成声音也会理解和思考。" 祁东风说,每个人的说话声音都像指纹一样,这被称为声纹。声纹某种程度上可以代替指纹,将来在识别和间谍上是一场战争。把声音变成文字,记者更轻松祁东风说,他的团队里,一共有 1000 多名研发人员。这么多研发人员都是研究声纹的,通过研究,他们还可以把声音变成文字,而且准确率达到 90% 以上。 " 现在有很多文字工作者,尤其是记者,他们都很希望能够把采访对象的话,一下就能变成文字,这样就会轻松很多。而我们就做了这么一件很牛的事情,我们研发的软件,就可以把语音转化成文字,很多人测试使用了以后发现准确率非常高,90% 以上。我们还和最高法院合作。在法院庭审中,每个法庭都有速记员,他们的打字速度都非常快速精确,我们把语音转化成文字的系统,在庭审中试验,发现比速记员还快,准确度也非常高。" 祁东风说。不过,祁东风认为,人工智能和人类的关系,始终是 1:0。比如:人工声音识别系统目前还无法识别干笑、冷笑等,尤其是在情感方面,机器人始终无法超越的。(编辑 刘魏)

来源: 作者:  责任编辑:盛林娟
分享到:

金山论坛】 【打印】 【关闭
 
 
 
相关新闻