揭秘“超能”之“智能速记挑战赛”:灵犀机器人PK地球最强人类战队灵犀智能语音机器人
关注蓝字↑【小拆五笔教程】避免错过最新内容
本文短网址:
本文所有带下划线的蓝色字,均可直接点击跳转链接(http开头的网址除外,需长按复制)。
由、、、、主演的《超能聪慧》第二季第六集于2018年9月28日20:00播出。
虽然我已经做好了节目真实性的心理准备,但看完之后还是被震撼了。
综艺节目都是有剧本有剪辑的,同样的素材用不同的镜头可以塑造不同的人物,加上各种字幕、音乐、音效,导演和后期人员想让你看什么就让你看什么,很多明星参加的节目看过后都会找制作组道歉,你不知道节目录制时说的那些话,到播出时会被剪辑到哪里去。
但无论怎么剪辑,都不可能凭空“剪辑”出自己没说过的话。我们今天文章的重点不是“恶意剪辑”,而是“剧本”,以及有人为了出名、欺骗外人,在节目上胡言乱语。
《超能人》是。。电视台的一档综艺节目,以“。。智慧,超能人”为主题,与全国观众共同见证来自各个领域的“人机大比拼”。节目运用顶尖的人工智能技术,向观众提出问题:“超能人”还是“不如人”。
。。现在的科技发展无疑是日新月异的,如果你想了解。。现在的科技发展到了什么程度,看看这个节目是个不错的选择,但是这里面的大多数剧本是绝对不可信的。
其他领域我不太了解,就不评论节目的其他话题了,但在打字领域,我也算是半个专家了。今天的文章只讨论本期的第一个话题,也就是所谓的“智能速记挑战赛”——灵犀机器人PK地球最强人类组。
由于版权限制,。。无法直接插入公众号,请点击左下角“阅读原文”观看我上传到哔哩哔哩的剪辑。。,也可以访问以下三个链接(选一个,只看02:24-12:38)。
腾讯:
爱奇艺:
央视网:
这10分钟的内容是我请了大名鼎鼎的E速记员打出来的,我会在相应的位置插入我的评论。
本文由易版编辑提供技术支持
朱广权:随着科技的飞速发展,大多数人都使用电脑、手机来录入数据。虽然电脑输入比手工输入效率高很多,但有时还是跟不上人说话的速度。今天人工智能给我们带来了一种全新的录音方式。下面我们请极智的。。上台。
解说员:聊天、写作、录音,人们80%以上的时间都在与语言文字打交道。有数据显示,平均打字速度为每分钟70个字,远低于每分钟200个字的说话速度。这意味着我们经常要花费大量时间在文字录入上。灵犀机器人融合了语音识别、文本翻译、神经网络翻译等多项技术,解放双手,让打字变得像说话一样简单,大大提高工作效率。
王从刚:我是王从刚,我要用我的心灵连接,照亮。。智慧。(全场鼓掌)
本期的第一场“人机PK”是推广。。移动与科大讯飞联合推出的智能语音助手“咪咕灵犀”。语音识别当然是现在非常流行的技术,但短期内不可能取代键盘输入。详情可以参考我之前的文章。
朱广权:欢迎王丛刚,你好。
陆白:人家打字的时候,我听到声音,然后在大脑语言中枢识别出这个字,然后传递到运动中枢,运动中枢再传递到我的脊髓,再反应到我的手指上,这个过程至少要几百毫秒,那你打字的速度大概是多少呢?
王从刚:我们可以实现从听到文字到系统录制的过程在几毫秒内完成,可以实现每分钟400字以上的录制速度。
韩雪:那就是一秒七个字吧?
王从刚:对,你说话的速度有多快,它记住的速度就有多快。
韩雪:那400个字完全准确吗?
王从刚:如果不进行修正的话,它的准确率在95%左右。
灵犀(包括其他的语音转文字解决方案)可以达到95%的准确率,乍一看好像这个准确率很高,但是你可以想一想,如果你打1万个字,错字大概会有500个,就算这500个错字都是双拼词,也会有250个错误,而这250个错误完全是随机分布在这1万个字里,找出来并纠正它们所花的时间,并不比在键盘上重新打出这1万个字所花的时间少。创始人杨毅先生也说:如果准确率低于95%,纠正的时间可能超过打字的时间。原因很简单:你需要做两个判断,两个信息源来确定这件事情。而听打字只需要听他自己的部分,通过我们的信息去获取。 你去批改的时候,既要听他打的字,又要看已经打出来的字,还要一边操作速记机,这个还是很有难度的。
韩雪:太棒了。
朱广权:刚才陆白老师介绍了普通人的打字速度,但是我们挑战灵犀不能只找普通人,我们在全国找了五个打字冠军,他们的准确率基本都在95%到98%左右,你有信心吗?
因为《超能少年》这档综艺节目的规则是“人机PK”,所以光让机器人展示语音识别能力是不够的,还需要找几个能力相同的人类来“补位”,所以节目组需要找几个“打字冠军”来和机器人PK。
怎么找到他?百度搜索“打字冠军”,节目组找到了2016年靠作弊拿下比赛冠军的于大师(也就是节目里的黄振宇,作弊详情请点击本公众号底部菜单,没看过的请一定要先看,了解于大师是怎样的人)。
于大师怎么能不抓住这个机会提升自己的人气呢?于是,他按照节目组的安排,邀请了文章开头提到的几位自己的“挚友”来参加节目。
至于节目里说的“95%-98%准确率”,我这样说吧:我们看打字,准确率是100%,因为错字是可以改的,所以我们不看准确率,只看“改正率”,也就是:累计删字数/总字数。对于标准键盘打字爱好者来说,基本上不练习听写打字,因为标准键盘很难跟上说话的速度。如果用形码按照人说话的正常速度去听写打字,就算你是高手,也基本会漏掉一大半,准确率不会超过50%。具体可以看我以前写的一篇文章。
2018年7月,被节目组称为“地表最强”的五人两次赴北京参加《超智能》的录制(一次彩排、一次正式录制),9月28日终于播出。
王从刚:是的,我有信心。
朱广权:好的,请开放检察区。
旁白:(规则介绍)为了测试灵犀的语音输入准确率,主持人在一分钟内朗读一篇300字的文章,灵犀和五位打字冠军同时录下,并根据准确率进行排名,灵犀排名前三,通过测试。(全场掌声)
这次“比赛”只是为了给灵犀做广告,这本身就不公平,因为语音转文字已经是一个比较成熟的技术,灵犀能做到的事情,普通手机也能做到,没必要设计成那么大一个“机器人”,只是为了呈现一个好的舞台效果而已。
边听边打“每分钟300字,一分钟长,难度和节目里一样”的稿件,是人类无法完成的事情。节目里这么难的文章,就算是顶尖的速记员,打八遍、十遍也未必能跟得上。李准的听写和打字水平,比台上的五位高出很多。连他自己都说,第一次只能跟上60%。
涂晖:大家好,我叫涂晖。
讲述者:2017年键盘打字冠军涂晖,已经打字15年了,他的中文打字速度为每分钟240-280个字。
吴琳琳:大家好,我叫吴琳琳。
讲述者:1994年键盘打字冠军吴琳琳,已经打字25年了,她的中文打字速度为每分钟260—300个字。
黄振宇:大家好,我叫黄振宇。
讲述者:2016年键盘打字冠军黄振宇,已经打字18年了,他的中文打字速度为每分钟260-300字。
余万清:大家好,我叫余万清。
讲述者:2008年键盘打字冠军于万清,已经打字13年了,他的中文打字速度为每分钟260—280个字。
金一航:大家好,我叫金一航。
讲述者:2015年度键盘打字冠军金一航,已经打字12年了,他的中文打字速度为每分钟240-280个字。
其实每个人在自我介绍里都说了很多,但是为了节目紧凑,就只留了一句话。而且为了节目效果,打字冠军的年份是随便写的(冠军年份肯定是于老师定的,最假的是吴琳琳,她打了25年字,1994年是24年前的事了,也就是说她只打了一年就拿了全国冠军,哈哈)。速度是真的,但请注意,是他们的【看书打字】【简单文章】【看稿子】的速度,三个条件缺一不可。至于节目里展示的【听书打字】【难文章】【生稿子】的速度,五个人中没有一个人的速度会超过150。当然不是说这五个人的水平不行,事实是没有人能做到。 “以300页的速度听写并输入高难度文章原稿”是连人类极限都无法达到的水平。
朱广权:面对我们五位打字高手,我们灵犀能成功吗?请我们机智见证团的三位嘉宾大胆预测一下。
鲁白:我先问你一下,你最快的说话速度是多少?
朱广权:我每分钟讲300个字以上是没有问题的。
陆白:我刚才听了五个打字员的速度,基本上都是接近300个字,而我们的人工智能语音识别的速度可以达到400个字,我觉得这个是非常智能的。
撒贝宁:刚才有两个人说,他们能达到300的极限,那在训练当中,有多少比例的人,能够达到300这个最高速度呢?
黄振宇:只要我发挥稳定,基本上想拿300分就能拿。
陆白/撒贝宁的提问,朱广权/黄振宇的回答,都是提前排练过的,不是即兴的,都是有剧本的,按照剧本演就行了。这没什么不对,综艺节目都是这样的。
不过余大师这么牛逼,也只有他能做到,请注意他说的300是听生剧本的速度,要是被我们群友看到了,岂不是给自己带来厄运?
撒贝宁:所以如果300对于他们来说不是一个难题,而准确率是我们验证的第一标准的话,我觉得我们在这方面可能不如别人。
韩雪:我现在好迷茫,因为跟人类相比,机器最大的劣势就是语义识别,语义识别取决于你读的文字的难度。今天我们一起为人类站出来吧,加油,台上的五个人,这次我支持你们。
韩雪的话很有道理,打字圈有句名言:只谈速度不考虑难度,就是耍流氓。速度直接关系到文章的难度,比如《心之出口》和《芙蓉女儿挽歌》,根本就不在一个层次上。
这五人在介绍自己的打字速度时,只字未提文章难度、文章长度、是否打过草稿等关键因素。当然,如果给他们时间,他们会向观众解释,但这只是一档综艺节目,剧本不允许你说这么多。
撒贝宁:接下来我们为朱广权倒计时五秒,五、四、三、二、一,第一轮验证开始。
朱广权:如果我们回到古代,古人能听懂我们说的话吗?答案是否定的。因为古汉语的发音经历了三个变化时期,分别是西周到汉代的古音、南北朝到唐代的中古音、宋代到清代的近代古音。三个发音差别很大。比如“青青子衿”这个句子,古音读作cencencilonggelong,中古音读作cengcengcigei。
这一段的语速非常快,就算请了速记员(导演怎么会懂速记?反正他在百度上找到了“打字冠军”余石,这就够了),差别也不会太大。毕竟都是假的,都是套路。可悲的是,只有业内人士才能看得见这种“表演”,绝大多数人肯定不知道。。。
朱广权朗读的这段话,如果出现在正常的。。上,没有一个速记员能够完整地记录下来,因为这超出了大多数人的知识范围,很难听懂。速度太快,根本来不及反应。灵曦更是离谱。以我对语音识别领域的理解,朗读时只要每句话替换几个词,就保证错,因为这个内容是低概率方向,没有哪个图书馆会这么做。只能提前准备(完全对应),这是作弊。导演选这个内容真的是为了艺术效果,显示他的“门外汉”!后面残障人士的讲话更是假,很多没用的发音。灵曦都不敢反应过来,简直是神级。
灵犀是科大讯飞开发的,而科大讯飞前段时间深陷“(←点击了解,想了解更多请到知乎搜索)”丑闻,因此本期《超智能》出现造假现象也就不足为奇了。
小禾双拼大师苏力:看的时候没注意,后来想想,觉得哪里不对,这300字/分钟,分明是打字(边看边打字)的速度,如果我没练过听力和打字,怎么会这么快就是极限了?
小何拼音大师,怒怼君子:。。里听到主持人的说话速度,我当时就震惊了,然后镜头切换到打字,看到大家打字那么从容,我又震惊了。就算我之前跟上速度,打那个古文的时候也会卡住。后来看到拼音的发音打出来了,还以为是事先练习过的熟悉的稿件呢。可能不是听着打出来的,只是看着听着打出来的。就像做报告整理数据一样,总得有点相似吧,但是这个节目整理出来的结果一点都不相似。说话的速度,打字的错误,明显不是真人现场打出来的,这应该是节目组自己整理出来的结果,如果让选手自己整理出来,应该会更相似。
开心熊:《超能者》每一集剪辑都很碎片化,基本上几秒就换一个镜头,连10秒的连拍镜头都没有。我个人觉得都是假的。每一集的AI都只是为了广告和骗融资而已。能做到50%,还敢夸100%,甚至200%。不只是我(于大师)这一集,所有都是大同小异,没有连贯性,都是假的。
王丛刚:我一听到古汉语的发音,就觉得机器可能出了问题,机器不知道什么时候是文字,什么时候是拼音,会误认为是文字。
“插入采访”是综艺节目最常见的剪辑手法,所以我也插入一个知乎的回答:
朱广权:用中古汉语读音是“cengcengcigei”。
涂晖:我听不清楚什么是古音、什么是近古音,但是我知道必须用拼音和字母来打。
朱广权:比如“青青子衿”这个句子,在古汉语中读作cencencilonggelong,在中古汉语中读作cengcengcigei,在现代汉语中读作cencensigei。不同朝代发音的巨大差异,主要是因为古代人的迁徙,比如西晋时期,胡人迁入中原,文化融合导致汉语的发音发生变化。而我们现在的普通话,并不是正宗的古汉语。这是因为满族入关之后,满语和明朝的吴语相互融合,满族人把这种融合语言叫做满清官话。满清官话本来只是满族人使用,后来逐渐在全国推广、普及,形成了今天的官话。
陆白:好,好。(全场鼓掌)
王从刚:主持人,录音结束了。
朱广权:搞定了吗?
撒贝宁:OK,灵曦完成了,不过准确率还得等大家一起来秀一下,从时间上来说灵曦明显是最快的。(吴琳琳、黄振宇、涂晖、金一航、余婉晴依次“按下完成键”)
五人“依次”按下完成键的镜头被分割开来,各自只展现了五人提交分数的瞬间。当然,按照剧本,五人“表演”和提交分数的顺序应该没有问题,但全程不剪镜头的话,秒秒肯定会露馅,所以只能这样剪辑。
撒贝宁:目前,五位人类选手已经全部完成任务,恭喜他们。
全文无标点275个字,有标点297个字,三段拼音全部当成四个字处理,主持人在一分钟内读完,最慢的余万清在主持人读完后17秒才打完,准确率还在90%以上。
真正边听边打字的时候,耳朵在听当前正在读的句子,手在打上一句。一句没跟上,就是漏打。这时候正确的做法是,果断放弃漏打的“上一句”,快速打出刚刚听到的“上一句”。人脑不是电脑,不可能把文字内容“缓存”17秒。以朱广权的语速,17秒能读出80个字。我们可以找任意一个打字高手做个实验,再找一个人读80个字,然后根据记忆打出来,看看准确率能不能达到80%。而且,这个实验中,打字过程中可以专心回忆,不用继续“听”。当然肯定有人能做到,但要达到“听后记住”的程度,就得是记忆大师了。
朱广权:我们先看一下用时最长的于万清,68秒,准确率92%,哇,92%。
撒贝宁:她打错了,是中古汉语的发音。关键是中间的那个“岑岑阁隆阁隆”。
安杰:因为那段文字我很陌生,又不是中文,所以我要切换到英文,把那段文字的发音打出来。切换输入法其实就一个键,但是会影响我打字的流畅度。
朱广权:我们看下一个,65秒,金一航。
撒贝宁:这个比较高,93.5%,主要是没有格隆。
韩雪:那我就放弃拼音了。
撒贝宁:是啊,也没出来。
韩雪:呵呵呵。
朱广权:我们看看下一个还没出来吗,涂晖,93.5%。下一个。
撒贝宁:61秒,天啊,哇。
陆白:哇,太厉害了。
朱广权:第一个,古读音他基本上就打出来了。
撒贝宁:但是这个青青子瑾,因为是诗经里的一句话吧?所以可能他可能不会立刻对这个词有反应。
黄振宇:在语速快的情况下,我觉得分数可以用几个速度区间来解释,比如180到240个词/分钟,我觉得我的准确率可以达到99%,甚至100%。但是如果你的速度超过240到300个词/分钟,准确率可能达到95%-98%。
余大师,你这么说难道一点羞耻心都没有吗?哦,绝对没有。你不但抢到了C位,还说第一名不是注定的。在节目里撒几个谎有什么错?
展锋透露,余大师不但要求自己做中心,还要求自己被指定为第一。以下是余大师和展锋的回应。
综艺节目内部决策很正常,承认就好,但于大师却不承认,他要维护自己光鲜的形象,不但不承认,反而故伎重演,抹黑我,这跟上次的“一模一样”。
另有知情人透露,节目组原本想让灵曦当第一,人类的排名是随机的,但于大师不同意,要求导演多给他戏份,要求自己当第一,灵曦当第二,并把规则改成“准确率第一,排在前三名机器就算赢”。
朱广权:我们再看看最快的吴琳琳,58秒,94%。(全场鼓掌)接下来我们再看看灵犀,看看准不准。哈哈,曾曾是聋哑弟弟,也是聋哑妈妈。
撒贝宁:聋哑弟弟和聋哑妈妈是母鸽子,最后实在编不出别的了,他们曾经……
韩雪:哦是的,不能切换拼音和中文。
王从刚:我们的系统没有录入拼音语料,所以对于汉字的识别率会比较准确。
撒贝宁:我想问一下灵犀有没有中英文混合模式。
王从刚:应该支持中文和英文,自动切换。
朱广权:有一位人类选手,准确率超过了灵曦,但是灵曦的时间是最短的。
撒贝宁:但是我们把准确性作为第一标准。
朱广全:是的。
撒贝宁:那么第一名应该是黄振宇,正确率为95.5%;第二名应该是灵犀,正确率为95%。
重点来了,我们来看看这六份成绩单,并进行比较:
▲余婉清(安洁)的成绩
▲金一航(思考)成果
▲涂晖(詹峰)成绩
▲黄振宇(余老师)成绩
▲吴琳琳(雨儿)成绩
▲灵犀机器人表演
发现问题了吗?我猜这些成绩单是节目组做的,故意改了几个字作为最后的结果。我们先不管他们听力和打字的速度能不能跟上,只看他们的成绩。
我们发现,几份乐谱中标点符号全部一模一样,每份乐谱中的句子断句方式也完全一样,每份乐谱中只有两个句号,且两个句号的位置也完全一样。我们来看看安洁的。。画面(亮度/对比度已处理)——
和上面安杰的表现图对比一下,我就不多说了。
我们来分析一下每个人具体的错别字,看看主任和于大师的造假水平到底有多低:
余晚清: ①“胡人南迁”被打成了“福人南迁”。余晚清和吴琳琳都是教育界的,五个人中普通话最好的。看文章的还是央视主持人,她怎么会把“胡”听成了“福”? ②“满人”被打成了“江人”。作为86级五笔高手,她不可能不知道“江”是第二个简体字,“满”是全码。如果是单词的话,“江人”绝对不会排在“满人”之前。更何况,安洁的词库里,没有“满人”这个词。 ③“融合”被打成了“融合”,连这个都听错了……
涂晖: ①“上古音”打成了“是古音”。“上”的编码是h,“是”的编码是j。两个键相邻,不可能是打错,因为文中两个“上”都打成了“是”! ②三个“满人”都打成了“猛人”,……不再解释。
黄振宇:①“移徙”被输入为“请选择中”,俞先生使用的86版五笔词典中这两个字重复,而且“请选择中”排在“移徙”之前。 ②“青青子衿”打印为“青青子今”。 ③“吴语”输入为“无语”。 这三个错误都是合理的。 考虑到余先生平时的所作所为,“为自己创作出最‘真实’的假乐谱”也是完全可以理解的。 (神秘微笑)
吴琳琳和金一航说的我就不解释了,跟余婉清和涂晖说的基本上是一个意思,大家自己看截图就行。
朱广权:现在我来宣布一下本轮比赛的结果,我们灵犀队顺利通过了考验,请我们的五位特级督察下台休息一下。
最后,让我们一起唱:
我正在尽力与你合作演出。
就跟超级智能里的分数一样,都是随机编出来的~~~