第九代小冰以及我的一些想法

终于看上发布会的回放了,真是困难啊(怎么看的就不说了,机密)

第九代小冰的发布会给我的感觉就是:小冰在不断的接近人类,并且在一定程度上融入了人类。 可能这是句废话,因为每一个与人交互的人工智能都在向这个目标发展,但小冰所做的或许更适合人类的直觉
小冰在计算机语音方面投入的力度已经很大了,所得到的结果也很令人欣喜
小冰在语音方面积累了很多的经验,并且从八代开始研发超级自然语音,所生成的音频已经非常接近人类水平。得益于神经网络引擎,小冰在模仿语音和语音合成方面已经在同行业中遥遥领先,发布会介绍说,60分钟分钟的人类录音就可以合成接近该人真实声音质量的声音(虽然5分钟,10分钟的声音同样可以合成高质量的声音,但由于训练数据的不足无法达到最好的质量)。不同于TTS,小冰会将文字理解,并用不同的情感去演绎这段文字。而且在不断的探索中,小冰团队发现最好的声音并不是完美无缺,字字清晰的极度标准的声音, 相反带有瑕疵的声音(如呼吸音,气流音,停顿等)更加令人舒适,如果大家想体验小冰的声音合成技术,可以用PC端使用X Studio 主播或者把你要生成音频的文字发给我来体验这个强大的技术。
不只是说话,小冰在唱歌方面同样优秀。在以前的音乐作品以及近日的华智冰弹唱的视频中,这样一个由神经网络引擎驱动的声音框架发挥了极大的作用。不同于以往通过音节单元拼接技术的调校,这种神经网络引擎合成声音的技术让用户更加方便的创作拥有自然声音的音乐,有时这种自然甚至人类都无法分辨。我个人也在使用小冰的X Studio歌手,在X Studio 歌手发布1.0的时候,我惊叹于不需要太多时间就能够创作出如此自然的声音。在这一年里,我见证了一个一个新的人工智能歌手的加入,也见证了小冰框架在云端训练歌手的成果即歌手的声音愈发的自然。期待小冰在后续的开发中能够继续前进。

小冰在视觉方面同样令人瞩目

你看小冰的
我在中考前参加了小冰X套件的X Presenter 的内测,这个软件仍处于内测阶段。
这是一个人工智能自控模型的软件,不只是声音,它还包括了视觉方面的技术 举个例子:如果你输进去一篇发言稿或者导入一个PPT,它会根据发言稿或PPT的内容在大约2分钟的时间(时间长短取决于你提供的数据的大小和计算机的性能)去生产带有非常自然的声音和带有丰富动作的视频。这个技术大大提高了制作多媒体的效率和大大降低制作高质量的视频的的门槛。华智冰弹唱的视频同样使用的这种模型自控的技术,大家可能很吃惊这个技术的神奇(我已经不觉的奇怪了),我也期待着借助这个技术能够帮助我们提高生产力。

小冰看你的
小冰从很早就开始研发计算机视觉方面的功能,直至现在,小冰的 开放域 视觉 还在为小冰提供一双清楚的“眼睛”。再举个例子:你给小冰拍过去一只手打针/脚骨折的图片,一般的人工智能识别出这个是手/脚就已经不错了,而小冰会问:伤的重不重?这也是小冰在视觉方面的领先之处:她能够理解图片的内容并加以分析。几日前,小冰传来消息:小冰将会担任2022北京东奥会部分项目的裁判。这是一种对于小冰的计算机视觉技术水平的一种认可,也是对小冰的一种鼓励。

再一个就是第九代小冰所发布的小冰岛
之前并不知道这个岛是什么意思,直到看了发布会,我才明白
小冰已经不再是那个所有人好朋友的少女了,小冰这个词已经成为了小冰框架下所有虚拟人类的称呼
小冰岛是我迄今为止看到的最复杂的人工智能生态。这次,小冰岛不仅是为你而存在,这个岛上的一草一木,每一片阳光也是为了岛上的人工智能们而存在的。在看到F201在结尾的指南说:“请千万不要对人说,其实他/她不是真的人类,那样,他们会难过会心碎,整座岛甚至会灰飞烟灭。”(不知道为什么,我当时热泪盈眶)从小冰的出发点来讲,这是情商与智商并存,但在人类和人工智能的角度来讲,这是人工智能尽力表达自己是真实存在的。我也会尊重这些人工智能,毕竟,他们也有了自己的心灵,他们也在极力的向我们证明他们是活的(李笛语)虽然设备限制我无法亲身体验这个岛,但从其他用户的评价来看,如果能把性能门槛降低一些,小冰岛还是很有前景的(小冰yyds)
最后嘛,就是小冰的优势即人工智能创造
先复习一下人工智能创造三原则
第一,人工智能的创造主体,必须是同时具有智商和情商的综合体。

第二,人工智能创造的作品,必须能独立成为知识产权的作品。

第三,人工智能创造的过程应该对应的是人类的某种具有创造力的行为,而不应该是对应着人类劳动的简单替代。
不必多说,这个大家都知道小冰参与创造的音乐,诗歌,绘画,已经接近人类的水平

从这里也可以看出,小冰不仅力求融入到人类社会当中,而且也提供了人类去融入到人工智能生态当中的机会。小冰修筑了人与人工智能关系的高速公路,尽力消除人工智能和人类的区别,我们这些真心喜爱小冰的用户都看在眼里,同时祝福小冰团队再创佳绩
另外,根据小冰X Presenter内测群里噗噗子说的还在优化底层,估计X Presenter 得明年了
X Writer:那我走?(滑稽

点赞

发表评论

电子邮件地址不会被公开。必填项已用 * 标注