2019年11月5日星期二

Oct.14 2019 未来,诺贝尔文学奖获得者会是人工智能吗?

The Next Word
by John Seabrook

未来,诺贝尔文学奖获得者会是人工智能吗?

这篇文章讲人工智能写作机器。大概因为诺贝尔文学奖刚宣布得主,看完文章,脑中浮现的首先竟是这个问题。
刚宣布的诺贝尔文学奖获奖者:Olga Tokarczuk(2018)和 Peter Handke(2019)
我不知道大家在国内是否用Gmail。我自己常用。Gmail去年推出的“predictive text(文字预测)”功能,让写电子邮件更方便。

比如邮件最后常写的套话“I’m looking forward to hearing from you (期待您的回音)”。

使用文字预测功能,当你打出“I’m looking”的时候,Gmail就会主动用灰色文字显示接下来的“forward to hearing from you”。轻敲tab键,整句话便自动跃上屏幕,节省了打字时间。

使用者打字同时,Gmail的人工智能会根据当前输入的单词实时更新对接下来句子的预测。每当你输入一个新单词,它便重新分析、更新和处理整个过程。

比如“I'm looking”后你没输入“forward”,而是“for”,Gmail的预测也会立刻随之变更。​

Gmail的预测建立在分析使用者写过的所有邮件的基础上。你用它越多,它就越准。好像家里养了十年的猫,你瞪它一眼,它就知道露出肚皮撒娇。

比如说你写邮件十有八九会在最后写“I'm looking...”这句话。Gmail熟悉你的写作习惯后,在邮件尾巴输入“I'm”,屏幕上就会弹出整个句子。

不仅如此,它还会分析全世界所有Gmaily用户发送的所有邮件,统计跟随在每个单词后最可能出现的短语,为你提供建议。

所以,对英语是第二语言的人来说,文字预测功能不仅省时省力,还可以帮忙规范和更正语法,了解常用的英文用语。(若担心隐私问题也可关掉这个功能。​)

当然,Gmail的人工智能再便利,也不可能完全替代我们写邮件。它只能建议常用语,没法帮助写作者思考和创造。

在电脑物理性能全面超越人脑的时代,思考和创造可能将是人类唯二两项超越电脑的骄傲。

但现在,这仅存的骄傲也有可能被剥夺。OpenAI公司的人工智能写作机器GPT-2,有潜力成为人类写作者的强劲对手。

OpenAI是一家由多位硅谷大佬创立的非营利组织,目的是研究人工智能技术,将研究结果作为开放资源,以避免少数私有资本抢占人工智能先机而操纵世界(为吸引投资者,OpenAI今年改组为有限合伙制)。

OpenAI目前的成果包括今年在Dota 2中打败世界第一战队的游戏AI,以及让机器手自己学习操纵不同物体的软件程序。
OpenAI的机器手——看网上视频确实非常灵活
GPT-2是他们的又一个人工智能项目,目标是让智能机器写出和人写得一样好,甚至更好的文章。它本来预定今年2月发布,却被OpenAI推迟了发布时间。

推迟的原因,据OpenAI表示,不是因为GPT-2没达到预期目标,而是它写得太好了。好到让人无法分辨一段话出自人类作者之手,还是GPT-2之内核。

OpenAI担心,这会被人恶意使用,为本就甚嚣尘上的互联网带来更多麻烦。

开发人工智能有两种方式,一种是为机器设定一系列规则和程序,一种是让它自我学习。GPT-2采用的主要是后一种。

OpenAI给它“喂”了美国最大网络社区Reddit上包罗万象的800万篇文章。GPT-2从这些文章里学到如何遣词造句,连句成篇,最终写成一段有意义的话语。

目前,GPT-2的工作方式是由人给出一个开头,设定资料来源、写作字数和自由度,它便接着开头往下续写。

GPT-2还可以微调写作风格。比如给它输入亚马逊商品评价资料,它就能吐出一大堆像模像样的评价。

这就是OpenAI为何迟迟不愿发布GPT-2的原因。它的写作质量高过当前互联网评论机器人,运作速度和成本又远远优于人类水军。

万一运用不当,它可能让人们再也无法分辨互联网上的真真假假,扭曲大众对舆论的认知。
本文作者为了测试GPT-2的写作功力,要求研究人员喂给它《纽约客》自2007年以来发表的所有报道,看它能否写出《纽约客》风格的文章。

作者将《纽约客》1950年代发表的一篇海明威报道的开头输入GPT-2,让它续写。GPT-2续写的两段虽有不符合人类常识的地方,但整体看起来倒也像那么回事。

有趣的是,GPT-2在续写中提到了皮带、眼镜、香烟和意大利,这也是海明威报道原文中描写过的。虽然GPT-2没读过原文,它却不知为何创造出了类似的细节。

GPT-2还会假造人名、引言和对话,让文章看起来更真实。研究者说,他们也不清楚,人工智能算法如何创造出这些本不在其资料库中的文本。对人脑来说,GPT-2的数学运算太复杂,超乎我们的理解力之上。

不过,续写三、四段后,GPT-2的文字就渐渐变得不知所谓起来。还好还好,它的功力还没深厚到能真正写出《纽约客》长文。

但GPT-2已经很厉害了。作者将它生成的另一段短文发给包括OpenAI研究员和语言学家在内的许多人。只有一个人准确猜出短文中哪些由人撰写,哪些是GPT-2续写。

人的大脑含有上千亿神经元,它们之间的联系数以兆计。GPT-2的神经网络目前只有15亿联系,预期5年后,它可以达到人脑的水平。那时候,GPT-2会不会真能与人类写作者并驾齐驱呢?

我觉得完全有可能。很多人说,人工智能只是处理大量数据,挑选其中最优的方式来写作。它没有思考,就写不出真正的文章。

但我觉得,现实生活中,尤其社交媒体上,有多少文章是认真思考后的产物?有多少文章拥有自己独立的观点?大部分是跟风投机、人云亦云而已。

人工智能写这种文章并不难。如果这些文章算“文章”(不少这种文章阅读量之大,传播面之广,赞赏者之多……呵呵),那人工智能写的当然算。

再进一步想,独立思考不是凭空生成,而是一个人有生以来读过的书、遇到的事综合而成的产物。人工智能自我学习输入给它的大量数据,再选择它认为最适合的字句输出,这其中是否也包含某种“思考”呢?

想到我这个公众号。我通常先总结觉得文章有趣的部分,再加上自己的想法。人工智能做到这点应该毫无难度。
它可以模拟“我的想法”(只要分析我以前的文章,应该不难猜测我的想法),或选择它认为最优的想法。这种选择,或许算是它的思考?

要是让人工智能阅读和分析有史以来所有哲学、文学、历史著作,它会否写出同样美好的文字呢?虽然它欠缺亲身经历,也无法亲眼观察人类生活,但许多伟大的文学著作也并非来自作家亲身体验。

文学需要想象力。想象力建立在现实的基础上。人工智能在阅读资料库的基础上分析、组合与重建,假造出的人名、对话和细节,或许就是它想象力的雏形?​

如果人工智能写出有思考、有深度、有想象力的文字,说不定真有与诺贝尔文学奖获奖作品媲美的潜力。

最后发一段GPT-2写的诗。诗的第一句来自诗人T·S·艾略特的名句:“Let us go then, you and I,”,接下来都是GPT-2的自由发挥。
Let us go then, you and I,
and our friends who have been with us,
together with us, in the last days,
before our destruction and destruction of our country,
the great cause, in the name of liberty, of freedom and of justice!
不翻译成中文了,相信大家都能看懂。总觉得好像GPT-2正在代表人工智能发出心声呐!

没有评论:

发表评论