11月7日,新华社在84岁生日迎来了一位特殊的新员工——机器人“快笔小新”,并正式推出机器人写稿项目。“快笔小新”可以完成体育赛事中英文稿件和财经信息稿件的自动撰写。
消息一出,引起众多业内人士热议,人们担心机器人会不会抢了记者的饭碗,也有人对机器人写出的稿件质量表示怀疑。
其实,“机器人写稿”并不新鲜。美联社自去年7月就开始使用自动化技术报道公司业绩;今年9月10日,腾讯也发布了一篇署名为“Dreamwriter”的财经新闻,完成了国内公开露面的第一篇“自动化新闻写作”。
然而,当中国国家通讯社——新华社也正式推出机器人写稿项目时,人们还是再次被人工智能的高速发展“震住了”。
从图灵到阿西莫夫,人类对人工智能机器人的梦想始终未曾断绝。而在人工智能领域,有一件事情是被所有人认可的,那就是人工智能的出现势必会颠覆许多传统行业。但是谁也想不到,人工智能目前展开迭代的,却是人类最为主观的媒体行业。
究竟,机器人能不能代替记者?
混媒体圈的机器人
在财经信息稿件写作方面,“小新”得心应手。中证网内容总监李蔚介绍,“快笔小新”写市场行情的稿子越来越上手,从一句话的报盘到一段话的公司财报,再到根据“行情触发”写出“站上/跌破某某整数点位”快讯,进步很快
“快笔小新”上岗一周后,新华社总编室答复南方日报记者,“小新”仍然处于“热身”的试运行阶段。而从新华社早前的报道可以看出,“小新”上岗前测试表现突出,得到多部门的肯定。
新华社体育部发稿中心主任周杰举例,比如在中国足球超级联赛报道的写稿测试中,“快笔小新”能够生成中、英文数据消息,包括每轮比赛的成绩公报和积分排名,速度快、效果好。
在财经信息稿件写作方面,“小新”也得心应手。中证网内容总监李蔚介绍,“快笔小新”写市场行情的稿子越来越上手,从一句话的报盘到一段话的公司财报,再到根据“行情触发”写出“站上/跌破某某整数点位”快讯,进步很快。
据了解,新华社“快笔小新”写稿流程分数据采集、数据加工、自动写稿、编辑签发四个环节。技术上则通过根据各业务板块的需求定制发稿模板、数据自动抓取和稿件生成、各业务部门建稿编审签发“三步走”来实现。
根据新华社报道,整个系统从研发到上线,用了约半年时间。目前,新华社总编室已牵头制定机器人写稿管理规范,技术局已申报《一种面向短新闻的机器写稿方法与装置》《基于模板自动生成新闻的系统和方法》两项专利。
作为中国国家通讯社的新员工,“小新”甫一面世就再次引发人们对人工智能进入信息生成和传播领域的高度关注。因为在这个领域,人类主观作用依然巨大,却没有料到短短2个月,国内已有2个机器人能公开露上一手。
9月10日上午,腾讯财经发表这样一篇文章《8月CPI涨2% 创12个月新高》。文章最后标注:“本文来源:Dreamwriter,腾讯财经开发的自动化新闻写作机器人,根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。”
当中的“Dreamwriter”就是腾讯公司研发的写稿机器人,现就职于腾讯财经。“它其实是一套软件系统,准确说是基于数据和稿件处理的整体方案。”Dreamwriter项目负责人、腾讯财经主编刘康向南方日报记者介绍,腾讯公司于2014年12月开始筹划并建立数据库,2015年3月正式启动机器人写作项目,经过开发和测试约半年后,于2015年9月正式上线。
“从实际投入应用的2个多月来看,机器人写稿速度极快,理论上可以按毫秒来计算,也就是0.001秒这样的单位时间。”刘康说,今年10月Dreamwriter迭代至2.0版本,也逐渐应用于腾讯体育新闻的写作。
其实,混媒体圈的机器人在国外早已有先例,而且已经服役了一段时日。记者了解到,海外媒体圈在役的“机器人”目前主要分为两大类:一是由Automated Insights公司研发的WordSmith,美联社等媒体正在使用,其主要用于自动生产财报报道的数据内容,雅虎则采用Wordsmith这套系统自动编写足球报道。另一类则主要来自于媒体的自主研发,目的是为了优化媒体的编辑处理流程,使得媒体的工作更为高效、准确。比如,《纽约时报》数字部门科学团队研发的机器人编辑“Blossomblot”,它的主要职责并不是写文章,是辅助编辑挑选出潜在热文,以达到推送文章被“病毒式”传播的效果。据其内部数据显示,经过Blossom筛选的文章点击量是普通文章的38倍。
强大的“笔杆子”
“机器人写作的两大核心技术就是数据处理和人工智能。”美国Automated Insights是一家专攻利用机器人写作革新的科技公司,研发的自然语言生成平台Wordsmith为美联社等多家媒体制作“机器人新闻”。Wordsmith可以收集任何话题的各种数据,拿到数据后从中建立模型、趋势和寻找相互关系,最终由软件生成报道
“国家统计局周四公布数据显示,8月CPI同比上涨2.0%,涨幅比7月的1.6%略有扩大,但高于预期值1.9%,并创12个月新高。”9月10日早上9时30分,当腾讯财经发布Dreamwriter所写的新闻时,业界和学界都“炸开了锅”。
南方日报记者查阅网上刊发有关当期CPI数据的有关新闻发现,腾讯财经的这篇报道可能是最快的。国家统计局发布时间为9时30分,除了腾讯财经几乎同步外,其他大多数媒体的报道出现在9时32分以后。
“除了速度快外,这篇文章的导语十分标准,简单扼要,突出了最重要、最新鲜的事实。”暨南大学新闻与传播学院副教授麦尚文评价“这个机器人太聪明了”,“尤其是最后相当于橫比了12个月的数据,让这条新闻的价值更加突出”。
不用1分钟就能“妙笔生花”,机器人的笔杆子从哪里来?
“机器人写作的两大核心技术就是数据处理和人工智能。”美国Automated Insights是一家起步于2007年、专攻利用机器写作革新的科技公司,研发的自然语言生成平台Wordsmith为美联社等多家媒体制作“机器人新闻”,也是开发机器写作平台的先驱者。该公司副总裁Adam Smith告诉记者,Wordsmith可以收集任何话题的各种数据,拿到数据后从中建立模型、趋势和寻找相互关系,最终由软件生成报道。
南方日报记者查阅,该公司与美联社的实操性合作开展于2014年7月。从该月起,美联社在其采编方针下,利用Wordsmith自动撰写长度介于150字至300字的美国公司业绩稿件。比如,2015年1月28日,苹果发布2015年财年第一季度财报,没过几分钟,美联社的报道《苹果第一季度营收超华尔街预测》(Apple Tops Street 1Q Forecasts)就出炉。
“我们做的就是搜集公司公开盈利报告的数据,最终提供分析每家公司的发展情况、解析它们金融策略的报道。”Adam Smith说,过去美联社每季度约生产300条财报相关报道,而采用了Wordsmith系统后,现在条数达到3000条上下。
据其介绍,该公司目前拥有70多个客户,去年共生产了10亿多篇文章或报道,平均每秒能产生2000篇。
但对新闻报道来说,速度和数量并不是一切,准确更是新闻的要义之一。协助执行Wordsmith系统的美联社商业助理编辑Philana Patterson说,采编报道团队也曾怀疑算法的可靠性。初期,所有机器生产的文章都会经过人工审核,并把错误记录下来发给Automated Insights以改进算法。去年10月开始,美联社达成了全面自动化,所有机器生成的文章都不再经过人工干预。“经过大半年,自动写作系统记录下的错误已经比记者所写文章中的错误更少。”
然而,“机器人写稿”并不满足于此。尤其是“后来者”的研发,他们从一开始就注重数据的个性化搜集和服务。
比如,国内由腾讯公司研发的Dreamwriter今年10月迭代的就是一个个性化的实时多版本功能,标志着腾讯加快了推动个性化新闻的步伐。“Dreamwrter的写稿逻辑是,在达到触发条件时,系统自动从数据库调取数据,经若干计算模型做定量和定性分析并输出结论,根据算法产生自适应表达模板,完成多版本的个性化写作和推送。”刘康说,“未来我们可以为几乎每一个客户产出一篇属于Ta自己的个性化报道。”
让记者更专注
“我们希望记者不用只盯着数字,能写出更精彩有趣的报道。”Philana Patterson说,这套自动化系统并没有导致任何记者失业。相反,他们让记者有更多空间和精力对事件大局进行批判性思考
机器人写稿那么厉害,记者还能做什么?
今年5月,在Denny's餐饮公司的财报出炉后,美国国家公共广播电台(NPR)驻白宫记者、前商业记者Scott Horsley和机器人进行了一场写稿比赛。结果,Scott Horsley用了7分钟,而机器人只花了2分钟。
不过,NPR针对两者所写的文章进行了投票,结果,Scott的文章以压倒性胜利赢得质量上的比赛,扳回颜面。投票者普遍认为,虽然Scott的文章稍长,但语言轻松易懂。
事实上,在新闻学界看来,机器人写稿在基于大数据抓取的同时,也得益于部分领域的文章有其自有的模板结构。“像财报、体育新闻等,本身就有一定的格式,程序员透过代码,把抓取到的大数据融入客户预先编辑好的写作结构,就能形成客户需要的新闻报道。”华南理工大学新闻与传播学院副教授黄桂萍指出,从目前机器人所写的稿子也可以看到,多数稿子数据详实,但拼凑感较强,缺乏深度和思想性,有时逻辑感也不强。
对此,协助执行Wordsmith系统的美联社商业助理编辑帕特森Philana Patterson表示,美联社现在每季能自动生成3000个公司的财报报道,但会对其中部分公司进行人工跟进,包括故事的跟踪报道。比如苹果公司的财报就是由记者Brandon Bailey跟进的。“由于机器报道已经在第一时间公布了主要数据,所以他能够专注于一个角度,并把财报数据放在一些特定背景下分析。”
这样的结果也是应用“机器人写稿”的媒体们所乐于看到的。
“我们希望记者不用只盯着数字,能写出更精彩有趣的报道。”Philana Patterson说,这套自动化系统并没有导致任何记者失业。相反,他们让记者有更多空间和精力对事件大局进行批判性思考。
刘康说,腾讯研发机器人写稿项目的初衷也是希望解决人力问题,提高工作效率。“我们希望Dreamwriter能解放记者和编辑,让其专注于更具挑战和智慧的工作。”
新华社在推出“快笔小新”时就被普遍认为是新华社在互联网时代,推进业务与技术深度融合,更好履行国家通讯社职能的有益探索。
“以前夜间中超赛事需要有几个记者值班采写,而且一则成绩公告的短消息可能得花10多分钟,但‘小新’分分钟可以生成很多条,还不容易错,最后由编辑发稿人审发就可以了。”新华社体育部一位记者透露,“这就把记者从基础、繁重的工作中解放出来,有更多的时间采写原创和深度的稿件,我们对这样的技术革新都抱欢迎态度”。
■展望
好记者的饭碗不会被抢
事实上,随着科技和媒体的交互发展,一段时间以来,互联网已经消解了媒介作为“二道贩子”的职能。“对于新闻的粗浅加工即使没有机器人,也会由新闻源直接供给受众。”黄桂萍分析说,也就是说,新闻媒体作为传声筒的职能也许会随着技术的革新逐渐退化,但所提供的信息价值和文本审美功能却将会被“倒逼”着提升。
“只能说现在财经报道的门槛会相应更高一点。”国内一位财经报道资深记者并不认为机器人抢了她的饭碗,相反,她认为把数据搜集交给机器人,作为记者则可以专注于“数据的意义”,去完成分析性的文章,推动经济社会的发展。
“从这个层面来看,社会必定离不开记者”,她说,“而机器人也许可以看作是目前的‘实习生’,可以让我们的思考更集中,也更睿智,人工创造重新回到了更准确的定位上。”
不少学者和业内人士均认为,从目前来看,让机器人负责快速、全面、准确地发消息;让记者负责后续跟进和深入分析,不失为一种理想的新闻报道方式。
“但随着科技的不断进步,未来的机器人必将越来越智能,也会在更多领域发挥作用、代替人类工作”,黄桂萍也意味深长地说,如果人类总停留在百度搜索、谷歌搜索的层级,而丧失向下思索的能力,“那么机器能多快、多广地取代人类,这是我们自身必须要正视的问题”。
“快笔小新”写稿流程:
◎数据采集
◎数据加工
◎自动写稿
◎编辑签发













