据统计,微信公众号每天发布文章约800万条,一个“王宝强事件”就能在“今日头条”产生10629篇文章。
每一个热点事件,都会产生成百上千的稿件。
然而我们都明白,一个人不可能阅读成百上千的稿件,在信息洪流下,我们搞明白事情的真相的成本却越来越高。
轰动一时的“王宝强离婚”事件,“娱乐圈内人”金星就在自己脱口秀中表示,所有文章中,只有4条信息真实的。但是,在今日头条、微信公众号等阅读平台,却产生了总计2.5万篇相关文章信息,10万+的文章数量超过1千篇。
信息越多,我们反而离真相越远,想快速了解王宝强事件的真相,我们最快的方式是去问问金星这样智慧的“圈内人”王宝强事件是怎么样的?
然而,热点事件太多,我们离她太远。
我们都痛苦
每天面对海量信息,我们都痛苦。
这周,百度新闻组织了一个闭门产品沙龙,邀请我们一同讨论这个痛苦,百度的新闻产品团队,技术团队一起思考各式各样的新型的新闻产品,希望有好的解决方案,而人工智能给了他们最大的启发。这或许是一个不错的解决方向。
在王宝强事件中,做个比喻,金星就像一个强大的人工智能,她有阅历(足够多的样本信息),有判断力(算法),自然能输出最准确的真相。
百度新闻产品团队就设想——何不尝试做个虚拟的“金星”,可通过对话获取信息的人工智能,让大众们通过询问它最快得知事件真相。
在国外,也有类似“对话新闻”的阅读产品Quartz,但Quartz还只能通过选择固定对话内容进行互动——像个带着互动按钮的新闻阅读器,Quartz给我推送了一条麦当劳巨无霸发明者去世的消息,我只能点“看下一条”(NEXT),或者“知道更多”(MORE)选项。
而百度新闻产品技术团队开发的新功能产品,能让用户直接输入各种开放式聊天内容,查找热点事情的真相脉络。估计也只有百度、Google等拥有强大的“语义识别技术+爬虫技术”的搜索巨头,才能做出实用度如此高的新闻聊天机器人了。
例如我输入“王宝强”,别的新闻APP可能搜出来的文章是一些《马蓉离开王宝强30万都付不起?》、《王宝强现身机场,潮衣名牌不见“傻根”》等离王宝强近况相去甚远的“垃圾文章”,要知道王宝强事件的近况,我得花不少精力从这些垃圾信息中寻找有用信息。而百度新闻“聊新闻”,却在1秒钟内准确的告诉我“王宝强马蓉离婚已三月…如今……”
虽然对信息的给予还不够好,但是我看到了人工智能通过聊天最快给于我真相的可能性。从时间、背景等维度,给我展示事件当下的情况。
人工智如何杀掉垃圾信息?
据百度自然语言处理部工程师介绍,百度是通过对新闻信息的分类,之后进行结构分析,通过信息特征学习等方法,实现自动为用户提供最核心的信息。
也就是说,百度新闻的人工智能,是在模仿人的思考,例如把“王宝强事件”相关的所有文章进行样本分析,把内容进行“标签化”区分,分割到最小维度,然后找出事件核心发展脉络,去伪存真,把掌握最真实的事件通过聊天的方式输送给用户。这就像创造了一个虚拟的“金星”,为你看了上千篇文章,然后经过分析整理,用几百字告诉你真相。
百度的算法团队认为,核心的内容本身有序的,聊新闻呈现的内容,是事件的核心内容,对于每一块核心内容来说都能够抽取一些关健词,关健词还可以为用户进行衍生阅读服务,例如了解事件的更多背景,例如“王宝强事件”对婚姻法感兴趣的用户,可以被推荐关于这个事件法律分析的深度文章。当对同一个事件有深度个性化需求的用户,通过人工智能推荐,可以对该事件做深度的外延阅读。
对话,或许才是人类获取信息的最初形态
百度聊新闻用聊天获取信息的方式,业内有一些产品经理认为有“逆用户习惯而为”的意味,但当我们拉长人类历史,会发现一直以来,对话式反而都是人类获取信息最简洁方式、有碰撞、直击问题,《论语》、《圣经》许多部分等都是对话式的。
自第一份现代报纸的雏形,1566年威尼斯不定期发行的“威尼斯小报”为公众分享商业信息开始,经过几个世纪的发展,现代人类已经越来越习惯用阅读新闻的方式获取信息。然而,在更早之前,我们更喜欢用对话的方式获取信息。
就像第一代iPhone诞生前,人们之前觉得“键盘”才是最好的人机互动方式,然而自然手势互动才是更早前人类最自然的人机互动方式。
1985年,《科学发现》杂志采访了“人工智能之父”明斯基,他认为人类是一种独特的足智多谋的动物,当人类思考某一事物时,你可能以语言表达的方式去思考,也可能以逻辑术语的方式去思考,或者是图表、图像,甚至是某种结构的方式。
而如今,百度新闻正试图用人工智能,完全颠覆我们几个世纪以来获取信息的方式,但按明斯基的理论,这或许并非激进,而是一种“回归”,我们其实能用各种方式获取信息,何不用更高效那个?我们需要站在未来看未来。
(文章来源:百度百家)
第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:houlimin
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。