■何积惠 编译
“谷歌”公司正在打造人类历史上最大的知识库。这个被冠以“Knowledge Vault”之名的知识库无需任何人工干预,就能自动搜集源自互联网的信息并将其整合成单一的事实库,内容涉及世界、人物以及相关对象。这种知识采集机制达到的广度和精度,正在日益成为各种便于机器人和智能手机理解人们对其提问的系统的基础。它有望让“谷歌”超越搜索引擎功能,像“甲骨文”(Oracle)数据库那样回答问题,甚至还能从新的视角来考察人类历史。
Knowledge Vault知识库,是一种存储信息以供机器和个人阅读的系统。如果说数据库处理的是数字,那么知识库应对的则是事实。
譬如你把“歌星麦当娜出生于何处”键入“谷歌”时,它给出的地点便采集自“谷歌”现存的知识库。这种现存的所谓“知识图谱”库是靠众包来扩展信息的,虽然眼下的规模仍大于Knowledge Vault,但只包含手动整合的源数据。相比之下,Knowledge Vault为“谷歌”提供的知识扩展既便捷又自动,而且速度正在日益加快。除了分析网页上的文本外,“谷歌”还能潜入网络表面底下搜寻隐藏的数据源,将原始数据转变成可用的知识片段。到目前为止,Knowledge Vault搜集的事实已达到16亿条,其中有2.71亿条被定级为真实性超过90%的“可信事实”。
指尖拥有全部人类知识的机器系统,其潜能体现在很多方面。据波士顿高德纳咨询公司的技术分析师汤姆·奥斯丁预测,最早面世的一款应用程序将是性能超越Siri和Google Now的虚拟个人助手。他介绍说:“2020年前问世的智能优先收件箱,可帮助我们从收到的众多电子邮件中遴选出10封最重要的,对其他邮件进行无需动手的处理。”
按相同的程序整理医疗症状的知识库,还能查找到与每个人的病历数据相对应的关联,从而达到监督和指导健康的目的。例如位于纽约的史隆凯特琳纪念癌症中心,目前已启用IBM的沃森系统进行癌症患者的管理。
大规模的知识存储除了改善我们与机器的互动外,同时还会成为提升增强现实技术的动力。一旦机器具备识别对象的能力,Knowledge Vault即可为任何佩戴头盔显示器的人提供他们在真实世界里关注的地标、建筑物和商务方面的信息。
目前,“谷歌”已能设法利用历史文本来跟踪某人姓名随着时间流逝被提及的频率,藉以测度例如爱因斯坦和达尔文谁的人气更高。如果添加的知识库掌握着无数人的性别、年龄和出生地,那么史学工作者还能追踪更多的深度问题。
基于对过去的分析和前瞻性推断而对未来作出精准的预测,可能是Knowledge Vault知识库不亚于“谷歌”的又一用途。巴黎国立高等电信工程师学院的数据科学家法比安·苏哈内克研发的一款数据驱动历史的版本,只要将名为YAGO的知识库同法国《世界报》的资讯加以结合,就能展现法国政坛的性别差距将如何随时间变化的趋势。
“作为全新的一代技术,它将极大地改变人们生活、娱乐甚至战争的方式。”奥斯丁感叹道。这恐怕也是“微软”、“脸谱”等世界上最大的技术公司步趋“谷歌”纷纷建立类似知识库的原因。
友情链接 |
国家互联网信息办公室 | 上海静安 | 上海秀群 |