crowdsourcing一词,中文译名“群众外包”,简称“众包”。前些年,“外包”一词及其概念在国内生物医药、软件开发、服务业等行业有应用,被认为是互联网带来的一种全新的商业模式或生产组织形式。
然而,近来“众包”一词再度趋热更多是和科学研究挂上了钩。据上月末的《自然》杂志报道,越来越多的自然科学研究领域甚至应用科学已经或正在和“众包”搭上关系,从数学难题的破解、蛋白质分子结构的确定到台风预报、科技成果转化等都受益于“众包”这种机制。而这已经是《自然》杂志在一个月内第二次就“众包科研”这一现象作专题报道。
——编者
把更多的“数学大脑”连接起来
走向网络的数学研究
受到在线公民科学运动的启发和激励,2009年1月底,英国剑桥大学数学家蒂莫西·高尔斯开始了他后来所称的“我的数学生涯中最令人兴奋的六周。”高尔斯在其博客上发布了一个深奥的数学定理,让他的读者们来证明,高尔斯的想法是,“如果一大批数学家能将他们的数学大脑连接起来,他们也许可以非常有效地解决一些问题。”
事实证明他们可以。在问题发布后几个小时内,高尔斯的博客上热闹非凡,数学家们发表着他们各自的观点和想法,你来我往,你争我辩,互不相让,好似一场头脑风暴大爆发。高尔斯本希望能借此获得一些对这个问题的新见解,但到3月间,在有了近千条评论后,他宣布这条定理已经得到了证明,这令他惊讶万分:“非常意想不到的结果,这是一个解决问题的实用办法,此外还有这一过程带来的一波又一波的兴奋感觉。”这个数学定理的证明最后以集体化名D·H·J·(博学者)的名义发表。
数学通常被视为孤独寂寞的研究领域,数学家通常在几乎与世隔绝的情况下默默无闻地工作多年。高尔斯的做法似乎与学术界固有的文化氛围相悖,因为在通常情况下,这些研究人员只有在发表论文时才会与他人分享他们的想法。
如今这种开放的研究态度已经在网上站住了脚跟,一个称为“博学者”的持续众包计划在网上已初具形态。在“博学者”的专门网站上,人们可以就一些新的数学挑战问题发表看法,进行辩论,如果他们认为这个挑战问题值得他们付出,就会提交自己的解决方案。组织协调“博学者”挑战问题之一的希伯来大学数学家吉尔·卡莱说,这种形式“对社会的影响甚至大于对科学本身的影响”。
“孪生素数猜想”的成功模式
加州大学洛杉矶分校的数学家陶哲轩认为,起关键作用的是“博学者”在网上的快速反应,“我们可以大大缩短数学领域热门问题的解题时间。”例如去年4月,新罕布什尔大学达勒姆分校的数学家张益唐称,他在解答素数理论中的一个重要的开放式问题上,已经迈出了一大步。这个问题就是“孪生素数猜想”,孪生素数是指两个相差为2的素数,例如,11与13,41与43,孪生素数猜想认为可能存在无穷对这样的孪生素数,这样的“孪生素数”是否有无限多?张虽然没有给出最后的答案,但已经将“孪生素数”的数目从无限多降低到了数百万。“博学者”对于想要接近问题答案的人来说,似乎是一个理想的工具。
这个被命名为“博学者8号问题”的素数理论问题,是去年6月间由陶哲轩协调开始征答的。在短短几个月时间内,全世界的数学家开始对张益唐的论证进行细化,在“博学者”的网站上讨论并回答彼此的问题,很快就将“孪生素数”的数目从数百万降低到了数千。到了11月,加拿大蒙特利尔大学的数学家詹姆斯·梅纳德借这股东风,将“孪生素数”的数目进一步降低到了600以内。
“博学者8号问题”取得的进展是这种网络合作方式的胜利,陶哲轩说,如果数学家以传统方法(即发论文)来攻克这类问题,可能要经历多年时间才能走到目前这一步。
合作带来更高的效率
互联网上许多最受欢迎的科学众包项目并不需要参与者具备高深的专业知识。例如,一个叫作“星系动物园(Galaxy Zoo)”的计划,是一个邀请大众参与、对宇宙中上百万个星系进行分类的在线天文项目。在2007年开始的第一年,就有超过15万名非专业人士加入了这项星系形态分类项目。
另一个名为“Foldit”的项目,则要求把确定蛋白质的最佳三维形状设计成一个游戏程序,让人们在游戏过程中不断调整蛋白质的三维形状,从而对生物科学作出贡献。以上两个项目都是利用群体的智慧,而不是少数专家的专业知识完成的;同时也都是以招募志愿者的方式来进行的重复性研究任务,在这些方面,人类的判断要远胜于机器的解决方案,这类众包项目可能会产生一些实用的解决方案。
2012年,一个由天文学家组成的研究小组发起了一项Kaggle比赛,名为“观察黑暗世界”,要求利用物质的引力透镜效应对背景天体的作用,绘制出暗物质在星系中的分布图,名列前三名的最佳算法提供者将获得由总部位于伦敦的温顿投资管理金融公司提供的2万美元奖金。这次比赛对于相关各方都是一个成功:获奖作品给天文学家提供了对现有算法约30%的改进;温顿投资公司以比通常广告和面试成本小的代价,从竞争名单中挑选招募到了新的分析师。
科研管理者亦可从“众包”项目中得到一些启示,例如开放的价值,对某个问题有任何想法的任何人都可以介入讨论,即使这些想法还不成熟,甚至有可能是错误的。
“众包科研”的过程是一种民主的对话,而不是一场竞争。而且不仅仅是破解或解决某个问题,更多的是人们在网络上分享想法。数学众包项目--“博学者”的协调者、著名数学家陶哲轩如此评述说:“在收集文献资料和与其他领域的人的交流方面,众包的优势是传统的同事间小范围合作交流无法比拟的。”
提高效率,有时靠的不是市场的力量,而是合作的力量。这正是“众包”科研带给我们的启示之一。
一家众包网站是如何运作的
高度发达的社交媒体为科学家推广成果提供了空间,一批如Marblar这样的众包网站应运而生。Marblar网站为科学家们发布他们尚未找到实际应用的科技成果,而网站会员,不论其背景,都被邀请公开讨论针对专利发明的可能性应用。Marblar网站上的每一条建议都发布在公开论坛上,旁边附有相关研发人士的采访录像及对他们工作的解释。网站的访问者可以提出科技应用的建议,也可以直接投票,而网站也鼓励专利的发明者参与讨论。受欢迎的应用建议能够通过一个积分系统辨识出来,有时还能得到一些现金奖励。
该项目吸引了来自知识产权集团(IPGroup)约60万美元的资金支持,IPGroup是一家位于伦敦的技术投资公司。Marblar网站通过收取平台使用费、获得赞助金来维持运作;如果应用建议最终被采纳而由此成立了衍生公司,Marblar网站可以为其提供招聘服务,有时甚至能够得到新的衍生公司专利使用费的一小部分。
该网站的主办人--英国牛津大学生物化学博士生丹·佩雷斯认为,“很多科研成果都被束之高阁,因为人们对其转化应用过程采用的方法不当。”他注意到,对科研成果转化的努力往往在大学科研转化办公室门口就停止了,佩雷斯希望,Marblar网站能够把对科研转化的咨询过程向世界开放。
佩雷斯说,Marblar网站用户最初将讨论30多项科研成果,主要由英国、美国的大学和研究资助机构提供。这些科研成果包括:可以操作纳米颗粒并使其变形的光镊子;一种可以通过电力线传输多个数据信号的设备;一种将特定分子通过抗体载体导入细胞病毒的技术等。
Marblar开始试运行的一个项目是,针对英国南安普顿大学的化学家汤姆·布朗提出的“在不使用生化酶的条件下,使用化学方法将脱氧核糖核酸(DNA)和核糖核酸(RNA)结合在一起”的实验构想,讨论其实现途径和方法。南安普顿大学科研转化办公室的亚当·阿尔文认为,试运行相当成功。他说:“起初我对此还是持怀疑态度,但现在可以看到Marblar网站为我们带来了很多有用的想法,对此我很感兴趣。”
佩雷斯指出,网站上受欢迎的科研应用建议,不但可以获得网站提供的奖励,而且可能得到更多机会付诸实践。例如,网站试运行过程中,最受欢迎的科研应用建议的提出者,正在与该成果研发者进行接洽,商讨开办公司研发绑定核糖核酸(RNA)的药物。
文/江世亮 方陵生 陈轶翔 编译