科研进展缓慢怎么破?“开源”是个有效的新方式

2019-01-11 热点
一些研究者对传统科学进展缓慢、激励方式落后的现状非常不满。科学家需要空前的海量数据、新的方法。而依靠任何一家公司单打独斗是做不出来的。

这个领域需要彻底的改革,是时候将在软件开发中展示出强大能量的开源运动引入生物医学了。

越来越多的证据表明,开放科学是一种有效的工作方式。数据共享和协作为研究提供了更好的模式。

全文约3100字,读完约需6分钟。

2001年完成的人类基因组测序并未能如预期一般迅速揭开健康和疾病的秘密。然而,这项研究揭示出了一个事实:人体比我们所能想象的要复杂得多。疾病通常并非由一个坏的基因引起,而是由数十个或数百个在庞大的网络中相互支持和对抗的基因的细微变异引起。

这一发现让基因组学家肖特看清了现实。在肖特的同事兼前任老板弗兰德主导下,医药巨头默克公司已经在创建人类基因活动的大规模数据集上斥资了数亿美元,但现在,肖特和弗兰德二人都认识到这项工作还远远不够。

为了实现基因组学所蕴藏的一切潜能,科学家需要的不只是大量数据,而是空前的海量数据,或许要比资金最雄厚的药物公司所能收集到的数据还要多1000倍。此外,科学家需要新的方法、基础设施和人员来筛选这些数据。

“这些疾病过于复杂,依靠任何一家公司单打独斗,都不足以产生出如此大的数据量。”肖特说,“没有一家公司拥有足够多的聪明人来搞清楚这些数据。”

我们身处的生物医学大数据和机器学习的新时代需要新的研究文化。科学家们之间的合作规模需要更进一步,也要更密切地和患者携起手来,因为他们是丰富信息的源头。

然而,直到今天,生物医学研究仍然不是以这样的方式去完成的。学术研究者就像个体户,他们组建自己的团队,自筹资金,为了得到资金和业内认可而争得面红耳赤。生物技术和医药公司也小心翼翼地严守它们的商业秘密,唯恐在市场上遭受打击。

弗兰德和肖特认为这个领域需要彻底的改革,是时候将在软件开发中展示出强大能量的开源运动引入生物医学了。

医学研究需要新的机构来倡导协作和开放科学。为了获得科学家的信任,该机构必须是一个中立的研究召集人,它没有任何盈利动机,也没有知识产权需要保护。 

于是,弗兰德和肖特在2009年成立了赛智生物网络,这是一个小型的非营利组织。赛智的使命是变革生物医学研究。这家非营利机构起步于为开放科学开发实用的工具,例如建立可供科学家共享、分析和讨论大数据的数据库和平台。但是改革生物医学研究还需要重新思考协作中“人”的因素,需要用新的规则、实践和评定系统来鼓励共享。

一些研究者对传统科学进展缓慢、激励方式落后的现状非常不满。赛智对他们而言就像一块磁铁,吸引着他们去尝试新的科研方法,为未来建立新的研究文化播下了种子。虽然改变整个生物医学领域还有很长的路要走,但开放科学的有效性已经毋庸置疑。

行动:建立开放式研究模式
对赛智来说,首要的挑战就是要让研究者相信:数据共享和协作为研究提供了更好的模式。为此,第一步是建立公开共享数据,通过这个数据池去赢取新的合作者。

当时,弗兰德和肖特在默克公司创建的数据库是有关人类基因如何工作的最大信息源之一,它对研究者有很大的吸引力。默克公司考虑到和将数据留作私用相比,使用者贡献的额外数据和共同合作最终所能创造的价值会更大,因此同意将该数据库公开。其他符合条件的科学家可以获得这些数据,但前提是他们要贡献自己的数据。

提供种子数据只是一个开始,开放科学的流程也需要优化。赛智希望能够成为示范区,一个实践开放科学研究方法的实验室。“当你呼吁人们分享数据时,你必须建立起使用数据的标准和方法。”赛智的总裁曼格瑞威特说。

为了让科学家信任被公开共享的数据,每个合作者都要理解这些数据的来源,它的历史是什么,是如何被收集的,使用了什么样的软件产生数据模型,等等。而这些信息往往是缺失或者错位的。赛智在早期建立了一个信息平台,用于存储和公开重要的元数据,并记录其使用的有关信息。

赛智将正在搭建一个强有力信息平台的消息在科学家中广而告知,结果很快就卷入了一个有关结肠癌研究的难题中。

全球有六个主要的小组正在同时使用遗传信息对肿瘤进行分型,但这些小组之间并没有任何合作。2014年,四篇关于结肠癌的发表内容分别定义了一组不同的子类型,它们之间既不能进行比较也不能相互结合。赛智的首席科学家博特说,这个领域“一下子陷入了困境,对于这些子类型是什么以及如何处理它们,无法建立任何共识”。 

2015年,赛智开始帮助这些小组汇集它们的数据,并在全部数据上分别逐个运行六个小组的解释系统,达成了一致意见。赛智的做法成功了,并由此建立了一个可供其他结肠癌研究人员使用的共识模型。曼格瑞威特说:“这就是我们想象中的,当人们愿意合作时的完美场景。”

诸如此类的伙伴关系表明,鼓励开放科学既在技术方面存在挑战,也在文化方面存在挑战。“我们在运作的过程中明白了一个道理,只创造数据资源无法改变科学。”赛智的首席知识共享官员威尔班克斯说,“你会遇到协作、代理人和伦理道德等方面的问题。每当你试图构建共享的内容,就会有其中某个方面的问题阻止你。” 

威尔班克斯曾经通过知识共享系统参与过开放科学,他在2012年成为赛智的一员。当时,赛智正在加紧建设开放科学所需的社会工程,即建立有效的体系来培育信任关系,转变驱动机制,让研究者愿意去分享,而不是去囤积数据。威尔班克斯说:“我们必须为在不同地方工作的科学家们开发合作工具。这不是科学家们所熟悉的工作方式。”

大规模的合作也需要新的政策,例如如何保证研究参与者的隐私,明确研究人员允许和禁止使用信息的条款等。赛智为研究人员提供预先批准数据访问的途径,避免每当有新的数据可用时,研究人员都要耗费时间申请数据访问权限。大约70%的人希望将他们的数据广泛地用于研究,但大多数研究的文档并不是为了共享而设计的。

为了解决这个问题,威尔班克斯开发了一种新的知情同意协议,为研究参与者提供更多的信息和权力,据此可以了解他们的数据是如何被共享的。威尔班克斯说,赛智对协议版本没有使用限制,现在有数十种研究正在使用它,其中包括联邦精准医药项目“我们所有人”。这个项目旨在收集一百万人以上的综合数据。

罗伯特·伍德·强森基金会的首席执行官塔里尼说:“赛智的治理结构以及围绕知情同意权的法律问题都对开放式研究模式的建立提供了重要帮助。”

趋势:开放科学的愿景可能受到欢迎
目前,赛智已经主办或协助了数十个大型合作研究项目,主要研究课题是癌症,也包括阿尔茨海默病等神经退行性疾病。

赛智最近还启动了自己的名为“移动力”的首项研究,探索智能手机如何能为科学所用。在这项研究中,帕金森氏症患者在日常用药前后都进行常规的运动测试,通过智能手机的加速度传感器可以测量他们动作的变化,而手机麦克风能捕捉到他们声音的变化。因为患者可以通过手机应用程序注册来参与此项研究,而不用去诊所,所以研究可以从多样化的人群中获得信息细节,这在传统研究中很难做到。

这项研究现已有超过10000人注册。赛智最近公布了第一批数据,可供符合条件的研究人员使用。截至2016年6月,已有100多人申请使用。

很难说赛智是否成功地改变了学术研究的文化。即使在该组织内部,也并非所有项目都是完全意义上的开放科学。有一些数据被延迟发布,而有些合作伙伴的数据则从未被公开。曼格瑞威特说,这并不理想,但是这样的情况有其有利的一面,比如支持开发一个新的开源工具。 

但有迹象表明,赛智的开放科学的愿景可能开始受到欢迎。例如,2016年早些时候,比尔和梅琳达·盖茨基金会宣布,其资助的组织必须保证公开数据。像美国国家健康研究院这样拥有巨大权力的组织也正在一些项目中要求其代理机构之间进行协作。而“我们所有人”计划将其数据广泛地向科学家开放——这是开放式研究日益普及的另一个迹象。

最重要的是,越来越多的证据表明,开放科学是一种有效的工作方式。哈德逊是生物制药公司艾伯维的转化肿瘤学主任,他说:“推广开放科学最困难的地方就是让人们相信他们会从中受益,而且对科学有好处。总体而言,大多数人正在意识到这一点。”

文章来源:共益资本论

文章链接:https://gongyizibenlun.com/1801

作  者:

版权声明:

本文文字内容归本站版权所有,转载请联系编辑,加微信(id:yxtkhl-)
更多精彩,敬请关注微信公号“共益资本论”(id:gongyizibenlun)

返回顶部