预印本平台打开了“潘多拉魔盒”,AI能否弥补缺陷?-深度-知识分子

预印本平台打开了“潘多拉魔盒”,AI能否弥补缺陷?

2020/05/12
导读
当学术发表中大量“水文”出现时,AI或许能够帮我们甄别论文的好坏

当学术发表中大量“水文”出现时,AI或许能够帮我们甄别论文的好坏,图片来自sciencemag


撰文 | 秦芳菲

责编 | 叶水送


新冠疫情让大部分研究者的科研工作停滞,但也带来了大量的关于新冠病毒的研究论文。据《自然》杂志报道,有关新冠病毒的研究文章,以每两周翻一倍的速度在快速增加,且没有任何减缓的趋势。


近日,《经济学人》的一篇文章则称,有关新冠病毒的论文喷涌,得益于预印本平台 “放水”。


此次新冠疫情,预印本平台bioRxiv 和 medRxiv发表的新冠病毒研究文章数量最多,总共大约3000篇,它们的宗旨是:“研究结果尽快发表,这对政策引导和加速科研成果会有帮助,进而影响疫苗以及治疗方案的开发”。


新冠病毒相关预印版文章,图片截自nature.com


然而,预印本论文未经同行评审,就发表在可公开访问的服务器上,这使得读者很难判定论文的质量,而且预印本参差不齐的质量可能会带来大量问题,尽管它们最终发表时,通过同行评议可能会做出重大修改,但预印本论文对社会决策的严重影响可能已经产生。


上周,美国东北大学的计算科学家Albert-László Barabási提交给bioRxiv的一篇文章遭到了拒稿。预印本bioRxiv和 medRxiv创建者之一Richard Sever[1] 表示,他们发现有些文章质量有问题,尤其是一些计算模型模拟的文章,目前团队[2] 决定禁止此类文章发表。“我们不可能总是要验证这些药物的副作用,也不可能经过审阅评估出来到底他们的计算模型有没有道理。”Sever表示。


Barabási表示,他能理解这种应对措施是为了确保患者的[1] 安全,但并不同意这种解决方案,“很明确[2] ,新冠病毒营造了一个分享型的科学环境”,预印本平台的目标就是‘我们决定有趣的东西是什么,而不是审阅人’”。最终,他们还是把论文发在了另一个预印本平台——arXiv上。

 不同的预印本平台有不同的审查措施和质量要求,如bioRxiv 和medRxiv都有两步审查措施:


1)工作人员检测查重和完整度;

2)由科学界的志愿者或者学科专家检查非科学的内容,健康和生物安全风险——bioRxiv主要找PI,在48小时内完成审查;medRxiv主要找健康专家,需要4~5天。


不过,他们[1] 强调文章的审查主要是看是否会带来危害,而不是评估文章质量,他们主要看论文的结论会否引发灾难性的社会影响,会不会出现类似:“疫苗会引起自闭症”、“吸烟不会引起癌症”等[2] 的结论。言下之意,这种明显有缺陷的预印本会被拒收。但在疫情期间,这种策略遭遇了很大的挑战,文章越来越多,出现的问题和冲突也越来越多。


图 预印平台快速的预审过程加快了新冠病毒研究文章的发表,图片来自nature.com

对于这些新的问题,目前正有一些尝试性的新的解决方案。


例如,[1] 最近《自然》杂志还报道了国外一家名为“Scite.ai”的人工智能平台,可自动显示这些文章是被后续的研究支持,还是否定。

图 “Scite.ai”的人工智能平台显示:支持,中立和反对


与传统引用工具不同,Scite可显示出有多少篇研究与此研究结论一致,多少篇冲突、多少次被提及等。Scite现在每天有1000用户访问,尽管访问数量还不大,但也许不失为一种潜在的解决方案。


图 Scite.ai用不同的颜色显示新冠肺炎研究中,支持、中立与反对的研究的引用情况


不过,《自然》杂志的文章也指出了这项新技术的一些不足:Scite应用范围还相对有限,它现在仅分析了1600万篇全文,但是Web of Science拥有超过5300万文章,超过1亿篇文章使用Crossref注册。很多文章需要付费,因此Scite并不能用。


对此,Scite创始人Josh Nicholson表示,获得研究论文的全文权限是个挑战,现在他们正在考虑扩大论文范围,Scite正在与各大出版商沟通合作事宜,“毕竟目前只有我们能够这么做,但我们确实需要有全文权限”。

参考文献

1.How swamped preprint servers are blocking bad coronavirus research. https://www.nature.com/articles/d41586-020-01394-6

2.Coronavirus in context: Scite.ai tracks positive and negative citations for COVID-19 literature. https://www.nature.com/articles/d41586-020-01324-6

3. The preprint problem: Unvetted science is fueling COVID-19 misinformation. https://arstechnica.com/science/2020/05/a-lot-of-covid-19-papers-havent-been-peer-reviewed-reader-beware/

4. We don’t know yet whether a mutation has made SARS-CoV-2 more infectious. https://arstechnica.com/science/2020/05/draft-study-conclusions-on-sars-cov-2-mutation-overstep-data-grab-headlines/


参与讨论
0 条评论
评论
暂无评论内容
订阅Newsletter

我们会定期将电子期刊发送到您的邮箱

GO