Nature :谷歌学术搜索 能否在人工智能革命中幸存下来?

B站影视 2024-11-21 19:42 1

摘要:多年来,Google Scholar 一直主导着科学文献搜索。图片来源:IB Photography/Alamy

多年来,Google Scholar 一直主导着科学文献搜索。图片来源:IB Photography/Alamy

谷歌学术搜索是全球最大、最全面的学术搜索引擎,本周迎来了 20 周年。一些研究人员表示,在过去的 20 年里,该工具已成为科学界最重要的工具之一。但近年来,使用人工智能 (AI) 来改善搜索体验的竞争对手纷纷涌现,其他竞争对手也允许用户下载其数据。

西雅图华盛顿大学的计算社会科学家杰文·韦斯特 (Jevin West) 每天都在使用 Google Scholar 数据库,他表示,Google Scholar 对科学界的影响是惊人的。Google Scholar 由位于加利福尼亚州山景城的网络巨头谷歌所有。但“如果有一天 Google Scholar 的主要搜索引擎地位会被推翻,那可能就是现在,因为一些新工具和其他地方正在发生的一些创新,”韦斯特说。

西班牙格拉纳达大学文献计量学研究员 Alberto Martín Martín 表示,Google Scholar 的很多优势(免费访问、信息广度和复杂的搜索选项)“现在正被其他平台所共享”。

人工智能聊天机器人(例如 ChatGPT)和其他使用大型语言模型的工具已成为一些科学家在搜索、审查和总结文献时的首选应用程序。一些研究人员已经用它们取代了谷歌学术搜索。新加坡管理大学的学术图书管理员 Aaron Tay 说:“直到最近,谷歌学术搜索还是我的默认搜索工具。”它仍然是他的首选,但“最近,我开始使用其他人工智能工具”。

不过,考虑到谷歌学术的规模及其在科学界的根深蒂固的地位,“要推翻它的地位还需要付出很大努力”,韦斯特补充道。

谷歌学术联合创始人安努拉格·阿查里亚表示,他欢迎所有旨在使学术信息更易于查找、理解和利用的努力。“我们能做的越多,对科学的进步就越有利。”

2004 年,Google Scholar 进入文献搜索领域,从此改变了一切。当时,研究人员通过访问付费在线服务(如科学引文数据库 Web of Science)来使用图书馆查找信息或搜索学术论文。与 Google Scholar 同月推出的另一项付费服务是 Elsevier 的 Scopus,这是一个大型科学参考文献和摘要数据库。

Google Scholar 会抓取网络上各种学术成果,例如书籍章节、报告、预印本和网络文档,包括非英语语言的论文。Acharya 表示,其目标是“让全世界的研究人员更加高效,让每个人都能站在科学的共同前沿”。

Google Scholar 与出版商达成的协议使其能够无可匹敌地访问付费墙内文章的全文,而不仅仅是标题和摘要,而大多数搜索引擎都提供这些内容。它根据论文与搜索查询的相关性对论文进行排名,通常会将引用次数最多的文章放在最前面,并建议进一步查询。其覆盖范围的深度有助于实现高度精准的搜索。

谷歌拒绝分享该服务的使用数据,但根据网络流量测量仪 Similarweb 的数据显示,Google Scholar 每月的访问量超过 1 亿次。

马丁·马丁说,该数据库还非常善于向人们推荐文章的免费版本。科尔多瓦西班牙国家研究委员会高级社会研究所的文献计量学家何塞·路易斯·奥尔特加说,这促进了开放获取运动。

但在其他方面,Google Scholar 并不透明。主要问题之一是缺乏对它搜索的内容(包括期刊)以及它推荐文章的算法的了解。它还限制批量下载搜索结果,而这些结果可用于文献计量分析等。West 说:“我们对科学界最有价值的工具之一了解不多。”

Acharya 表示,Google Scholar 主要是一个搜索工具,其主要目标是帮助学者找到最有用的研究成果。

过去几年,一些竞争对手也开始提供此类文献计量数据,但没有一家能超越谷歌学术的规模和付费墙后的全文访问。一个值得注意的例子是 2022 年推出的 OpenAlex 索引。前一年,用于爬取网络学术信息的 Microsoft Academic Graph 已停止使用,其整个数据集已发布。OpenAlex 以此和其他开放学术数据源为基础。用户可以按作者、机构和引文搜索其分类的内容,也可以免费下载其全部记录。“他们正在做我们希望谷歌学术做的事情,”马丁-马丁说。

另一种流行的研究工具是 2015 年推出的 Semantic Scholar,它使用人工智能创建可读的论文摘要并确定最相关的引文。另一种工具是2022 年推出的Consensus,它依靠 Semantic Scholar 的数据库来寻找研究问题的答案(West 是 Consensus 的顾问)。Tay 最喜欢的工具之一是Undermind,它使用更复杂的基于代理的搜索,其中一个自主实体以人类的方式扫描科学文献,并根据找到的内容调整搜索。它需要几分钟(而不是谷歌学术搜索的几秒钟)才能显示结果,但 Tay 说等待是值得的。“我发现返回的结果质量比谷歌学术搜索更好。”

Acharya 表示,Google Scholar 还使用 AI 对文章进行排名、建议进一步的搜索查询并推荐相关文章。本月早些时候,该公司将 AI 生成的文章大纲引入了其 PDF 阅读器。Acharya 还表示,搜索工具会尝试理解查询背后的意图和上下文。他说,这种语义搜索方法基于语言模型,已经使用了大约两年。

Google Scholar 尚未实现的一件事是包含 AI 生成的搜索查询答案概述,类似于现在在典型 Google 搜索顶部找到的答案。Acharya 表示,以简洁的方式总结多篇论文的结论并包含重要背景是一项挑战。“我们还没有看到解决这一挑战的有效方法,”他说。

阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或点击本文左下角“阅读原文”进入。

截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

1. 牛津大学博士论文《深度具身智能体的空间推理与规划》230页

2. 2024低空经济场景白皮书v1.0(167页)

3. 战略与国际研究中心(CSIS)人类地月空间探索的总体状况研究报告(2024)

4. 人工智能与物理学相遇的综述(86页)

5. 麦肯锡:全球难题,应对能源转型的现实问题(196页)

6. 欧米伽理论,智能科学视野下的万物理论新探索(50页报告)

7. 《美国反无人机系统未来趋势报告(2024-2029 年)》

8. Gartner 2025 年主要战略技术趋势研究报告

9. 2024人工智能国外大模型使用手册+中文大模型使用手册

10. 详解光刻巨人ASML成功之奥妙-241015(94页)

11. CB Insights:未来变革者:2025年九大科技趋势研究报告

12. 国际电信联盟2023-2024年联合国人工智能AI活动报告388页

13. 《人工智能能力的人类系统集成测试和评估》最新51页,美国防部首席数字和人工智能办公室(CDAO)

14. 2024瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

15. MHP:2024全球工业4.0晴雨表白皮书

16. 世界经济论坛白皮书《AI价值洞察:引导人工智能实现人类共同目标》

17. 瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

18. AI智能体的崛起:整合人工智能、区块链技术与量子计算(研究报告,书)

19. OpenAI o1 评估:AGI 的机遇和挑战(280页)

20. 世界知识产权组织:2024 年全球创新指数(326页)

21. 美国白宫:国家近地天体防御策略与行动计划

22. 【CMU博士论文】持续改进机器人的探索,243页

23. 中国信通院:量子计算发展态势研究报告2024年58页

24. 2024年OpenAI最新大模型o1革新进展突出表现及领域推进作用分析报告

25. 【新书】通用人工智能,144页

26. 联合国:《未来契约》、《全球数字契约》和《子孙后代问题宣言》三合一

27. 世界气候组织:2024团结在科学中,守卫地球系统的未来

28. 世界经济论坛 《量子技术助力社会发展:实现可持续发展目标》研究报告

29. 人工智能科学家:迈向全自动开放式科学发现

30. 欧盟:石墨烯旗舰项目十年评估报告

31. 美国信息技术和创新基金会:美国的数字身份之路研究报告

32. 麦肯锡:2024能源转型挑战未来研究报告

33. 联合国贸易与发展会议:2024世界投资报告

34. 兰德:评估人工智能对国家安全和公共安全的影响

35. 兰德:2024评估人工智能基础模型市场的自然垄断条件

36. 经合组织:2015-2022 年生物多样性与发展融资

37. ITIF:中国半导体创新能力研究报告

38. 英国皇家学会:数学未来计划, 数学和数据教育的新方法研究报告

39. 欧盟:10年人类大脑计划创新评估报告

40. GLG格理集团:2024深度解读半导体行业关键趋势和专家洞见报告15页

41. 华为智能世界2030报告2024版741页

42. 联合国:2024为人类治理人工智能最终报告

43. 达信Marsh:2024全球科技产业风险研究报告英文版27页

44. 鼎帷咨询:2024英伟达人工智能发展战略研究报告149页

45. 【博士论文】大语言模型的测试与评价:准确性、无害性和公平性,223页pdf

46. 麦肯锡:2024世界能源产业展望

47. 世界经济论坛《太空:全球经济增长的 1.8 万亿美元机遇》

48. 世界经济论坛:世界“技术先锋”名单100家公司名单

49. 世界经济论坛:2024绘制地球观测的未来:气候情报技术创新

50. 核聚变技术作为清洁能源供应替代来源的全球发展和准备情况

51. 大模型生成的idea新颖性与人类对比研究报告(94页)

52. IQM :2024 年量子状况报告

53. 2024十大新兴技术研究报告

54. 2024地球观测 (EO) 洞察带来的全球价值(58页)

55. 2023-2024世界基础设施监测报告

56. 世界银行:2024世界发展报告,中等收入陷阱

57. 2024国际前沿人工智能安全科学报告132页

58. 斯坦福大学2024人工智能指数报告

59. 美国总统科学技术顾问委员会:《利用人工智能应对全球挑战》63页报告

60. 柳叶刀行星健康:2024地球系统安全与健康评估报告

61. 中国未来50年产业发展趋势白皮书III

62. OpenAI o1系列产品原理与安全最新研究报告(80页)

63. 国家互联网信息办公室:国家信息化发展报告2023年110页

64. 埃森哲:2024年风险研究报告-重大颠覆需要持续重塑英文版39页

65. 36氪研究院:2024年中国城市低空经济发展指数报告41页

66. 美国信息技术与创新基金会:《中国在量子领域的创新能力如何》研究报告

67. 理解深度学习500页报告

68. 鼎帷咨询:2024全球人工智能发展研究报告44页

69. 【伯克利博士论文】大型语言模型迈向能够学习和发现一切的机器

70. 《量子技术:前景、危险和可能性》45页报告

71. 英国皇家学会报告:人工智能在科学、技术、工程和数学领域的应用

72. 未来今日研究所:2024世界技趋势报告(980页)

73. 面向大规模脉冲神经网络:全面综述与未来方向

74. 大模型+知识库市场全景报告

75. 《太空力量的理论基础:从经济学到不对称战争》2024最新94页报告

76. CBInsights:2024年第二季度全球企业风险投资状况报告英文版124页

77. 英国科学院:数据管理和使用:21 世纪的治理(2024),99页

78. 兰德智库:展望2045 一项前瞻性研究探讨未来 20 年全球趋势的影响

79. 世界知识产权组织:2024年世界知识产权报告:让创新政策促进发展

80. 全球灾难风险研究所:评估大型语言模型接管灾难的风险

81. 牛津马丁学院:人工智能风险国际科学评估的未来

82. 联合国贸易和发展署:2024世界投资报告

83. 兰德公司:人工智能军事应用的新风险和机遇

84. 英国皇家学会:AI时代的科学发展趋势研究报告

85. 百页风电行业研究方法论:从中国到世界从陆地到海洋-240902,98页

86. 中国信通院发布《大模型落地路线图研究报告(2024年)》

87. 星河智源:2024年无人驾驶技术全景报告35页

88. 星河智源:2024年光刻机技术全景报告37页

89. 人形机器人行业研究方法论:特斯拉领衔人形机器人的从1到N

90. 兰德:展望2045一项关于未来20年全球趋势影响的前瞻性研究报告英文版45页

91. 《军事创新与气候挑战》2024最新152页报告

92. 麦肯锡:2024困难点:驾驭能源转型的物理现实(196页)

93. 《麻省理工科技评论》万字长文:什么是人工智能?

94. 软件与服务行业:从特斯拉智能驾驶看人形机器人发展路径

95. 中国信通院:中国数字经济发展研究报告2024年82页

96. CB Insights:2024年第二季度全球风险投资状况报告 244页

97. 脑启发的人工智能:全面综述

98. 二十年关键技术跟踪报告

99. 中国首部城市大脑系列建设标准(8项)汇编

100. 麦肯锡2024技术趋势展望报告100页

上下滑动查看更多

来源:人工智能学家

相关推荐