摘要:站长之家(ChinaZ.com) 5月19日 消息:随着用户对Google 搜索质量不断下降的抱怨声愈演愈烈,尤其是在生成式 AI整合后更是效果堪忧,欧洲各组织正致力于开辟替代方案。其中一个关键计划是构建一个公共网页索引(Open WebIndex),以支持新
该公共索引将有助于创建不依赖现有爬虫的新型搜索引擎……
站长之家(ChinaZ.com) 5月19日 消息:随着用户对
Google 搜索质量不断下降的抱怨声愈演愈烈,尤其是在生成式 AI
整合后更是效果堪忧,欧洲各组织正致力于开辟替代方案。其中一个关键计划是构建一个公共网页索引(Open Web
Index),以支持新的搜索引擎开发,并减少对 Google 和 Bing 的依赖。
开放网页索引的早期试验将于下月启动。这个正在成型的项目有望帮助欧洲国家摆脱对广告驱动型搜索引擎的过度依赖。随着美国科技巨头越来越倾向于将搜索服务围绕生成式 AI 与广告进行优化,OpenWebSearch.eu 倡议旨在推动非营利性的替代方案发展。
需要强调的是,Open
Web Index
本身并不是一个搜索引擎。它的作用更类似于一个数字图书馆,搜索引擎可以从中提取网页和文件。目前,主要搜索引擎依赖专有索引系统,而较小的搜索引擎往往得依赖它们。Open
Web 项目指出,这种集中化结构让 Google 等公司对全球网络拥有过高的控制力。
英国和欧盟的监管机构一直在反对美国科技巨头(如 Apple、Google 等)的垄断行为,尤其在搜索和人工智能等关键领域上不断施压。
与此同时,全球用户普遍反馈称搜索结果质量正在持续下降。许多网站运营者也抱怨
Google 正在“封闭”其生态系统,限制用户跳离他们的平台。而生成式 AI
工具也频频出现信息不准确的问题。部分组织认为,发展基于欧洲的搜索引擎和 AI 模型将是解决这一问题的关键途径之一。
为了实现上述目标,由 14 个成员机构组成的联盟——包括多所大学、数据中心、科技公司以及欧洲核子研究中心(CERN)——将出资并构建开放网页索引的基础设施。
该项目不仅服务于搜索引擎的研发,也将为中小企业构建“大语言模型(LLM)”或其他非广告驱动型应用提供支撑,从而实现对 Google 和 Bing 的去依赖。
项目还希望推动开发符合欧洲法规、价值观与文化的应用。例如,基于欧盟的搜索引擎和语言模型将理论上能更准确地处理非英语语种的信息。同时,联盟也在深入研究网页爬取的方式以及点击行为如何影响排名机制。
首 次公开试验将于
6 月 6 日(中欧夏令时上午 10 点至中午 12 点)通过 Zoom 线上会议启动。参与者将能访问约
1PB(拍字节,1PB=1024TB==2^ 50 字节) 的网页内容。最终版本的 Open Web Index 预计将托管 约5PB
内容,并计划在未来扩展至 10PB 的规模。
来源:小桃说科技