摘要:在最近一集的 Google Search Off the Record 播客中,来自“Dups”团队的 Allan Scott 解释了当存在重复页面时,Google 如何决定将哪个 URL 视为主要 URL。
在最近一集的 Google Search Off the Record 播客中,来自“Dups”团队的 Allan Scott 解释了当存在重复页面时,Google 如何决定将哪个 URL 视为主要 URL。
他透露,Google 会查看大约 40 个不同的 信号 ,从一组相似的页面中选择主 URL。
重复内容是搜索引擎的常见问题,因为许多网站都有多个具有相同或相似内容的页面。
为了解决这个问题,Google 使用了一个称为规范化的过程。此过程允许 Google 选择一个 URL 作为主版本来索引并显示在搜索结果中。
Google 已经讨论了使用 rel=“canonical” 标签、站点地图和 301 重定向等信号进行规范化的重要性。但是,此过程所涉及的信号数量比您预期的要多。
斯科特在播客中透露:
“我不确定现在确切的数字是多少,因为它会上下波动,但我怀疑它在 40 左右。”
提到的一些已知信号包括:
rel=“canonical” 标签301 重定向HTTPS 与 HTTP网站地图内部链接URL 长度每个信号的权重和重要性可能会有所不同,某些信号(如 rel=“canonical” 标签)会影响聚类和规范化过程。
由于有这么多信号在起作用,Allan 承认在信号冲突时确定规范 URL 存在挑战。
切换到 Bluehost 并获得退款
切换到 Bluehost 是值得的......按照字面。在一个平台上获得超快速的托管、电子商务功能和 WordPress 专业知识。
他说:
“如果你的信号彼此冲突,系统将开始回退到较小的信号。”
这意味着,虽然像 rel=“canonical” 标签和 301 重定向这样的强信号至关重要,但当这些信号不明确或相互矛盾时,其他因素也会发挥作用。
因此,Google 的规范化过程涉及一个微妙的平衡行为,以确定最合适的规范 URL。
清晰的信号有助于 Google 识别首选的规范 URL。
最佳做法包括:
正确使用 rel=“canonical” 标签。对永久移动的内容实施 301 重定向。确保页面的 HTTPS 版本可访问和链接。提交包含首选规范 URL 的站点地图。保持内部链接的一致性。这些信号可帮助 Google 找到正确的规范 URL,从而提高您网站的抓取、索引编制和搜索可见性。
以下是一些需要注意的常见错误。
解决方法 :仔细检查规范标签,每页只使用一个,并使用绝对 URL。
当页面 A 指向页面 B 作为规范页面,但页面 B 指向回 A 或其他页面时,创建一个循环。
解决方法 :确保规范 URL 始终指向页面的最终首选版本。
向搜索引擎发送混合信号。Noindex 意味着根本不索引页面,使规范变得无关紧要。
修复 :使用规范标签进行整合,使用 noindex 进行排除。
将规范指向重定向或 noindex 页面会使搜索引擎感到困惑。
修复 :规范 URL 应为 200 状态且可索引。
不一致的 URL 大小写可能会导致重复内容问题。
修复 :保持 URL 和规范标签大小写一致。
如果处理不当,分页内容和参数繁重的 URL 可能会导致重复。
用于确定规范 URL 的 40+ 个信号的完整列表不太可能公开。
然而,这仍然是一次值得强调的有见地的讨论。
来源:小辰科技观察