用泄露的洞察力探索 Yandex 搜索排名因素

January 31, 2023

搜索营销社区正试图弄清泄露的 Yandex 存储库,其中包含列出搜索排名因素的文件。 Ryan Jones (@RyanJones) 认为这次泄密事件很严重,并且已经[加载了一些 Yandex 机器学习模型](https ://twitter.com/RyanJones/status/1620266355323961344) 到他自己的机器上进行测试。尽管有些人可能正在寻找可操作的 SEO 线索,但普遍认为这将有助于更好地了解搜索引擎的工作原理 (@RyanJones,2023 年 1 月 29 日)。正如 Ryan 所说,“[如果]你想要 hack 或捷径,这里没有。但如果你想更多地了解搜索引擎的工作原理,这里有黄金。”

Ryan 认为,我们可以从泄露的 Yandex 排名因素列表中学到很多东西,但是仅仅检查这个列表是不够的。他解释说,虽然 Yandex 不是谷歌,但它确实使用了谷歌的许多发明技术,如 PageRank 和 BERT。他还指出,应用于它们的因素和权重可能会因搜索引擎而异,但用于分析文本相关性的计算机科学方法将非常相似。此外,他指出,代码中计算的排名因素比泄露的列表中列出的要多,一些负权重被分配给 SEO 可能认为是积极的因素,反之亦然。链接:https://www.seobility.net/en/blog/yandex-ranking-factors/

人们普遍认为,Yandex 为其搜索引擎使用了 1,923 个排名因素。不过Link Research Tools的创始人Christoph Cemper (LinkedIn简介)听朋友说还有很多排名因素比最初想象的要多。根据这些消息来源,Yandex 使用了 275 个个性化因素、220 个“网络新鲜度”因素、3186 个图像搜索因素和 2,314 个视频搜索因素。令人惊讶的是,搜索引擎还利用了数百个与链接相关的排名因素。这表明 Google 最初声称在其 SERP 中使用的排名信号远远超过 200 多个。

最近谷歌搜索引擎算法的数据泄露引发了关于谁真正了解整个算法的问题。令人震惊的是,当排名因素被泄露时,它们是如何组织的,许多人现在质疑谷歌是否有一个包含所有排名因素的综合电子表格。

SEO 专家 Christoph Cemper 在 Search Engine Journal 上就这个话题发表评论说,他“总是觉得很荒谬”,连 Google 员工都不知道整个算法。他接着说,如此复杂的系统需要记录在案,甚至代码都可能泄露。因此,也许这次数据泄露将有助于摆脱对谷歌算法的思考。

最近泄露的 Yandex 文件提供了一个机会来查看搜索引擎 (Yandex) 如何对搜索结果进行排名,尽管这些数据并未显示 Google 的工作方式。在已揭示的见解中,与名为 MatrixNet 的 Yandex 神经网络有关,该网络于 2009 年通过 [archive.org 公告链接](https://web.archive.org/web/20160311035825/https://yandex .com/company/technologies/matrixnet/){rel="nofollow"}。重要的是要注意,与一些说法相反,MatrixNet 并不等同于谷歌的 RankBrain——谷歌有限的算法专注于理解它以前从未见过的 15% 的搜索查询。 2015 年 10 月,彭博社发布了一篇文章([Archive.org 快照](https://web.archive.org/web/20151101155408/https://www.bloomberg.com/news/articles/2015-10-26/ google-turning-its-lucrative-web-search-over-to-ai-machines){rel="nofollow"}) 揭示了在 Yandex MatrixNet 推出 6 年后,当年 Google 算法中引入了 RankBrain。根据这篇文章,RankBrain 的用途有限,旨在猜测与它不熟悉的查询含义相似的单词和短语,以便有效地处理从未见过的搜索查询。相比之下,MatrixNet 是一种机器学习算法,可对搜索查询进行分类并相应地应用适当的排名算法。 2016 年的英文公告(此处)进一步详细说明了该算法在 Google 平台上的现代网络搜索中的工作原理。

MatrixNet 是一种强大的排名算法,允许用户生成复杂的公式并为特定的搜索查询定制它们。这确保了一种查询的排名质量不会影响其他类型搜索的整体性能。与其他排名算法不同,MatrixNet 允许用户对某些参数进行调整和微调,而无需彻底检修整个系统。此外,MatrixNet 可以自动为排名公式中的不同因素选择敏感度级别。凭借这些高级功能,MatrixNet 已从 RankBrain 和其他同类算法中脱颖而出。 https://www.deepcrawl.com/blog/rankbrain-matrixnet-same/

MatrixNet 是检查 Yandex 排名因素文档时要考虑的重要因素。为了理解这些文档,了解 Yandex 算法很重要。为此,读者可以阅读概述 Yandex 的人工智能和机器学习算法的文章 此处。 Dominic Woodman 是一位 Twitter 用户,用户名为 @dom_woodman,他对泄密事件进行了一些有趣的观察,并发现其中一些因素是一致的与 SEO 实践,例如不同的锚文本(正如他在 此处 发的推文)。

Alex Buraks (@alex_buraks) 最近发布了一个关于内部链接优化对 SEO 的重要性的 Twitter 帖子。谷歌的 John Mueller 长期以来一直鼓励出版商确保重要页面被显着链接,并且不鼓励将它们深埋在网站架构中。他在 2020 年表示:“[所以会发生什么],我们会看到主页非常重要,主页链接的内容通常也非常重要......随着它离开主页,我们我会认为这可能不那么重要”(John Mueller 分享)。这表明,通过将重要页面保持在网站访问者进入的主要页面附近,如果从那里链接到它们,它们将被视为更重要。

Google 的 John Mueller 最近解决了抓取深度作为排名因素的问题。他澄清说,这不是排名因素,而是向谷歌发出哪些页面很重要的信号。 Alex Buraks 随后引用了一条 Yandex 规则,该规则使用主页的抓取深度作为排名规则,表明重要的页面应靠近主页(点击 1 次),不太重要的页面应该点击 3 次或更少.当一个人远离主页时,就分配重要性而言,这是有道理的。还有一些谷歌研究论文,例如 Reasonable Surfer Model 和 Random Surfer Model,它们计算随机冲浪者通过以下链接访问给定网页的概率。 推文链接: [合理冲浪模型链接:](https:/ /www.seobythesea.com/2016/04/googles-reasonable-surfer-patent-updated/)

SEO 专家 Alex Buraks 最近在推特上表示,来自主页的反向链接比来自内部页面的反向链接更重要。他的推文链接到一张图片,该图片显示了表示此声明的图表。这个经验法则对于 SEO 很重要,因为它有助于确保重要内容靠近主页或吸引入站链接的内页。

最近,发现搜索引擎读取网页的方式存在漏洞。此泄漏仍处于早期阶段,但它有可能让搜索引擎优化的未来用户更好地了解这些服务的工作原理。通过对这次泄密的进一步调查和分析,人们可能会更深入地了解搜索引擎的工作原理以及驱动它们的各种组件。特色图片:Shutterstock/san4ezz。查看搜索引擎期刊的新闻和 SEO 类别以获取有关此主题的更多信息。

Google Ads 推出帐户级否定关键字功能
Google Ads 联络员 Ginny Marvin 最近宣布,新的帐户级否定关键字功能现在可供全球 Google Ads 广告商使用。该功能于 2020 年首次公布,此后已经测试了几个月,它允许广告商通过品牌安全关键字排除来排除所有搜索和购物活动以及 Performance Max 的搜索和购物部分的流量。 该公告于 2023 年 1 月 27 日通过推特发布 ([https://twitte...
阅读更多
ChatGPT 通过更新增强数学能力
OpenAI 发布了其流行语言模型 ChatGPT 的更新,以提高其准确性并提高其处理数学方程式的能力。根据他们 1 月 30 日的 发行说明,新更新旨在提高 ChatGPT 的真实性和数学能力,这意味着它应该能够更好地为需要快速可靠数据的学生、研究人员和专业人士提供准确的信息、计算和答案。虽然新版 ChatGPT 在方程式处理方面仍远非完美,但在提供事实响应方面已显示出显着改进。 ChatGPT...
阅读更多