Googlebot 和 15 MB 文件大小限制

June 28, 2022

2022 年 6 月 28 日,星期二,Google 发布了有关 Googlebot 的文档更新,其中澄清了 Googlebot 在获取某些文件类型时只能“看到”前 15 兆字节。这个限制已经存在很多年了,但最近才被添加到文档中,以帮助那些调试。应该注意的是,此限制仅适用于 Googlebot 发出的初始请求,而不适用于页面中引用的资源(例如,如果 HTML 页面引用了 JavaScript 文件,Googlebot 仍将能够查看和获取该 JavaScript 文件)。 Googlebot 新的 15 MB 限制很可能不会产生太大影响,因为互联网上很少有页面更大。但是,如果您碰巧拥有超过 15 MB 的 HTML 页面,您可以尝试将一些内联脚本和 CSS 移动到外部文件中。前 15 MB 之后的内容被 Googlebot 删除,只有前 15 MB 被转发到索引。这适用于 Googlebot(Googlebot 智能手机和 Googlebot 桌面)在提取 Google 搜索支持的文件类型时进行的提取。不会。Googlebot 会提取 HTML 中使用 URL 引用的视频和图片(例如,<img src="https://example.com/images/puppy.jpg" alt="可爱的小狗看起来很失望" /> 与连续提取分开。是的。使用 数据 URI{rel="nofollow"} 会增加 HTML 文件的大小,因为它们位于 HTML 文件中。有很多方法,但最简单的可能是使用您自己的浏览器及其开发人员工具。像往常一样加载页面,然后启动开发人员工具并切换到网络选项卡。重新加载页面,您应该会看到浏览器为呈现页面而必须发出的所有请求。最上面的请求就是您要查找的内容,页面的字节大小在 Size 列中。例如,在 Chrome 开发者工具{rel="nofollow"} 中可能看起来像这样,大小列中有 150 kB:如果你想要要检查 Googlebot 在抓取您的网站时下载了多少数据,您可以使用 Chrome 开发人员工具中的“网络”选项卡或从命令行使用 cURL。要使用 cURL,请输入以下代码: curl \ -A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" \ -so /dev /null https://example.com/puppies.html -w '%{size_download}' 将“https://example.com/puppies.html”替换为您要检查的页面的 URL。如果您对此过程有更多疑问,可以在 Twitter 和搜索中心论坛上找到更多信息。如果您需要更多说明,也可以在文档页面上留下反馈。

更新项目分类以简化 Search Console 报告
Google 正在简化其在 Search Console 报告中对页面、项目和问题进行分类的方式。目标是帮助用户专注于影响他们在搜索中的可见性的关键问题,并更好地确定他们的工作优先级。这一变化将在未来几个月内逐步推出。 目前,当将“警告”状态应用于 URL 或项目时,用户会感到困惑。作为回应,Google 将顶级项目(富结果报告的富结果,其他报告的页面或 URL)分为两组:具有严重问题的页面或项目...
阅读更多
宣布新的 Search Console 视频索引报告
视频索引报告是来自 Google Search Console 的新报告,可帮助网站管理员了解其视频在 Google 上的表现并确定可能需要改进的领域。该报告显示了网站上视频索引的状态,包括 Google 识别出视频的页面数量、成功索引的视频以及阻止视频被索引的问题。该报告将在未来几个月内逐步推出。 Search Console 上的新视频索引报告提供了有关 Google 如何为您网站的视频编制索...
阅读更多