2022 年 12 月 14 日星期三,谷歌宣布对其基于人工智能的垃圾邮件预防系统 SpamBrain 进行更新。此更新将使用 SpamBrain 来检测和消除非自然链接对搜索结果的影响。更新的推出预计需要两周时间,并将影响所有语言,可能会导致排名发生变化,因为这些不自然链接的任何信用都将丢失。
谷歌一直强调,主要为人为操纵搜索排名而获得的链接被视为垃圾链接。通过此更新,现有的算法和手动操作旨在大规模消除这些不自然的链接。如果用户遇到从事无机链接构建的网站,他们可以直接向 Google 报告 .有关此更新的更多信息或具体反馈,用户可以在 Google 的帮助社区中发帖。
在本文中,Duy Nguyen、Ildar Akhmedyanov、Jacob N Scott 和 Karthikgeyan Elangovan 讨论了如何使用高性能计算 (HPC) 系统扩展机器学习操作。作者指出,随着机器学习中使用的数据量和模型数量的增加,有必要使用 HPC 系统来利用更大的计算资源。他们描述了典型的 HPC 设置并讨论了它如何支持分布式训练。
作者还提供了有关优化数据管道以获得更好性能的技巧。一个关键步骤是确保数据在发送到计算节点之前经过预处理;这减少了网络开销并允许节点以最高效率运行。此外,他们还讨论了使用 TensorFlow 或 PyTorch 等框架进行分布式训练的重要性,因为它们为模型并行化提供了优化方法。
最后,作者概述了流行的 HPC 系统,例如 Apache Spark 和 Kubernetes,它们可用于管理大规模机器学习作业。他们最后指出,HPC 系统对于在当今的大数据和复杂模型世界中扩展机器学习操作至关重要。