谷歌为 Gmail 部署新矢量算法，可大幅提高垃圾 / 钓鱼邮件识别率

12 月 3 日消息，据外媒 PC mag 报道，谷歌悄然为 Gmail 新增了一个垃圾邮件过滤器，号称在识别垃圾邮件、网络钓鱼邮件方面拥有更好表现。

据介绍，这个新的垃圾邮件过滤器是基于 Google Colab 上的新型开源多语言文本矢量化器 RETVec （弹性高效文本矢量器）。它可以将单词映射成矢量或者数字，从而被用来提升垃圾邮件和钓鱼邮件的识别率，同时降低误报率。

由于网络犯罪分子仍然持续创建绕过防御系统的内容，导致当前文本分类模型在识别诈骗和网络钓鱼攻击方面仍存在困难。谷歌方面声称，RETVec 在经过训练之后，能够检测并理解“字符级”的操作，包括插入、删除、拼写错误、同音字，同时还能降低计算成本。

根据谷歌自己的统计，将 RETVec 应用到 Gmail 后，垃圾邮件检测率相比以往的过滤器提高 38%、误报率降低 19.4%、张量处理单元 (TPU) 使用率降低了 83.13%。

谷歌方面声称，使用 RETVec 训练的模型表现出更快的推理速度，较小的模型可以降低计算成本并减少延迟，这对于大规模系统和设备上的模型至关重要。

注：该项目现已在 GitHub 上开源，点此跳转

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，所有文章均包含本声明。

Published by