那么,您如何理解像 [ms-21] 或 [airplane] 这样的一般查询需要新鲜度?此类请求没有对比,特别是如果事件不是很重要,并且通常会不断出现针对此类请求的新文件。为了确定一般请求的“新鲜度”,Yandex 使用新鲜请求的实时 (RT) 扩展。

如果请求很容易扩展到对比请求,那么很可能那里需要新鲜感。例如:[ms-21] 扩展为 [ms-21 flight test]。搜索会记住最近查询中出现的词,并增加包含这些词的查询的新鲜度权重。

在将新鲜度与搜索结果相结合时,关键技术是实时 MapReduce,它允许您在几秒钟内将任何信号带入搜索。搜索在结果中接收有关事件的信息,延迟仅几秒钟,并立即更新统计信息。这允许您在相应的“确切请求”出现后几乎立即处理“一般”请求。结果,新文档添加到 SERP 的点击次数增加了。

至于快速将新文档添加到搜索结果中的任务

那么你就离不开专门的内容系统,这样的机器人会帮助你快速找到这些文档并将它们添加到搜索结果中,那么你需要对所有这些进行排名以最相关和最相关的文件处于高位的方式保持新鲜度,当然,要尽快了解特定请求需要新鲜度。

新鲜”的 Yandex 机器人是如何工作的

这个机器人需要快速搜索新鲜文档 斯里兰卡电话号码表 并快速上传到搜索数据库。为此,他需要经常绕过优质新鲜 URL 的优质来源(例如,优质新闻出版物的主页)。

“新鲜”的 Yandex 机器人很好地应对了这项任务。例如,我们可以给出搜索结果的一般相关性图表,来自 Ashmanov 和 Partners 的分析器:

在这里你可以清楚地看到 Yandex红线

电话号码清单

在文档索引速度方面的进步,这是过去一年取得的成果。“新鲜”机器人确实能够在几分钟内了解新文档的外观并将其传送到新 cz 列表 鲜度搜索索引,以便将其显示给相关查询的用户。

没有“新鲜”机器人,也没有 RT,就不可能有新鲜排名。但新鲜排名不仅如此,它还是由评估人员标记的“请求-文档”对和所谓的“点击添加剂”,它预测文档的点击次数。后者有助于搜索了解用户喜欢多少新鲜度,以及总体上有多好和相关。

新排名的一个全球性问题是,大多数对事件的请求是在事件发生后几个小时提出的。在这样的样本上训练的公式很难理解需要最新的文档,并且在这种情况下,3 分钟的文档是好的和合适的,因为实际上没有这样的文档。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注