这两个问题都是通过以下方式解决的

在master-slave模式下，master成为网络的瓶颈，在all radius模式下流量很大，因为每个节点都要接收很多信息。例如，XGBoost 在所有半径模式下工作，因此它也不会并行化。在 MatrixNet 中，这两个问题都是通过以下方式解决的：在选择下一棵树时，为每个特征选择一个随机节点，该节点被声明为虚拟主节点，所有其他从节点都与该节点通信。它聚合必要的信息，计算此功能并将结果发送给主站。

我们还尝试以多种方式最大程度地减少流量

例如，在选择最佳分区时，我们为每个从巴林手机号码列表机选择一组最佳特征的候选者，并且我们仅针对少数特征向虚拟主机发送信息。不是一般适用于所有可用的，而是仅适用于最好的。

Matrixnet 排名
排名公式的大小如何随时间变化的图表，其中迭代次数是模型中树的数量，千字节是模型的大小。

如您所见我们需要不断加速模型的训练和应用以适应这种增长

机器学习如何用于搜索？首先你需 cz 列表 要收集一个训练样本，其中会有一组对（文档，查询）。每个这样的对都由评估员评估 – 该文件如何符合要求。此外，在这一行中——文件、请求、评估——仍然会有标志（请求、文件、文件-请求）。如果该属性是一个请求，那么我们将简单地为所有请求文档复制它。

基于接收到的训练样本，模型将被训练。Yandex 搜索中使用的学习模式：

• 回归（逐点模式）：优秀 = 1，良好 = 0.8，差 = 0 => 最小化 MSE

• 成对模式——我们生成一组具有不同分数的文档对。该公式优化了对内的正确排名。

• nDCG 排名函数的优化（不平滑，将无法沿着梯度迈出一步）。函数的可微分逼近。

我们还尝试以多种方式最大程度地减少流量

如您所见我们需要不断加速模型的训练和应用以适应这种增长

发表回复 取消回复

发表回复取消回复