支持所有主要模式分类多分类回归排名等

是决策树上的梯度提升，支持所有主要模式：分类、多分类、回归、排名等。还有更复杂的模式——上述模式的组合。我们部门正在针对相关部门的需求开发新的模式，Yandex内部用户现在也可以添加自己的模式。

Matrixnet 可以处理缺失值——如果未指定某些因子的值，这将不是问题。此外，Matrixnet 学习可以在集群上运行——它是一种分布式算法。这很重要，因为在搜索中，训练样本现在非常大，以至于它们根本无法容纳在一台服务器的 RAM 中，这就是为什么需要分布式训练的原因。

Matrixnet 在 Yandex 中的应用

Yandex 中的 Matrixnet 无处不在。首先，在搜索中。Matrixnet 最初是专门为搜索而编写的。其次，它被用在广告中，通过加拿大手机数据库预测广告的点击次数，向用户展示他们最感兴趣的广告。第三，Yandex 中的天气预报基于 Matrixnet 公式。该算法还用于 Yandex 外部项目 – 推荐系统、机器人检测、同名解析、用户细分等。

现在公开领域一下子有好几种梯度提升算法

我就给大家说说Matrixnet和它们的区别。它的重要特点是几乎不需要选择参数。为什么？

在编写 Matrixnet 时，它在一组不同的训练样本（池）上进行了测试，以便为所有人提供良好的质量，因此我们在新数据集上也能获得良好的质量。Matrixnet 易于使用，不仅因为几乎不需要选择参数，还因为 Yandex 的基础设施允许您单击一下就可以开始训练（更多内容见下文）。在质量方面，Matrixnet 在回归模式的决策树上优于其他梯度提升算法。

Matrixnet 具有高度优化的学习。这对所有 Yandex 任务都很重要，但主要是搜索。虽然我们有很大的训练样本，但我们不 cz 列表 能训练一个月的公式，因为质量会受到影响。因此，应用了各种优化，包括算法和低级优化，以及网络负载优化。Matrixnet公式的应用也做了高度优化（一个线程1秒，公式可以应用到100,000个文档）。

Matrixnet 在 Yandex 中的应用

现在公开领域一下子有好几种梯度提升算法

发表回复 取消回复

发表回复取消回复