是决策树上的梯度提升,支持所有主要模式:分类、多分类、回归、排名等。还有更复杂的模式——上述模式的组合。我们部门正在针对相关部门的需求开发新的模式,Yandex内部用户现在也可以添加自己的模式。

Matrixnet 可以处理缺失值——如果未指定某些因子的值,这将不是问题。此外,Matrixnet 学习可以在集群上运行——它是一种分布式算法。这很重要,因为在搜索中,训练样本现在非常大,以至于它们根本无法容纳在一台服务器的 RAM 中,这就是为什么需要分布式训练的原因。

Matrixnet 在 Yandex 中的应用

Yandex 中的 Matrixnet 无处不在。首先,在搜索中。Matrixnet 最初是专门为搜索而编写的。其次,它被用在广告中,通过 加拿大手机数据库 预测广告的点击次数,向用户展示他们最感兴趣的广告。第三,Yandex 中的天气预报基于 Matrixnet 公式。该算法还用于 Yandex 外部项目 – 推荐系统、机器人检测、同名解析、用户细分等。

现在公开领域一下子有好几种梯度提升算法

电话号码列表

我就给大家说说Matrixnet和它们的区别。它的重要特点是几乎不需要选择参数。为什么?

在编写 Matrixnet 时,它在一组不同的训练样本(池)上进行了测试,以便为所有人提供良好的质量,因此我们在新数据集上也能获得良好的质量。Matrixnet 易于使用,不仅因为几乎不需要选择参数,还因为 Yandex 的基础设施允许您单击一下就可以开始训练(更多内容见下文)。在质量方面,Matrixnet 在回归模式的决策树上优于其他梯度提升算法。

Matrixnet 具有高度优化的学习。这对所有 Yandex 任务都很重要,但主要是搜索。虽然我们有很大的训练样本,但我们不 cz 列表 能训练一个月的公式,因为质量会受到影响。因此,应用了各种优化,包括算法和低级优化,以及网络负载优化。Matrixnet公式的应用也做了高度优化(一个线程1秒,公式可以应用到100,000个文档)。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注