这里的主要技巧是不择手段地让移动互联网用户订阅某些“服务”。最常发生的是这样的:
通常,联盟广告会将用户带到一个特殊的登陆页面,通过点击一个完全无害的按钮,如“下载”、“观看”、“登录”,进行订阅。或许这一行动的后果甚至在某个地方用小字体写了出来,但老实说,没有人会读这个小字体。用户不会期望这个名称的按钮有任何危险,我们每天都会在 Internet 上多次单击它们。
我们在做什么。首先,我们使用特定模式跟踪重定向链,这使得可以假设用户正在从这个或那个站点重定向到这样的登录页面。然后进行主动检测,当受过专门训练的机器人来仔细检查该站点是否真的重定向到此着陆点,或者使用众包来仔细检查这一事实。
据我们估计,每天约有 80,000 名用户访问着陆页并面临订阅付费服务的风险。该地区的营业额每天达数千万卢布。
我们可以做什么以及正在做什么。如果我们谈论的是黑色计划(关于感染),我们会从移动搜索结果中删除此类网站。如今,Yandex 搜索限制了超过 400,000 个滥用将用户重定向到订阅登录页面的网站的可见性。Yandex 每天检测到数百个此类网站。如果我们谈论的是灰色和白色订阅方案,那么我们会另外向用户显示一个警告,表明可以在该站点订阅付费服务,从而引起用户对此的注意。
这就是 Yandex 安全搜索部门所有反欺诈项目的运作方式
不适当的内容
如您所知,Yandex 有几种搜索模式:“家庭”、“中等”和“无限制”。在“家庭搜索”模式下,我们不应该显示色情内容,即 牙买加手机号码列表 使用户明确询问了有关色情内容的问题。在“适度”搜索模式下,我们仅针对包含露骨色情内容的查询显示色情内容。在“无限制”模式下,Yandex 会显示找到的所有内容。这样,我们就得到了一定的决策空间,它考虑了搜索方式、请求类和文档类,我们必须根据它来决定给用户什么样的问题。
任务看似很简单我们将请求分成两类
将内容分为两类,根据搜索方式,展示相 cz 列表 应的内容。事实上,一切都不是这样,当试图回答这个问题时,困难已经开始:“什么是色情请求?”。考虑到各种灰色地带,这个问题的答案一点也不简单。有人说色情请求就是色情请求(每个人都知道互联网的第 34 条规则吗?下面有更多内容)。至于文档的分类,这里也有难点。文档可能包含图片、视频、文字,也可能包含某种广告,而这些信号中的每一个都可能包含色情内容。
第 34 条规则说,如果某物存在,那么它就已经是色情片了。我和伙计们决定测试这篇论文,并提出了这样一个测试版(用户无法使用但分析师可以使用的搜索),它专门搜索色情文件。