/2

基于xgboost的广告检测中流量作弊识别模型模型体验

模型简介 技术文档 购买咨询
互联网 0 849 0 ¥599

基于xgboost的广告检测中流量作弊识别模型

一、模型应用

 互联网虚假流量,是指通过特殊的方式,模仿人类浏览行为生成的访问流量。例如通过设置程序,每分钟访问一次某网站的主页,这样的流量就属于虚假流量。广告主寻找媒体投放广告的目的是将信息传达给目标受众,依次促进销售量。而媒体的责任则是尽可能引导更多的用户浏览这些信息。一般而言,浏览量的增加,的确能促进销售量的增加,因此多数广告主是基于浏览支付广告费的。换句话说:同等条件下,流量大的网站收取的广告费用更高。部分网站受利益的驱使,通过作弊方式产生流量。

虚假流量的存在给广告主带来了严重的损失。一方面虚假流量提高了广告费用,直接损害了广告主的利益。另一方面,广告监测行为数据被越来越多地用于建模和做决策,例如绘制用户画像,跨设备识别对应用户等。作弊行为,恶意曝光,甚至是在用户完全无感知的情况下被控制访问等产生的不由用户主观发出的行为给数据带来了巨大的噪声,给模型训练造成了很大影响。

本次数据挖掘建模目标如下:

建立互联网虚假流量识别模型,精准识别虚假作弊流量记录。

二、实现流程

广告检测中的流量作弊识别主要包括以下步骤:

1.     对广告检测中获得的历史流量数据进行选择性抽取;

2.     1形成的数据集进行数据探索分析和预处理,包括探索流量作弊的行为特征、冗余属性识别、流量数据的缺失值、数据变换等,并进行相应地预处理,根据建模的需要进行属性构造等;

3.     2得到的数据基础上,构建建模样本;

4.     建立虚假流量识别模型,虚假流量识别模型进行模型分析评价;

5.     4形成的模型结果应用并对虚假流量划分进行优化。

本用例基于广告检测中的流量数据,重点介绍了数据挖掘中的数据预处理的数据清洗、数据变换等方法以及数据预处理在实际案例中的应用。

三、核心技术

·        xgboost

·        CART决策树

四、你可以将本模型用于

·        教与学:可落地操作、学生参与度高、交互性强;

·        科研:将xgboost和决策树与具体行业应用结合,为科学研究提供素材;

·        生产:将模型改进后直接用于实际生产环境:虚假流量检测。

五、运行环境

windowslinuxmac OS64位操作系统,内存:8GB及以上,R3.5.1

六、资源展示


您尚未登录,请登录后购买! 【马上登录

评论已有 0

模型资源列表

基于xgboost的广告检测中流量作弊识别模型

相关模型推荐

联系我们

电话:(020)22205718

热线:40068-40020

地址:广州黄埔区开泰大道36号

邮编:510000

电邮:services@tipdm.com