/2

电信诈骗事件演化过程分析与挖掘模型模型体验

模型简介 技术文档 购买咨询
电信 0 777 0 ¥599

电信诈骗事件演化过程分析与挖掘模型

一、模型应用

网络的发展使得人们能够方便快捷地获取信息,阅读在线新闻已经成为人们获取热点时事的主要方式。随着信息技术及经济的快速发展,各种社会问题不断凸显,涉及人们生活的各个方面,以“徐玉玉案”为代表的电信诈骗事件最为突出,事件的传播与发展对社会造成较大影响。

电信诈骗指犯罪分子通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程、非接触式诈骗,诱使受害人给犯罪分子打款或转账的犯罪行为。近10年来,我国电信诈骗案件每年以20%-30%的速度快速增长。2015年全国公安机关共立电信诈骗案件59万起,同比上升32.5%,造成经济损失222亿元。今年1月至7月,全国共立电信诈骗案件35.5万起,同比上升36.4%,造成损失114.2亿元。

电信诈骗通过网络新闻的方式被广大民众所了解,并且事件的发展通常具有如下三个特征:事件持续时间短,相应新闻报道数却很多;事件影响的范围很广;事件的过程与发展受到的关注度高。基于当前网络信息发展与电信诈骗事件的特点,从海量新闻文本中快速了解事件的发展过程及民众的情绪变化和关注焦点,找出事件的问题根源对于快速了解事件发展具有重要意义,也为相关部门对事件的管控提供参考价值。

本例从“徐玉玉事件”入手,从新浪、凤凰、天涯、搜狐四大新闻网站,爬取含有“徐玉玉”及“电信诈骗”关键词的相关新闻文章,及文章评论数据,根据这些数据分析事件发展过程,深度挖掘事件问题根源;并分析民众对该事件发展过程的情感变化,挖掘出民众关注的焦点问题。

1.png

二、实现流程

从“徐玉玉案”发生以来,电信诈骗话题再度迎来了一次热议,关于“徐玉玉案”和“电信诈骗”的新闻和评论更是层出不穷。本例建模针对的是“徐玉玉案”发生后出现的“电信诈骗”相关新闻和评论数据进行数据分析挖掘,在对文本进行基本的预处理,其中包括中文分词、停用词过滤等,并利用TF-IDF进行特征提取后,通过建立LDA主题模型和语义网络模型,实现信息挖掘及分析。

本例总体流程如下图所示:

2.png

                               图2-1 总体流程图

电信诈骗事件分析过程的主要步骤如下:

  1. 数据探索,对数据进行分布探索;

  2. 数据预处理,对新闻文章、评论数据分别进行预处理,主要为数据清洗(删除事件发生前的数据)、文本去重去空、中文分词、停用词过滤;

  3. 特征提取,利用TF-IDF提取文本关键词;

  4. 文本表示,利用文档-词条矩阵进行文本转化;

  5. 针对新闻文章,划分事件发展阶段,通过LDA主题模型分析不同阶段主题分布;

  6. 针对评论数据,分析民众对事件发展的情感变化,并通过绘制语义网络图,分析其中关键节点;

三、核心技术

  • 网络爬虫

  • TF-IDF特征提取

  • LDA主题模型

  • 语义网络模型

四、运行环境

windows/linux/mac OS,64位操作系统,CPU:4GB(GPU更好),R语言

五、资源展示

3.png

您尚未登录,请登录后购买! 【马上登录

评论已有 0

模型资源列表

电信诈骗事件演化过程分析与挖掘模型

相关模型推荐

联系我们

电话:(020)22205718

热线:40068-40020

地址:广州黄埔区开泰大道36号

邮编:510000

电邮:services@tipdm.com