/2

基于K-Means算法的微博用户群体划分模型模型体验

模型简介 技术文档 购买咨询
互联网 0 500 0 ¥399


基于K-Means算法的微博用户群体划分模型

一、模型应用

微博作为一种新兴的传播载体,在社会中发挥着越来越多的作用。目前用户在日常生活中使用微博已成为普遍现象,微博应用已经遍布社会的方方面面,人们更趋向于使用微博检索、浏览和传递信息等。微博已成为普通民众表达观点的重要窗口,对话题发现、信息管理、信息安全等领域的决策起着重要作用。

  微博用户只需要即时即地的输入简短的文字信息或者上传图片就可以公开发布状态,更快速更便捷地反映微博用户的情感等各方面资讯,微博仍是大多数人使用的网络社交平台。从网络营销角度看,微博不仅成为用户社交生活的网络工具,也成为传统网络与移动互联网的营销基地,在普通微博用户的博文被感知程度低的情况下,以营销为目的的博文却在潜移默化地培养着客户群。对微博用户信息及内容数据的关联分析可以进行微博用户、群体的相似度计算建立不同层级之间的相似系数。相似度计算就是计算用户之间的相似情况,依靠计算每两个用户之间的相似度来构建网络拓扑结构,将大型网络社区分割成一个个具有关联性的小型群体。

本案例挖掘目标如下:

  • 根据微博用户的评论、转发内容进行用户兴趣分析。

  • 根据微博用户的转发数、评论数、状态数、粉丝数等对用户进行影响分析。

二、实现流程

以上应用其主要流程为:

  1. 对原始数据进行预处理操作,包括数据去重、缺失值处理、中文分词、停用词过滤等操作;

  2. 针对处理过的文本数据,采用PAM文本聚类的方法进行用户兴趣分类;

  3. 提取用户评论数、状态数、转发数、粉丝数等,采用聚类方法对用户影响力进行分析;

  4. 整理结合2和3得出的结论,针对用户分析后得出的整体数据,对用户进行关系网络的构建,并进行社群网络划分;

  5. 结果分析。

                                             

本案例重点介绍了数据挖掘中中文分词、文本聚类方法以及社群划分中随机游走法在实际案例中的应用。

三、核心技术

  • jiebaR分词

  • TF-IDF算法

  • PAM聚类

四、你可以将本模型用于

  • 教与学:可落地操作、学生参与度高、交互性强;

  • 科研:将PAM算法与具体行业应用结合,为科学研究提供素材;

  • 生产:将模型改进后直接用于实际生产环境:微博用户群体划分。

五、运行环境

windows/linux/mac OS,64位操作系统,内存:4GB及以上,R3.5.1。

六、资源展示


您尚未登录,请登录后购买! 【马上登录

评论已有 0

模型资源列表

基于K-Means算法的微博用户群体划分模型

相关模型推荐

联系我们

电话:(020)22205718

热线:40068-40020

地址:广州黄埔区开泰大道36号

邮编:510000

电邮:services@tipdm.com