➤➤➤网站首页 > 更新日志 > >

logo
推荐软件

[微信聊天记录在线制作制作]用R语言做自己的微信聊天记录词云

作者:admin
来源:www.pptvwang.com
时间:2020-10-15 点击:

微信聊天记录在线制作制作

  突发奇想,想干一个微信聊天纪录词云,因此就动手能力了。

  最终的实际效果如下图所显示

  啊……我真的是一个开朗的女生。

  好啦,下边便是流程啦~ 请多多指教。

  第一步:导出来微信聊天纪录。

  我应用的手机上是安卓手机系统,是依照?如何备份微信聊天纪录—知乎问答?常说的方式导出的。

  假如你应用的是iPhone,能够依照?记一次微信聊天文本导出来到Excel工作中—知乎问答? 第二一部分常说的方式导出来纪录。这儿有点儿难题,我依照所述方式导出来fts_message文档,开启后发觉仅有微信群。之后发觉微信聊天记录实际上是存储在MM.sqlite文档里,导出来MM.sqlite文档应用sqlcipher开启,和每一个人的微信聊天记录各自存储在一个表中,文件格式是"chat_***************"。

  由于我是准备做一个自身的微信聊天记录词云(换句话说,只包括我自己传出的信息内容),因此 在最终常用的sql语法为(此英语的语法不适感用以iPhone微信聊天记录文档):

  注:微信聊天记录中的大红包、小表情及其连接等在闲聊文档中以一长串无意义标识符存有,type =? 1 能够过虑掉这种标识符;而isSend = 1过虑没了他人发送给我的信息。

  随后将表mywords导出来,储存为txt格式。

  第二步:用R语言词性标注并做词云。

  #载入词性标注及其做词云常用的包

  #引进微信聊天记录

  myfile包括了我传出的4541句话。

  #开展词性标注

  词性标注的实际效果是依据你所免费下载的字典决策的,可是仅依靠从在网上免费下载并加上的字典开展词性标注很有可能达不上理想化的实际效果。

  例如,“奥宇”是大家院校的饭店名,在网上的字典毫无疑问不容易有这一语汇,也有“捂着脸”这个词也被分离了。因此 开展这一步时,要数次查询词性标注結果并应用insertWords()手动式加上一些你常见的语汇,直至做到理想化的词性标注实际效果。

  但是这类方式过度繁杂,最好是的方式是以手机上的电脑输入法运用导出来自身的客户词典,不清楚别的电脑输入法能不能,我应用的讯飞输入法是能够导出来的,一共导出来了个语汇。将这一语汇文档加上进字典,对词性标注是很有协助的。

  接下去这一步要除掉词性标注中的停用词,包含“的”、“在”、“吧”、“呢”、“就”、“那么就”这些无意义的语汇。

  #去停词

  这一步要除掉词性标注中的停用词,包含但不限于“的”、“在”、“吧”、“呢”、“就”、“那么就”……等无意义的语汇。

  • 上一篇:[微信聊天记录实时共享]通过微信能不能查询到对方所在的精确位置
  • 下一篇:[微信聊天记录实时同步]微信聊天记录实时同步
  • 大家还在看

    网站地图 | 关于网站 | 

    Copyright © 2015-2019 www.pptvwang.com All Rights Reserved