ca88亚洲城网站壹 、导出并读入微信聊天记录,      消除办法

① 、导出并读入微信聊天记录

壹 、wordcloud安装表明

迎接关怀天善智能
hellobi.com,我们是专注于商业智能BI,大数额,数据解析世界的垂直社区,学习、问答、求职,一站式化解!

   
参照百度的方法,使用同步帮手。安装同步帮手–连接手机(安卓苹果均可)–点击“其他效率“–点击微信图标即可进入聊天记录导出界面(极度简单)。

      install.packages(“wordcloud”);

天善大学svip包罗Excel
BI、Python爬虫案例、Python机器学习、Python数据地艺术学家、大数目、数据分析报告、数据分析师连串、深度学习、中华V语言案例10套课程火爆报名中,半场五折购,欢迎我们关怀www.hellobi.com/svip

     导出多少后直接用read.table读入表格

贰 、wordcloud2安装表达

一年一度的高等校园统招考试大日子又到了,

     命令:

      install.packages(“devtools”);     

在此处,浩彬老撕先预祝各位考生都能赢得满意的成就。

        dat <-
read.table(“message.txt”,skip=4,header=F,fill=TRUE) 
#skip跳过后边四行不用的音讯;导出时候的音讯缺点和失误(语音图片信息等)导致表格不规则,设置fill=TRUE强制读取。聊天记录音信位于第九列。

      devtools::install_github(“lchiffon/wordcloud2″,type=”source”) 

历年的高等高校统招考试都会发生众多的爆点,引起不少的话题,

二、使用Rwordseg包

      错误提醒:

现年也不例外,而且再立异的高峰,诞生了高等学校统招考试界的首先网红:

    2.1 使用从前要先安装

 

ca88亚洲城网站 1

        install.packages(“rJava”)
#需要java环境

ca88亚洲城网站 2

刚刚,路虎极光的文字云包“wordcloud2”也揭橥了,于是浩彬老撕也弄了三个高等高校统招考试文字云。

        install.packages(“Rwordseg”, repos = “http://R-Forge.R-project.org“)

      化解办法:

你说要图案选拔?咱有!帮忙粤语,那是必须的!多少代码?一行足矣!

    2.2
陆风X8wordseg具有强有力的汉语分词功效

      install.packages(“htmltools”);

Excuse me?!

        segmentCN(strwords) 
#strwords 是中文字符串,仍是能够文件路径,重返值是一个向量。

③ 、wordcloud参数表明

就这么不难?

        > a <- segmentCN(“你好R”)
        > str(a)
           chr [1:2] “你好” “R”

3.1 函数原型

正是如此简单!

    2.3
Kugawordseg还装有导入词库的效益

 wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,random.order=TRUE,
random.color=FALSE,
rot.per=.1,colors=”black”,ordered.colors=FALSE,use.r.layout=FALSE,…)

如下是完整兑现教程:

        
帮忙一般词库(txt格式)和搜狗细胞词库( scel 格式),使用办法:

3.2 常用参数

数据

          先从网上下载搜狗的细胞词库(scel格式),再设置

(1)words——关键词列表

数码要求万分简单,只供给两列分别是:词语,频率

         
installDict(dictFile,dicttype = c(“text”, “scel”), load = TRUE)  

(2)freq——关键词对应的词频列表

WordFreq 高考100 满分33 作文39 头发42 网红44

        
例如:

(3)scale——字号列表。c(最大字号, 最小字号)

详尽数据足以通过如下链接下载:

           installDict(“/home/ywliao/Tmp/日常用语大词库.scel”,dicttype
= “scel”, “richang”,load = TRUE)   

(4)min.freq——最小限制频数。低于此频数的第3词将不会被出示。

链接: http://pan.baidu.com/s/1jI4gEnc 密码: uids

    2.4 自定义词典

(5)max.words——限制词云图上重视词的多寡。最终出现在词云图上的首要性词数量不超过此限制。

2.环境要求:

        insertWords(“捂脸”)   #让某词组放入内部存款和储蓄器

(6)random.order——控制重点词在图上的排列顺序。T:关键词随机排列;F:关键词按频数从图核心地方往外降序排列,即频数大的词出现在着力地方。

(1)https://cran.r-project.org/上下载对应系统及版本的R软件(版本要求至少3.1.0),环境为win64的R;

        deleteWords(c(“捂脸”))  #剔除某词

(7)random.color——控制重点词的字体颜色。T:字体颜色随机分配;F:依照频数分配字体颜色。

(2)此次利用的包为“wordcloud2”,github上,,因为我们供给先安装“devtools”,再安装“wordcloud2”,代码如下:

三  、使用wordcloud2包

(8)rot.per——控制重庆大学词摆放角度。T:水平摆放;F:旋转90度。

install.packages(‘devtools’)

devtools::install_github(“lchiffon/wordcloud2”)

    3.1
安装

(9)colors——字体颜色列表

3兑现进程:

        install.packages(‘devtools’) 

(10)ordered.colors——控制字体颜色使用各种。T:遵照内定的种种给出每一种首要词字体颜色,(仿佛是讲求颜色列表中每种颜色一一对应重点词列表);F:任意给出字体颜色。

(1)高等高校统招考试文字云

       
devtools::install_github(“lchiffon/wordcloud2”)

(11)use.r.layout=T;F

data <- read.csv(‘c:/data.csv’, sep=”,” ,header = T)

#读取原始数据

data

#检查数据,查看是或不是留存乱码的气象

wordcloud2(data, size = 1, shape=’star’,color = ‘random-dark’,

backgroundColor = “white”,fontFamily = “微软雅黑”)

#绘图像和文字字云,其中data正是大家读取的数额,size是对应文字大小,shape是绘制形状

 

  肆 、wordcloud2参数表明

ca88亚洲城网站 3

    3.2 使用

4.1 函数原型

便是那般简单就落到实处了!

       

wordcloud2(data, size = 1, minSize = 0, gridSize =  0, 

此外,wordcloud2包里面打包了两份数据,分别为:

        wordcloud2(data, size = 1, minSize = 0, gridSize =  0,  

fontFamily = NULL, fontWeight = ‘normal’,

英文的:demoFreq

    fontFamily = NULL, fontWeight = ‘normal’,  

color = ‘random-dark’, backgroundColor = “white”,
minRotation = -pi/4, maxRotation = pi/4, rotateRatio = 0.4, 
shape = ‘circle’, ellipticity = 0.65, widgetsize = NULL)

中文的:demoFreqC

   
color = ‘random-dark’, backgroundColor = “white”, 

4.2
常用参数:

(2)英文Demo:

   
minRotation = -pi/4, maxRotation = pi/4, rotateRatio = 0.4, 

(1)data:词云生成数据,包涵具体词语以及效用;

大家采取Sample数据,绘制四个心形图:

   
shape = ‘circle’, ellipticity = 0.65, widgetsize = NULL)

(2)size:字体大小,私下认可为1,一般的话该值越小,生成的形象轮廓越显然;

wordcloud2(demoFreq, size = 1,color = ‘random-light’,

shape = ‘cardioid’,backgroundColor = “snow”)

    参数:

(3)fontFamily:字体,如‘微软雅黑’;

ca88亚洲城网站 4

(1)data:词云生成多少,包罗具体词语以及功用;

(4)fontWeight:字体粗细,包含‘normal’,‘bold’以及‘600’;;

在此处例子里面,大家修改了字体颜色,并把图案造型为心型,最后加上背景颜色。

(2)size:字体大小,暗中同意为1,一般的话该值越小,生成的样子轮廓越显然;

(5)color:字体颜色,能够选用‘random-dark’以及‘random-light’,其实就是颜色色系;

是否有种很和气的觉得,差不多是可视化必备利器!

(3)fontFamily:字体,如‘微软雅黑’;

(6)backgroundColor:背景颜色,扶助PRADO语言中的常用颜色,如‘gray’,‘blcak’,不过还帮助不住特别具体的颜色选拔,如‘gray20’;

(3)中文Demo

(4)fontWeight:字体粗细,包涵‘normal’,‘bold’以及‘600’;;

(7)min罗恩tatin与max罗恩tatin:字体旋转角度范围的最小值以及最大值,选定后,字体会在该限量内随意旋转;

wordcloud2(demoFreqC, size = 1,color = ‘random-light’,

backgroundColor = “gray”, fontWeight=’bold’,fontFamily = “微软雅黑”,

minRotation = -pi/3, maxRotation = pi/3,rotateRatio = 0.8)

(5)color:字体颜色,能够采取‘random-dark’以及‘max罗恩tatin:字体旋转角度范围的最小值以及最大值,选定后,字体会在该限制内随意旋转;(三角形),‘pentagon’(五边形);

(8)rotationRation:字体旋转比例,如设定为1,则全部词语都会生出旋转;

ca88亚洲城网站 5

   例如:wordcloud2(freq_dat, size =
1,shape = ‘star’)#生成星星状的词云

(9)shape:词云形状选用,暗许是‘circle’,即圆形。还是能够挑选‘cardioid’(苹果形或心形),‘star’(星形),‘diamond’(钻石),‘triangle-forward’(三角形),‘triangle’(三角形),‘pentagon’(五边形);

在上头例子,大家再度设定了字体为粗体,字体旋转角度在正负60度之间,旋转比例为十分八。

四、实例

 

4.wordcloud2函数验证

   
情人节将到,将您和TA的闲聊记录生成词云发送给TA定会给TA三个惊喜。

备考:粤语分词工具:

wordcloud2(data, size = 1, minSize = 0, gridSize = 0,

fontFamily = NULL, fontWeight = ‘normal’,

color = ‘random-dark’, backgroundColor = “white”,

minRotation = -pi/4, maxRotation = pi/4, rotateRatio = 0.4,

shape = ‘circle’, ellipticity = 0.65, widgetsize = NULL)

    分析:

 

常用参数:

     将自家和gf的闲聊记录生成文件oak_message.txt,在网上下载搜狗细胞词库“网络平日用语大词库.scel”和“互连网平时用语.scel”,安装了所须求的rJava,Odysseywordseg和wordcloud2包。PAJERO代码如下:

install.packages(“Rwordseg”, repos = “http://R-Forge.R-project.org“)

(1)data:词云生成数据,包蕴具体词语以及功能;

        library(rJava)
        library(Rwordseg)
        library(wordcloud2)
        #加盟日常用语细胞词库
      installDict(“/home/ywliao/Tmp/常常用语大词库.scel”,dicttype =
“scel”, “richang”,load = TRUE)
      installDict(“/home/ywliao/Tmp/互连网日常用语.scel”,dicttype =
“scel”, “wangluorichang”,load = TRUE)
      insertWords(c(“捂脸”,”亲亲”))
      dat <- read.table(“oak_message.txt”,skip=4,header=F,na.strings
= “NA”,fill=TRUE)
      all_message <- “”
      for (msg in dat$V7){
      all_message <- c(all_message,segmentCN(msg))
}
      all_message <- all_message[all_message != “”]
#去掉空音信””
      freq_dat <- as.data.frame(table(all_message))
      wordcloud2(freq_dat,size = 2, minRotation = -pi/6, maxRotation =
-pi/6,  
           rotateRatio = 1) #板报词云
      wordcloud2(freq_dat, size = 1,shape = ‘star’) #星状词云
     wordcloud2(freq_dat, size = 2, fontFamily = “微软雅黑”,  
           color = “random-light”, backgroundColor = “grey”)  #
海报词云

示范程序:

(2)size:字体大小,暗中同意为1,一般的话该值越小,生成的形态概略越显明;

    结果输出为网页文件,打开网页后可截图

#首先步,文本分词

(3)fontFamily:字体,如‘微软雅黑’;

ca88亚洲城网站 6

require(Rwordseg)

(4)fontWeight:字体粗细,包涵‘normal’,‘bold’以及‘600’;;

   
什么?博主的gf聊天词云呢?怎么是以此?没错,博主正是学霸哈哈哈哈!末了祝大家情人节喜悦!(不管怎么样,本人都要心满意足!)

test<- readLines(“E:\\FBB1.txt”,encoding=’UTF-8′)     #读取数据

(5)color:字体颜色,能够选用‘random-dark’以及‘random-light’,其实就是颜色色系;

 

res = test[test != ” “]      #读取test,且剔除test=“ ”

(6)backgroundColor:背景颜色,帮忙PRADO语言中的常用颜色,如‘gray’,‘blcak’,可是还帮助不断越发切实的颜料选择,如‘gray20’;

 

words = unlist(lapply(X = res,FUN = segmentCN))  
#分词,并调整表结构,将有相同词频的词归类

(7)min罗恩tatin与max罗恩tatin:字体旋转角度范围的最小值以及最大值,选定后,字体会在该限量内随机旋转;

参考资料:

word = lapply(X = words,FUN = strsplit,” “)      
#给每一种词依据各样赋个顺序指

(8)rotationRation:字体旋转比例,如设定为1,则整个用语都会生出旋转;

计算机上导出微信聊天记录:http://www.cr173.com/html/64463\_1.htm

v = table(unlist(word))               #重建表

(9)shape:词云形状采用,暗中同意是‘circle’,即圆形。还足以采用‘cardioid’(苹果形或心形),‘star’(星形),‘diamond’(钻石),‘triangle-forward’(三角形),‘triangle’(三角形),‘pentagon’(五边形);

Rwordseq包:http://blog.csdn.net/sinat\_26917383/article/details/51056068
; http://blog.csdn.net/sinat\_26917383/article/details/51056068

v = sort(v,deceasing=T)           #降序排列

此地尤其鸣谢wordcolud2的翼虎包作者:郎大为Chiffon

wordcloud2包:http://blog.csdn.net/sinat\_26917383/article/details/51620019

v[1:100]

第叁实战!十中国共产党第五次全国代表大会案例,开启奥迪Q3语言实战之门金钥匙

                 

head(v)                                           #给每列字段赋标题

ca88亚洲城网站 7

 

d = data.frame(word = names(v),freq = v)         #改变标题

正文作者:天善智能社区专家浩彬老撕

write.csv(d,”E:\\学习.csv”,header = T)        
 #导出数据,为下一步做准备

原稿链接:https://ask.hellobi.com/blog/wetalkdata/4092

 

 

 

 

相关文章