词云图wordcloud学习笔记

词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。

github:https://github.com/amueller/word_cloud

官方地址:https://amueller.github.io/word_cloud/

wordcloud 是一个python实现的高效词频可视化工具,除了可以使用各种mask和颜色提供个性化的掩膜,还可以通过api便捷的挑战获得个性化的词云输出。

安装

代码语言:javascript复制pip install wordcloudwordcloud 包含三个主要api

WordCloud([font_path, width, height, …]) 最重要的函数生成和描绘词云.ImageColorGenerator(image[, default_color]) 通过输入rgb图像获得色彩信息.random_color_func([word, font_size, …]) 随机渲染颜色.wordcloud库把词云当作一个WordCloud对象

wordcloud.WordCloud()代表一个文本对应的词云可以根据文本中词语出现的频率等参数绘制词云绘制词云的形状、尺寸和颜色都可以设定wordcloud库常规方法

代码语言:javascript复制w = wordcloud.WordCloud()以WordCloud对象为基础配置参数、加载文本、输出文件