文字雲介紹
數據雲用字體的大小和顏色來表現數值,與標籤雲相似,區別是標籤雲常用於統計標籤出現的頻率,Python文字雲是利用結巴斷詞系統初步處理自然語料,再進行詞頻計算、統計,最後以圖片、顏色、大小等不同的變化來呈現資料視覺化
以下為範例程式碼,大家可以先用這斷程式碼做基本的文字雲變化
#-*- coding: utf-8 -*-
import jieba
import sys
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
from wordcloud import WordCloud
from os import path
from scipy.misc import imread
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
text_from_file_with_apath = open('test.txt', 'r',encoding = 'utf8').read()
wordlist_after_jieba = jieba.cut(text_from_file_with_apath, cut_all = True)
wl_space_split = " ".join(wordlist_after_jieba)
print(wl_space_split)
#讀取mask/color圖片
abel_mask = np.array(Image.open('picture.png'))
my_wordcloud = WordCloud(font_path='Songti.ttc',#字體設定
background_color = 'white',#背景顏色
mask = abel_mask,#設置背景圖案
max_words = 10000,#設定最大現實的字數
max_font_size = 100,#設定字體最大值
random_state = 40,#設定有多少種隨機生成狀態,即有多少種配色方案
scale =1.5,
width=900,
height=600).generate(wl_space_split)
image_colors = ImageColorGenerator(abel_mask)
plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()
補充資料
Wordcloud
https://amueller.github.io/word_cloud/generated/wordcloud.WordCloud.html
文字雲的運用非常廣泛,像是臉書好友雲、最常使用辭彙等,都是利用文字雲的方式做多變化的呈現
新聞:https://www.g-cores.com/articles/26152?share=true
基於每周上課時間有限,各位可多多利用網路上的開放資源進行練習唷