说起这首《你爱我像谁》,那可真是暴露年龄的一首歌。最近心血来潮,想用Python给它做个简单的可视化分析,看看能不能玩出点新花样。
第一步:准备歌词。
网上搜了一下,找到了歌词文本,复制粘贴到一个txt文件里,命名为“ni_ai_wo_xiang_*”。这步最简单粗暴。
第二步:安装必要的库。
打开我的终端,pip安装走起:
pip install jieba
(用来分词,中文文本分析必备)pip install wordcloud
(用来生成词云,让歌词可视化)pip install matplotlib
(用来展示词云图片)
确保这三个库都安装好了,不然代码跑不起来。
第三步:开始写Python代码。
我新建了一个python文件,命名为“lyric_*”,然后开始撸代码。
导入需要的库:

import jieba
from wordcloud import WordCloud
import * as plt
然后,读取歌词文件:

with open('ni_ai_wo_xiang_*', 'r', encoding='utf-8') as f:
lyric = *()
进行分词处理:
word_list = *(lyric)

word_str = ' '.join(word_list)
生成词云:
wordcloud = WordCloud(
font_path='*', # 记得下载一个中文字体,不然会显示方块

background_color='white',
width=800,
height=600
).generate(word_str)
显示词云图片:
*(figsize=(10, 8))
*(wordcloud)
*('off') # 关闭坐标轴
第四步:运行代码,查看效果。
在终端运行 python lyric_*
, 跑完之后,Matplotlib会弹出一个窗口,显示生成的词云。
结果:
词云图里,“爱”、“像”、“谁”、“你”、“我” 这些词出现的频率最高,一下子就把歌曲的主题突显出来了。虽然简单,但还挺有意思的。
这回用Python做歌词分析,主要是想回忆一下这首老歌,顺便练练手。整个过程挺简单的,主要是分词和生成词云。下次可以尝试更复杂的分析,比如情感分析,看看这首歌是偏甜蜜还是偏忧伤。