永远的神！周杰伦的这首阿爸，唱出了多少父爱如山！|挚爱音乐网

永远的神！周杰伦的这首阿爸，唱出了多少父爱如山！

大家今天跟大家聊聊我这几天捣鼓的“阿爸周杰伦”这个事儿，说起来也是挺有意思的。

事情是这样的，最近突然又开始怀旧了，杰伦的歌又被我翻出来循环播放。听着听着就想，能不能搞点不一样的东西，比如用代码生成点

说干就干！第一步，找数据。我先在网上搜罗了一堆杰伦的歌词，什么《双截棍》、《青花瓷》、《稻香》，反正能找到的都扒下来了，一股脑儿塞进了一个文本文件里。这算是我的“语料库”了。

永远的神！周杰伦的这首阿爸，唱出了多少父爱如山！

第二步，数据预处理。歌词这玩意儿，格式乱七八糟的，还有各种标点符号、换行符啥的，直接用肯定不行。所以我就写了个Python脚本，把这些脏数据都清洗一遍。主要做了这么几件事：

这一步挺费劲的，尤其是分词，有些词语需要手动调整，才能保证效果。

第三步，搭建模型。我用了个简单的马尔可夫链模型，这玩意儿简单易懂，实现起来也快。简单来说，就是统计每个词语后面出现其他词语的概率。比如，“你”后面最常出现的是“好”，那模型就会记住这个规律。

第四步，生成歌词。有了模型，就可以开始生成“歌词”了。我先随机选择一个开头词语，然后根据模型，依次生成后面的词语，直到生成足够长的句子为止。这过程就像抽奖一样，每次都根据概率随机选择下一个词语。

第五步，调参优化。刚开始生成的歌词，那叫一个惨不忍睹，完全不知所云。所以我就开始不断调整参数，比如调整模型中词语的概率分布，调整生成句子的长度等等。这个过程是个体力活，需要不断尝试，才能找到最佳的参数组合。

第六步，人工润色。生成出来的歌词，虽然比一开始好多了，但还是有些不通顺的地方。所以我就手动对这些歌词进行润色，修改一些语病，调整一下节奏感。尽量让它听起来像那么回事儿。

把生成的“歌词”拿给朋友们看，大家都说挺有意思的，虽然不能完全达到杰伦的水平，但至少能模仿个七八分像。哈哈，也算是小有成就感！

永远的神！周杰伦的这首阿爸，唱出了多少父爱如山！

这回实践，让我对自然语言处理有了更深的理解。虽然只是个简单的模型，但也能生成一些有趣的东西。以后有机会，我还想尝试更复杂的模型，看看能不能生成更像样的“杰伦风”歌词。

本文转载自互联网，如有侵权，联系删除

永远的神！周杰伦的这首阿爸，唱出了多少父爱如山！