基于 LDA 的国内外区块链主题挖掘与演化分析
大约 1 分钟
基于 LDA 的国内外区块链主题挖掘与演化分析
这篇文献给出了词汇挖掘的具体实现方法,还挺有技术含量的
传统上,词共现分析等传统的主题分析方法在面对现如今数量激增、内容丰富的文本信息时显得心余力绌,随着研究发展,主题分析方法逐渐形成了基于社会网络分析和基于主题模型分析;
- 社会网络分析法由图论发展而来,用于揭示个体之间以及个体同网络整体之间的关系特征;(基于网络关系挖掘出的主题虽然可信度高,但对主题的无权重区分导致无法科学地表现主题强度);
- 基于主题模型的分析方法用于对文本中潜在的语义关系和主题信息进行挖掘,潜在迪利克雷分布 ( Latent Dirichlet Allocation,LDA ) 模型是当下主流的主题模型之一,最初由 Blei 于 2003 年提出;其作为一种非监 督机器学习方法,被广泛应用于文本挖掘方向,能够挖 掘出初始文档中的潜在主题,但由于 LDA 模型忽略了 主题词之间的潜在语义联系,因而在短文本中挖掘的效果较为有限
该论文利用时间窗口对 LDA 模型进行改进,研究思路图: