基于LDA模型的中文微博热点话题发现

    在线阅读 下载PDF 导出详情
    摘要 针对微博文本数量增加速度快、信息量繁杂等问题,将LDA模型应用到热点话题的挖掘中,构建出微博热点话题的识别过程。首先应用LDA模型对微博语料库进行主题建模,采用困惑度方法确定最佳主题个数.通过Gibbs抽样算法实现参数推理,获得语料库的主题一词汇概率分布和文本一主题概率分布,在此基础上计算并识别出微博中的热点话题、热点词汇和热点话题微博。实验结果显示该模型与人工挑选的结果基本一致.表明该模型具有较好的热点识别效果。
    机构地区 不详
    出处 《宿州学院学报》 2014年4期
    关键词 LDA 微博 热点话题
    出版日期 2014年04月14日(中国Betway体育网页登陆平台首次上网日期,不代表论文的发表时间)
    • 相关文献
    Baidu
    map