搜索引擎中分类技术研究

    在线阅读 下载PDF 导出详情
    摘要 本文提出了一种基于主题采集的Web文档自动分类算法,该算法对朴素贝叶斯分类模型进行了改进。利用该算法,我们实现了一个基于主题信息采集的网页分类系统。文中着重对该系统的页面解析、中文分词和文本分类模块进行了论述,并对改进后的贝叶斯分类方法进行了评估。实验结果表明,该算法对网页分类有较高的准确性。
    机构地区 不详
    出版日期 2008年02月12日(中国Betway体育网页登陆平台首次上网日期,不代表论文的发表时间)
    • 相关文献
    Baidu
    map