摘要:
为了准确评价多层文本分类方法,解决传统平面分类评价指标应用到多层分类中的局限性,在研究基于概念树的多层文本分类方法基础上,有效利用多层结构中类别之间的层次关系和“亲疏”关系,提出了一组能够准确描述多层分类性能的扩展评价指标。利用错误分类样本分布定义了错误分类集中度,在评价分类结果的同时能够指导训练样本的选择过程,使得训练样本更具有代表性。通过中文新闻语料的分类实验,证明了扩展评价指标对于多层分类结果的评价更为准确,错误分类集中度有助于训练出更加准确的分类模型。
宋胜利, 鲍亮, 陈平. 多层文本分类性能评价方法[J]. Journal of Systems Engineering and Electronics, 2010, 32(5): 1088-1093.
SONG Sheng-li, BAO Liang, CHEN Ping. Hierarchical text classification and evaluation[J]. Journal of Systems Engineering and Electronics, 2010, 32(5): 1088-1093.