• 人工智能与仿真 • 下一篇
陈平1,匡尧2,胡景懿3,王向阳2,蔡静1
收稿日期:
2019-11-20
修回日期:
2019-12-30
发布日期:
2019-12-30
出版日期:
2020-05-09
通讯作者:
陈平
Received:
2019-11-20
Revised:
2019-12-30
Online:
2019-12-30
Published:
2020-05-09
摘要: 针对电力审计领域的文本具有行业特征明显、文本特征相似度高、分类边界模糊的特性,提出了增强领域 特征的电力审计文本分类方法。首先构建面向电力审计的专业词典,提出EF-Doc2VecC模型再联合专业词典增强文本的特征,最后送入BiLSTM分类器实现专业领域的文本分类。实验结果表明,针对专业性显著的电力审计类文本分类,EF-Doc2Vec 模型,在召回率、特异性、准确率和 F1值分类指标上比对照模型 Doc2VecC 分别高出 4,2,2,2 个百分点;针对通用领域文本分类,EF-Doc2VecC模型在召回率、差异性、准确率和F1值分类指标上比对照模型Doc2VecC高出 3,3,4,4个百分点。另外,EF-Doc2VecC 模型在电力审计类的文本分类性能分别比通用领域高出 4,5,3,3个百分点。因此,提出的文本向量表示方法及文本分类方法,不仅能提升通用领域的文本分类性能,还能显著提升垂直领域的文本细粒度分类性能。
中图分类号:
陈平 匡尧 胡景懿 王向阳 蔡静. 增强领域特征的电力审计文本分类方法[J]. 计算机应用, DOI: 10.11772/j.issn.1001-9081.2019111973.
[1] | 李瑞 李贯峰 胡德洲 高文馨. 融合路径与子图特征的知识图谱多跳推理模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 马汉达 吴亚东. 多域时空图神经网络的空气质量预测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[3] | 夏吾吉, 黄鹤鸣, 更藏措毛, 范玉涛. 基于无监督学习和监督学习的抽取式文本摘要综述[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1035-1048. |
[4] | 袁泉, 陈昌平, 陈泽, 詹林峰. 基于BERT的两次注意力机制远程监督关系抽取[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1080-1085. |
[5] | 高龙涛, 李娜娜. 基于方面感知注意力增强的方面情感三元组抽取[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1049-1057. |
[6] | 杨先凤, 汤依磊, 李自强. 基于交替注意力机制和图卷积网络的方面级情感分析模型[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1058-1064. |
[7] | 王海涵, 朱焱. 融合反讽机制的攻击性言论检测[J]. 《计算机应用》唯一官方网站, 2024, 44(4): 1065-1071. |
[8] | 赵志强 马培红 黑新宏. 基于双重注意力机制的人群计数方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[9] | 李金金 桑国明 张益嘉. APK-CNN和Transformer增强的多域虚假新闻检测模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 黄云川 江永全 黄骏涛 杨燕. 基于元图同构网络的分子毒性预测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 高颖杰 林民 斯日古楞 李斌 张树钧. 基于片段抽取原型网络的古籍文本断句标点提示学习方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 贾宗泽, 高鹏飞, 马应龙, 刘晓峰, 夏海鑫. 基于注意力机制的多特征融合对话行为层次化分类方法[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 715-721. |
[13] | 董永峰, 白佳明, 王利琴, 王旭. 融合先验知识和字形特征的中文命名实体识别[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 702-708. |
[14] | 郭磊, 贾真, 李天瑞. 面向方面级情感分析的交互式关系图注意力网络[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 696-701. |
[15] | 尚爱国, 朱欣娟. 基于多任务学习的意图检测和槽位填充联合方法[J]. 《计算机应用》唯一官方网站, 2024, 44(3): 690-695. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||