374.
针对中文命名实体识别任务中存在的实体边界模糊、结构复杂及专业领域数据稀缺等问题,提出了一种基于Biaffine机制和词汇增强的中文命名实体识别模型WLASC。在模型的编码层中设计了动态双仿射模块和多级词汇增强模块,通过引入相对位置编码和双仿射变换增强上下文建模能力,有效解决实体边界模糊问题;同时利用多级词汇信息和多头注意力机制加权融合不同的粒度特征,提升嵌套实体识别精度并减少对标注数据的依赖。此外,采用双向门控循环神经网络对提取特征进行融合以增强模型表达能力。在民航飞行安全领域数据集CANER及公共数据集Weibo、Resume上的实验结果表明,改进后的算法F
1值最高分别提升9.77%、6.97%和1.38%,最低提升2.72%、1.27%和0.31%。在CANER数据集上的实验证明,该模型可有效解决中文特殊领域中结构复杂以及专业术语的实体识别,在公共数据集上的实验表明,该模型具有较好的泛化能力。… …
相似文献