×
资源与产业

计算机软件及计算机应用论文_基于多语BERT的无

文章摘要:攻击性言论对社会安定造成严重不良影响,目前对攻击性言论自动检测主要集中在少数几种高资源语言,而对低资源语言缺少足够的攻击性言论标注语料导致检测较困难的情形,提出了一种跨语言无监督攻击性迁移检测方法。首先,使用多语BERT模型在高资源英语数据集上进行对攻击性特征的学习,得到一个原模型;然后,通过分析英语与丹麦语、阿拉伯语、土耳其语、希腊语的语言相似程度,将原模型迁移到这四种低资源语言上,实现对低资源语言的攻击性言论自动检测。实验结果显示,与BERT、LR、SVM、MLP四种方法相比,所提的方法在检测丹麦语、阿拉伯语、土耳其语、希腊语四种语言上的准确率和F1值上提高了近2个百分点。所提出的方法无监督攻击性检测准确率接近目前的有监督检测,可见所提出的采用了跨语言模型迁移学习和迁移检测相结合方法,能够实现对低资源语言的无监督攻击性检测。

文章关键词:

论文分类号:TP391.1

上一篇:体育论文_冷资源成“热产业” 冰雪运动席卷南
下一篇:没有了

Top