本发明涉及语法纠错,尤其是指一种融入源信息的语法纠错早停多轮解码方法和系统。
背景技术:
1、语法纠错(grammatical error correction,gec)旨在自动检查和纠正语句中的语法错误,确保文本语法的正确性,规范语句表述。语法纠错在自然语言处理中具有广泛的应用场景,包括写作助手、搜索引擎、语音识别和语言翻译等。目前语法纠错任务主要采用两种方法解决,一种是序列到编辑方法(sequence-to-edit,seq2edit),将语法纠错任务视为序列标记任务,通过多轮迭代预测每个词的编辑标记(保留、删除、插入、替换等),直到所有词都被预测为保留标记。另一种是序列到序列方法(sequence-to-sequence,seq2seq),将语法纠错任务看作文本到文本的重构,然后直接利用编码器-解码器架构的神经网络模型纠正语法错误。目前两种方法通常都利用预训练模型来获得更好的性能,例如序列到编辑方法使用bert、xlnet,序列到序列方法则