FAtNet: Cost-Effective Approach Towards Mitigating the Linguistic Bias in Speaker Verification Systems
FAtNet:降低说话人验证系统中语言偏见的成本有效方法
基于深度神经网络(DNN)的自然语言处理(NLP)系统中的语言偏见是一个需要关注的关键问题。在安全系统(如说话人验证)的情况下,这一问题进一步加剧,因为公平至关重要。说话人验证系统是一种智能系统,用于确定两个语音记录是否属于同一说话人。这种以人为导向的安全系统应可供不同语言的人使用。因此,针对一种语言的语音训练的说话人验证系统在测试其他语言时应该是通用的。然而,基于DNN的模型通常依赖于语言。先前的工作探讨了域适应,以微调域外语言的预训练模型。为每种现有语言单独微调模型是昂贵的。因此,它限制了系统的可用性。本文提出了将轻量级嵌入与现有说话人验证系统集成以在不进行自适应的情况下减轻语言偏见的成本效益思想。这项工作的动机是理论假设,即注意框架可以帮助生成语言不可知的嵌入。为了对这一假设进行科学验证,我们提出了两个框架注意网络,并研究了它们与12种语言基线的整合效果。实验结果表明,框架注意嵌入可以经济有效地减少语言偏见,提高基线的可用性。