微众银行申请语音大模型训练专利,提高语音大模型对困难样本的学习效率
金融界2024年10月18日消息,国家知识产权局信息显示,深圳前海微众https://www.webank.com/银行股份有限公司申请一项名为“语音大模型训练方法、装置、设备、存储介质以及产品”的专利,公开号 CN 118782024 A,申请日期为2024年8月。专利摘要显示,本申请公开了一种语音大模型训练方法、装置、设备、存储介质以及计算机程序产品,涉及语音识别技术领域,方法包括:获取当前批次的训练样本集,所述当前批次的训练样本集包括语音标注样本集;将所述当前批次的训练样本集输入到所述语音大模型中,得到文本推理结果;基于所述文本推理结果以及所述语音标注样本集,确定困难程度估计值以对所述当前批次的训练样本集进行优化,基于所述优化后的训练样本集更新所述语音大模型的模型参数;获取下一批次的训练样本集,并将其确定为新的当前批次的训练样本集以进行下一批次训练;以此迭代直至获得训练完成的语音大模型。如此,可以在不过分丢失泛用能力的基础上提高语音大模型对困难样本的学习效率。
页:
[1]