| 所在单位: | 哈尔滨工业大学 | 项目类型: | 信息传输、计算机服务和软件业 |
| 所属领域: | 新一代信息技术 | 项目年份: | 2025 |
| 项目状态: | 可产业化 | 技术成熟度: | 可产业化 |
| 联系人: | 翁子林 | 联系人电话: | 获取号码 |
| 项目投资经费: | 合作方式: | 其它 |
针对中文到斯拉夫语系翻译过程中存在的翻译质量不稳定、领域适应性差等问题,提出了一套基于底座预训练语言模型、语言聚类训练策略、多语言优化目标、模型架构等四个维度的综合解决方案。通过分析斯拉夫语言的内在语言特性及翻译语料的统计特征,提出了多目标自蒸馏策略,解决了多语言数据不均衡带来的收敛不一致性问题;发明了帕累托互蒸馏训练算法,突破了多语言帕累托优化困境;实现了基于梯度冲突的自适应参数分配策略,有效缓解多语言参数冲突问题。