该职位来源于猎聘 岗位职责: 深刻理解最前沿的深度学习网络算法,包括模型结构的演化,强化学习算法,KV cache优化,专家均衡策略,低精度算法等。 定位训练和推理过程中的精度问题,包括分布式训练收敛,推理精度达标。 算子、数学函数、硬件指令的误差分析和精度改进。 与内部和外部研究人员合作,实现深度学习相关的算法优化、创新和工程化。 任职要求: 数学、计算机科学或相关专业硕士及以上学历,博士学位优先。 数学方面有深厚的功底、浓厚的兴趣。 在深度学习和神经网络方面有着扎实的背景,包括训练或推理。 熟悉前沿大语言模型、多模态模型、生成式模型。 具备分析、建模和改进模型和算法精度的丰富经验。 C++