职位描述
1、大模型技术链路相关基础模块的算法设计与工程实现;
2、大模型落地应用的方案设计与系统实现;
3、大模型应用创新设计与开发;
4、大模型基础能力,高阶能力,领域适配能力的效果提升和优化;
5、大规模数据高效解析,挖掘和统计的方案设计和开发。
职位要求
1、有机器学习、自然语言处理、计算机视觉或相关领域的硕士或博士学位;
2、具有3年以上大规模语言模型和多模态模型开发和优化的经验;
3、具备快速复现和改良开源模型的能力,深入理解目前主流大模型的技术框架以及核心问题;
4、有过硬的代码实践经验,熟练使用Pytorch/Megatron-deepspeed/Megatron-LM等分布式训练框架,深入理解transformer,LSTM,GNN,StableDiffusion,GAN等神经网络的基础结构与实现细节;
5、有强化学习系统化落地实施经验优先;有开源代码贡献的优先;有较好学术成果优先;有ACM竞赛。
- 咨询(财会·法律·人力资源)
- 21-50人
- 中外合资(合资·合作)
- 泥城镇新城路2号23幢N1108室