职位描述
该职位已进行加V认证,请放心投递
负责nlp大模型生成内容的可控可信方向的研发和落地。
工作内容包括大模型基座的训练,对比,基于公开数据集/业务数据集的微调, 生成知识的可控性,准确性方案研发,以及大模型小型化相关技术来保证模型的落地应用。
职位要求
1. 计算机相关专业获得硕士学位, 博士优先, 发表过大模型相关研究ai顶会论文优先;
2. 对nlp主流大模型如gpt3/chatgpt/t5/palm/llama/glm等的原理和差异有深入的理解;
3. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架megatron-lm/deepspeed等多机多卡方案,有百亿/千亿nlp大模型训练调优经验优先;
4. 熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorrt;
5. 有良好的代码开发能力,有开源项目开发经验优先。
工作地点
地址:北京朝阳区北京-朝阳区环球金融中心
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕
职位发布者
人力资源..HR
蚂蚁科技集团股份有限公司
- 银行
- 1000人以上
- 中外合资(合资·合作)
- 浙江省杭州市西湖区西溪新座5幢802室
相似职位
-
算法工程师(013927) 面议北京 应届毕业生 学历不限维沃移动通信有限公司
-
对话算法工程师/专家(llm) 35000-60000元北京 应届毕业生 学历不限广州小鹏汽车科技有限公司
-
阿里妈妈联盟-商业化产品运营(内容种草)-北京 20000-30000元北京 应届毕业生 本科阿里巴巴(中国)有限公司
-
数据智能研发组_视觉算法工程师(j66499) 20000-40000元北京 应届毕业生 本科百度在线网络技术(北京)有限公司
-
qa及运管组_测试开发工程师(j64041) 20000-40000元北京 应届毕业生 本科百度在线网络技术(北京)有限公司
-
在线数据消费研发组_golang 服务端研发工程师(j64078) 20000-40000元北京 应届毕业生 本科百度在线网络技术(北京)有限公司