工作职责:1、参与公司感知产品线相关项目的研发、落地、实施,并根据产品的持续演进不断更新算法;2、参与业务场景相关大模型和类ChatGPT技术的落地,承担基于大模型相关项目的研发工作,包括prompt设计、SFT、RW、RLHF、COT等;3、自然语言理解算法和技术的研发、完成相关算法和软件技术文档、专利的撰写;4、关注大模型研究领域的前沿技术发展,基于场景进行技术迭代,不定期分享技术心得;5、完成上级领导安排的其他任务。岗位要求:1、研究生及以上学历,计算机、电子、通信、自动化、人工智能等相关专业;2、至少熟悉一门计算机编程语言,包括并不限于C/C++/Java/Go/Python;熟悉常用算法和数据结构,有扎实的工程实现能力;3、熟悉NLP主流的大模型,如Llama,chatglm、百川,GPT3等;4、熟练使用深度学习框架pytorch、tensorflow中的一种,熟悉大模型训练框架deepspeed及多机多卡训练解决方案,有百亿以上参数大模型训练调优经验的优先5、熟悉模型轻量化技术,如量化、剪枝和蒸馏等,熟悉onnx,TensorRT6、熟悉基于大模型的一些常见应用,如本地知识库、智能问答等,熟悉知识图谱构建的优先7、熟悉自监督学习的优先8、有优秀的沟通能力和团队合作能力;语言要求:英语
成都-成华区 (成都-成华区中电·信谊商务楼中电信谊商务楼) 查看地图