LLM工程师(Large Language Model Engineer)是指在人工智能(AI)领域中,专注于开发和应用大型自然语言处理(NLP)模型的工程师。LLM工程师的主要职责包括:
应用研发:
负责将LLM应用于垂直领域,如对话式客服咨询、文档报告总结、多轮问答咨询等,实现LLM在具体业务中的落地。
技术跟进:
持续跟踪LLM及其相关技术的发展,以及各类前沿技术和开源方案在垂直领域中的应用落地。
模型全流程工作:
参与领域模型的全流程工作,包括数据收集、训练、评测、推理部署等。
算法研究与应用架构设计:
负责自然语言处理大模型的算法研究,并根据实际业务需求进行应用架构设计与研发工作。
模型优化:
推进数据建设、指令微调、偏好对齐、模型优化等方面的工作,以提高模型质量和适应性。
团队协作:
与业务和工程团队紧密配合,理解业务需求,研发先进的AI算法,提升广告投放决策的有效性。
LLM工程师通常需要具备计算机科学、软件工程或人工智能相关专业的硕士及以上学历,并且拥有自然语言处理项目经验和相关的算法工程化经验。