目前专注于LLM(大型语言模型)的微调和可靠智能体的创建工作。致力于构建一种复杂的智能体,它能够整合角色扮演领域的专用模型与通用模型的决策能力,以此来实现高度灵活的角色扮演体验。
简介
出生日期
08/07/1998
技能
ai相关技能
精通各类模型后训练方法,例如:Supervised Fine-Tuning, RLHF(PPO), DPO, KTO
熟悉并了解各类模型量化方法,从而减少模型推理成本,例如:PTQ(GPTQ),QAT(AWQ),AQLM,OFTQ(bitsandbytes, HQQ, EETQ)
精通深度学习框架pytorch, 大模型训练框架 transformers), 图像生成框架 diffusions
各类商业大模型api调用,claude逆向, deepseek, gemini(Vertex ai, google ai studio)
精通langgraph,langchain, langsmith,大模型agent框架。
各类lora微调(语音,图像等)diffusions, fish audio.
电脑技能
手篡服务器
系统安装(linux,windows)
ubuntu系统使用
编程技能
较熟练使用编程语言(python, java, golang)
网络服务构建
自动化脚本工具构建
教育
- 山山东交通学院 - 安全工程
工作经历
- 热热岛科技有限公司
- 轩轩晔数字科技有限公司
- 杭杭州智鸿网络科技有限公司
- 广广东零壹智慧、启乐云等
简历摘要
9
已完成项目
4
公司
2
语言