目前专注于LLM(大型语言模型)的微调和可靠智能体的创建工作。致力于构建一种复杂的智能体,它能够整合角色扮演领域的专用模型与通用模型的决策能力,以此来实现高度灵活的角色扮演体验。
出生日期
08/07/1998
目前专注于LLM(大型语言模型)的微调和可靠智能体的创建工作。致力于构建一种复杂的智能体,它能够整合角色扮演领域的专用模型与通用模型的决策能力,以此来实现高度灵活的角色扮演体验。
出生日期
08/07/1998
精通各类模型后训练方法,例如:Supervised Fine-Tuning, RLHF(PPO), DPO, KTO
熟悉并了解各类模型量化方法,从而减少模型推理成本,例如:PTQ(GPTQ),QAT(AWQ),AQLM,OFTQ(bitsandbytes, HQQ, EETQ)
精通深度学习框架pytorch, 大模型训练框架 transformers), 图像生成框架 diffusions
各类商业大模型api调用,claude逆向, deepseek, gemini(Vertex ai, google ai studio)
精通langgraph,langchain, langsmith,大模型agent框架。
各类lora微调(语音,图像等)diffusions, fish audio.
手篡服务器
系统安装(linux,windows)
ubuntu系统使用
较熟练使用编程语言(python, java, golang)
网络服务构建
自动化脚本工具构建
四月 2025 - 现在
三月 2024 - 十月 2024
训练sdxl lora模型
搭建各类comfyUI 工作流
构建自动化脚本进行爬虫并构建图片数据集
十一月 2022 - 六月 2023
用英语与海外客户对接,接受询盘业务和解决客户需求; 额外时间训练Lora模型,生成符合商品特征的模特图片和展示图片
九月 2020 - 五月 2022
1.负责工业化SAAS系统开发和学校选课系统开发
2.房地产微信小程序开发等
2016 - 2020