简介

目前专注于LLM(大型语言模型)的微调和可靠智能体的创建工作。致力于构建一种复杂的智能体,它能够整合角色扮演领域的专用模型与通用模型的决策能力,以此来实现高度灵活的角色扮演体验。

出生日期

08/07/1998

技能

  • ai相关技能

    精通各类模型后训练方法,例如:Supervised Fine-Tuning, RLHF(PPO), DPO, KTO

    熟悉并了解各类模型量化方法,从而减少模型推理成本,例如:PTQ(GPTQ),QAT(AWQ),AQLM,OFTQ(bitsandbytes, HQQ, EETQ)

    精通深度学习框架pytorch, 大模型训练框架 transformers), 图像生成框架 diffusions

    各类商业大模型api调用,claude逆向, deepseek, gemini(Vertex ai, google ai studio)

    精通langgraph,langchain, langsmith,大模型agent框架。

    各类lora微调(语音,图像等)diffusions, fish audio.

  • 电脑技能

    手篡服务器

    系统安装(linux,windows)

    ubuntu系统使用

  • 编程技能

    较熟练使用编程语言(python, java, golang)

    网络服务构建

    自动化脚本工具构建

教育

  • 山东交通学院 - 安全工程

工作经历

  • 热岛科技有限公司
  • 轩晔数字科技有限公司
  • 杭州智鸿网络科技有限公司
  • 广东零壹智慧、启乐云等

简历摘要

9
已完成项目
4
公司
2
语言