教育

加州大学戴维斯分校

经济和应用数学 - 理学学士

2020 - 2024

工作经历

H3C

数据处理

August 2023 - November 2023

从20万个数据库中提取数据;实施了数据的持久存储解决方案;使用Git和Linux命令管理基于云的数据、代码和环境。 

为AIGC模型训练执行数据清洗、过滤和处理。 

为自动化数据标注训练机器学习模型;设计和优化数据标注工作流程。 

进行模型性能测试,识别最佳用例和缺陷;通过文档向同事提供反馈;向其他部门和客户进行教程演示。 

开发了分布式网络抓取系统;使用XPath、HTTP请求和Selenium进行数据抓取。

项目1. 图像颜色改变: 

根据现有模型问题的分析,确定了模型训练所需的5种图像类型。 

通过网络抓取构建了一个包含1.5万个数据集的全面图像信息和图像。 

根据图像细节组织数据集,过滤基于图像细节的数据。

通过将图像与不同颜色配对来扩展数据集,生成新的图像组,整合颜色代码和色卡,有效提高模型性能,生成3万对图像和树状数据结构。

项目2. 面部表情数据分类和标注模型: 

负责设计一个用于2万张面部表情图像的分类和标注系统,设计和开发了一个基于Web的用户界面,用于高效的数据可视化、标注和管理。 

通过线性回归模型和深度面部模型和探索研究论文和代码库发现模型性能与数据集之间存在强相关性。 

通过图像处理和过滤,将模型性能从67%准确率提高到80%准确率。 

实施了SVM和CNN模型,进一步提高了数据标注准确性,达到了88%。 

通过引入连续变量对表情进行标签化并训练线性回归模型,提高了分类方法的通用性。

项目经验

纽结理论及机器学习

项目成员

April 2022 - April 2023

把帮助教授收集并分析相关领域的研究信息。

提取并试验纽结的特征值,使用特征值计算出纽结公式。

利用Pandas和Seaborn进行数据清洗、特征提取和数据分布可视化。

通过构建回归模型和神经网络模型预测结的数量和位置。

技能

  • Python, R, MATLAB, SQL

    PPT,Excel,Word

语言

Language

英语

专业