简介

  • 自我评价
  • 热情开朗,待人友好,真诚谦虚
  • 能吃苦耐劳,尽职尽责,有耐心
  • 善于沟通,具备团队精神
  • 学习刻苦认真,成绩优秀
  • 工作积极进取,态度认真
  • 具备抗压能力和责任感
  • 数据分析师求职意向
  • 在读莫纳什大学数据科学硕士
  • 项目经历包括AWS图像识别服务器部署、R数据模型、Python数据爬取、处理和分析
  • 拥有数据科学硕士学历和软件工程本科学历

求职意向

数据分析师

在读院校

莫纳什大学

专业

数据科学

出生年月

1999/09/01

性别

政治面貌

团员

籍贯

黑龙江

学历

硕士

实践经历

AWS 图像识别服务器部署

数据分析师

三月 2023 - 七月 2023

使用 Python 作为底层语言,将图像识别功能打包成 Docker 容器,并部署到 AWS Lambda 层。使用 S3 桶进行数据存储,包括图像识别所需的 Python 文件,并为每个 S3 桶添加安全规则和访问权限限制。模块化设计,使用多个 Lambda 函数处理图像的识别、上传、存储和清除操作。使用 AWS Cognito 和 IAM 对访问权限进行严格限制,保障数据安全。实现用户与服务器的交互,通过 HTML 网页进行操作和管理。

R 数据模型

数据分析师

三月 2023 - 七月 2023

使用 R 语言计算数据集的 RMSE,评估模型性能。使用 visdat 库检查数据集是否存在错误值。使用 boxplot 进行数据分布的可视化,发现离散值。使用 ggplot2 绘制数据走势,深入了解数据的分布情况。使用 datatable 库进行数据处理,应用多项线性回归和多类别分类模型,采用多项逻辑回归设计数据模型,并尝试使用决策树和随机森林等多种模型进行数据建模。

Python 数据爬取、处理和分析 澳大利亚公交与地点关系

数据分析师

三月 2023 - 七月 2023

使用 Python 进行数据爬取,从 Google Drive 和网页中获取数据,并确保获取权限和爬取时间的合理设置。清洗 XML 数据,提取所需信息。对数据进行分类,计算公交线路和住房之间的距离等相关信息。处理计算后的数据,分析住房房价与公交之间的关系。进行数据分析和探索性数据分析(EDA),进一步预测和洞察数据特征。

Tableau R D3js 数据可视化澳大利亚海关出入境情况

数据分析师

八月 2022 - 十一月 2022

从多个数据来源收集数据,包括澳大利亚国家统计局和 Google Scholar,获取澳大利亚海关出入境相关数据。使用 Tableau 对收集的数据进行分类和整理,确保数据集合的准确性和一致性。在 Tableau 中进行数据清洗,包括去除相关性较弱的数据,处理数据缺失值,离散值和错误值,以保证数据的可靠性和准确性。利用 R 进行数据整理、合并和加工,得到经过清洗后的数据集。使用 HTML、JS 和 D3.js 等前端技术读取和绘制数据可视化图表。为地图交互功能使用 Leaflet.js 库,实现地图上的交互性操作和数据展示。进行数据分析和预测,应用线性回归方程来探索数据未来的发展趋势,为决策提供参考依据。

黑龙江地理信息测绘院

开发助理

十一月 2023 - 十二月 2023

负责软件的后期修改和说明文档书写,了解软件的开发内容,采取SQL JAVA 前端开发一款在线学习系统。

我负责测试软件的运行和书写说明性文档,并对代码出现的问题进行修改。如增加学习时长的控制面板,提供修改数据库的内容。

项目经验

AWS 图像识别服务器部署

数据分析师

undefined 2023 - undefined 2023

使用 Python 作为底层语言,将图像识别功能打包成 Docker 容器,并部署到 AWS Lambda 层。使用 S3 桶进行数据存储,包括图像识别所需的 Python 文件,并为每个 S3 桶添加安全规则和访问权限限制。模块化设计,使用多个 Lambda 函数处理图像的识别、上传、存储和清除操作。使用 AWS Cognito 和 IAM 对访问权限进行严格限制,保障数据安全。实现用户与服务器的交互,通过 HTML 网页进行操作和管理。

R 数据模型

数据分析师

undefined 2023 - undefined 2023

使用 R 语言计算数据集的 RMSE,评估模型性能。使用 visdat 库检查数据集是否存在错误值。使用 boxplot 进行数据分布的可视化,发现离散值。使用 ggplot2 绘制数据走势,深入了解数据的分布情况。使用 datatable 库进行数据处理,应用多项线性回归和多类别分类模型,采用多项逻辑回归设计数据模型,并尝试使用决策树和随机森林等多种模型进行数据建模。

Python 数据爬取、处理和分析 澳大利亚公交与地点关系

数据分析师

undefined 2023 - undefined 2023

使用 Python 进行数据爬取,从 Google Drive 和网页中获取数据,并确保获取权限和爬取时间的合理设置。清洗 XML 数据,提取所需信息。对数据进行分类,计算公交线路和住房之间的距离等相关信息。处理计算后的数据,分析住房房价与公交之间的关系。进行数据分析和探索性数据分析(EDA),进一步预测和洞察数据特征。

Tableau R D3js 数据可视化澳大利亚海关出入境情况

数据分析师

undefined 2022 - undefined 2022

从多个数据来源收集数据,包括澳大利亚国家统计局和 Google Scholar,获取澳大利亚海关出入境相关数据。使用 Tableau 对收集的数据进行分类和整理,确保数据集合的准确性和一致性。在 Tableau 中进行数据清洗,包括去除相关性较弱的数据,处理数据缺失值,离散值和错误值,以保证数据的可靠性和准确性。利用 R 进行数据整理、合并和加工,得到经过清洗后的数据集。使用 HTML、JS 和 D3.js 等前端技术读取和绘制数据可视化图表。为地图交互功能使用 Leaflet.js 库,实现地图上的交互性操作和数据展示。进行数据分析和预测,应用线性回归方程来探索数据未来的发展趋势,为决策提供参考依据。

技能

  • 数据科学

    数据模型

    数据清洗

    数据处理

    数据分析

    数据可视化

    机器学习

    Python

    R

    Tableau

    AWS云服务

  • 编程语言

    Python

    R

    SQL

    React

    React Native

    Node.js

    D3.js

    tableau

    docker

    HTML

    CSS

    JavaScript

    AWS以及服务器配置

  • 云服务

    AWS

    云服务配置

    服务器部署

    docker

教育

莫纳什大学

数据科学硕士

2022 - 2024

河北师范大学

软件工程专业(本科)

2017 - 2021

语言

Language

中文

母语

Language

英语

高级