出生日期
08/04/1993
出生日期
08/04/1993
熟练使用python进行编程,也有Java、JS使用经验,熟悉python常见并发及异步框架
具备长期的Airflow实践经验,精通工作流的设计、调度、监控和优化,能够高效地构建、管理和扩展复杂的数据管道和自动化任务,可以独立构建运维高可用的大规模的任务调度系统。
熟悉Flink,Spark,HBase等大数据处理和存储相关工具,熟练对结构化和非结构化数据的处理
可以熟练使用Flask,FastApi框架进行api开发,熟悉RESTful API,能编写高并发下的鲁棒api。
1.熟悉docker,能使用docker-compose和k8s对容器进行编排管理
2.熟练编写dockerfile,并可结合gitlab进行持续部署
1. 熟悉Redis架构设计、性能优化、持久化机制、主从复制、哨兵系统及Redis集群部署与维护,能够高效地利用Redis解决高并发和大数据量处理问题
2. 具有一定的SQL优化经验,熟练掌握复杂查询优化、索引设计,熟悉MySQL和PostgreSQL
3. 了解Mongodb, Elasticsearch等非结构化数据库
有多种Linux发行版(Ubuntu,CentOS)使用经验,了解常用shell命令工具及shell脚本编写
熟练掌握常用算法及数据结构,能够根据项目需求,设计高效的算法解决方案,并有效地提升程序的运行效率和资源利用率。
有自然语言处理相关经验,了解RAG相关技术。
四月 2021 - 十二月 2024
流水线任务控制及数据开发。对公司车辆路测数据进行一系列的离线处理。支持公司预测、感知及车辆控制部门对数据及自动化的需求。主要工作有:
数据平台后端服务及数据处理任务的开发:
作为后端数据开发人员,参与开发了基于 Flask 和 Airflow 框架实现的数据处理任务的调度系统。该系统支持用户手动提交或检测每日新的数据自动生成Spark、Flink、图片点云抽取、文件传输等数据处理任务,并通过 Airflow 自动调度编排这些任务。主要功能包括任务优先级管理、依赖解析、分布式执行、失败重试机制、性能监控、提交和查询数据处理任务以及通知用户任务执行状态和结果。负责参与的任务有:
自动化流水线任务的构建及Airflow集群的升级维护:
三月 2018 - 四月 2021
基础开发环境建设、数据处理、数据接口服务开发。主要依托全国法院数据,对政府及企业进行涉诉信息服务。服务政府对辖区内企业的诉讼情况进行监控,服务企业对其合作方的诉讼情况进行查询。主要负责的工作有:
2015 - 2018
2011 - 2015