关于我
AI工程师
等级证书
CET4
601
CET6
536
全国计算机等级考试
二级C
编程语言
Python
深度学习模型训练/微调、数据处理算法、FastAPI/Django/Websocket服务框架、ONNX推理框架、ONNX工具链、PyQt、批处理脚本
C++
推理框架、模型量化
CMake
C#
深度学习框架
ONNX
Triton Server
PyTorch/Tensorflow
Caffe
其他
Docker
- Harbor
- Dokku
Git
Unity
CI/CD
- Gitlab
- Jenkins
FFMpeg
OpenCV
K3s
MinIO
Redis
Kafka
Frappe
AI工程师
人工智能工程师,在机器学习、深度学习和推理/服务架构方面具有很强的背景。在人工智能算法、深度学习模型构建、编程语言和大数据技术方面拥有丰富的经验。精通 Python、TensorFlow、PyTorch 和 C++。自我驱动力强,性格沉稳踏实,思维严谨,积极乐观,乐于接触新鲜事物。遇到困难时能够积极面对,积极寻找解决方案。
工作经历
AI工程师
中奥智能工业研究院2024.07-Now
——————–2024年度——————–
算法类:
- 模型训练平台算法:
- 模型训练评估模块:设计并实现通用模型训练评估框架,支持多种任务类型快速集成与评估
- 数据增强模块:开发高效的数据增强流水线,提升模型鲁棒性和泛化能力
- 视频预测模块:设计开发并集成视频预测模块,丰富平台功能,提升用户体验
系统类:
- 智能标注软件开发:开发支持自动标注、大模型辅助标注的标注平台,专注于用户体验、提升数据标注效率
- 深度学习模型训练平台:主导训练平台功能优化,涉及模型管理、训练数据可视化、模型推理等功能
- PaaS / 本地训练调度系统:实现多租户资源隔离与训练任务调度,提升GPU资源利用率
- PaaS资源监控系统:构建资源监控与告警体系,实现对GPU、内存、存储等关键指标的实时监控与可视化
- 数据存储结构优化:优化数据存取结构,提升训练阶段I/O效率,减少存储压力及数据预处理瓶颈
- 算法运行环境标准化:构建统一算法镜像体系,支持CPU/GPU双模式部署与版本管理,极大优化镜像大小
- 训练调度与模型转换工作流系统:构建从模型训练、转换到部署的一体化工作流系统,支持多格式模型导出与推理引擎无缝对接
——————–2025年至今—————–
算法类:
- 推理引擎系统:图像分类、(旋转)目标检测、实例分割、姿态识别、人脸检测、车牌识别等多场景模型的算法实现,包括多模型Pipeline数据流转设计
- 算法集成:完成YOLO全系列算法集成,支持目标检测、实例分割、旋转目标检测等多任务场景,统一模型训练、转换与部署流程
- 模型转换与优化:实现训练后模型格式自动转换流程(ONNX、TensorRT),优化推理性能
- 数据预标注服务:设计开发通用的、支持多任务多模型的数据预标注服务
- 视觉语言模型研发及后端服务
系统类:
- 智能标注系统:主导智能标注系统架构重构,提供对象存储支持、实现K3s容器化部署,支持图像分类、OCR与大模型预标注能力
- 推理引擎系统:构建标准化推理插件体系,支持图像分类、(旋转)目标检测、实例分割、姿态识别、人脸检测、车牌识别等多场景模型及算法部署,实现模型服务的动态加载卸载功能
私有化PaaS平台及GPU资源调度系统(某大型车企)
- 私有化PaaS平台开发:参与车企私有化PaaS平台的整体架构设计与实现,聚焦于稳定性、安全性与多用户资源隔离
- GPU资源智能调度平台:设计并实现分布式可扩展的GPU资源调度系统,支持一次性任务 / 持久化服务全生命周期管理、智能资源分配与重试机制,具备资源可观测能力
- 高可用架构方案设计:构建基于Keepalived + DRBD的高可用架构,实现主备自动切换、数据同步与故障恢复机制,确保核心服务的连续性
- 监控告警体系建设:部署Prometheus + Exporters + Grafana + AlertManager全链路监控系统,以及Loki + Promtail日志管理系统,支持多系统多维度告警策略与智能分组消息推送,覆盖GPU、内存、网络等关键指标监控
- OTA升级系统:开发OTA升级系统,支持边缘设备远程升级与版本回滚,实现设备服务管理自动化
- 平台集成与运维支持:对接团队业务需求,推动平台与模型训练、推理流程的深度融合,同时支撑平台日常运维与优化
项目管理:
- 项目管理:负责项目的述标,多个模块的技术方案设计、评审与跨部门沟通协同,推动项目从需求到落地的管理
- 代码版本管理及发布:负责服务的二进制构建并打包为deb,减少环境依赖及运维成本
- CI/CD流水线优化:集成Jenkins + Ansible自动化部署,构建从代码提交到生产部署的全自动化流程,简化运维操作
深度学习部署工程师
南京竹石信息科技有限公司2022.04-2024.07
——————–2022年度——————–
算法类:
- 姿态识别/手势识别算法调研、编写、训练、调优
- 标准姿态判定算法研发
- RNN可视化教学系统-RNN可视化设计、BPTT算法支撑验证,题目编写
- 检测化验单OCR内容识别,结构化提取
——————–2023年度——————–
算法类:
- Delta机械臂解算仿真验证
- 基于三维骨骼识别的静态手势/姿态识别算法及动作序列识别算法设计研发,及后台服务开发部署
- 姿态及手势交互系统开发
- 语音识别/语义匹配算法研发及后台服务开发部署
- 医学大模型部署、数据集采集
- SDK设计开发-语音识别/手势识别/姿态识别等
- 飞秒术前训练系统-眼球识别及评分算法
- CT影像分割、标注及三维重建,自动分割算法研发
- 多目识别,融合校准算法研发
- 红外小目标识别算法研发
工具类:
- 视频合并工具
- CPR姿态流程识别桌面软件开发
——————–2024年度——————–
算法类:
- 设计编写常用CV算法库(多目融合算法、视频、相机功能类算法)
- 设计编写集成各种深度学习算法的端到端onnx模型推理算法库(高级API,拥有常用SOTA深度学习算法,快速测试、集成、部署)
- 设计编写包含websocket/http的通用CS架构服务部署框架(包括灵活的代码形式以及快速的Docker部署能力)
项目管理类:
- 为Python软件包库、工具链及GUI项目编写CI/CD配置
工具类:
- 设计编写用于运动姿态分析的姿态编辑器,包括姿态识别算法为基础的骨骼点检测工具、点跟踪工具,动作分割工具
专利软著:
- CPR姿态流程识别专利及软著
深度学习工程师
江苏金羿智芯科技有限公司2021.03-2022.04
模型及测试相关工作:
- 对各种基于主流框架 (Tensorflow、PyTorch、Caffe、MxNet等)进行训练的深度学习模型进行模型转换,自动化转换和数据一致性测试工作。形成推理模型(ONNX),并测试转换前后数据一致性,对于无法转换或数据不一致的的模型进行问题追踪,并优化原始模型
- 测试模型在各硬件上的推理性能及准确率
ONNX工具链相关工作:
- 维护ONNX相关工具链,包括模型创建、优化、拆分、权重可视化
- 开发各种自动化工具简化模型转换及测试流程
算法适配、模型复现及demo相关工作:
- 对自研模型推理框架进行维护,添加和升级适配各种算子(框架具有CPU/GPU(CUDA)/MLU(寒武纪深度学习计算卡)推理硬件加速能力)
- 对自研模型推理框架添加数据预处理/后处理算法,提供算法接口便于后续开发
- 针对各种SOTA深度学习模型进行测试,选择其中较为新颖的模型进行转换并形成初步的推理demo(分类、检测、分割、迁移等)
- 对自动驾驶相关技术调研井对相关模型以及可行方案进行统计,并形成demo
教育经历
学士
南京信息工程大学2016.09-2020.06
奖学金:
- 2017-2018校二等奖学金
- 2018-2019校一等奖学金/优秀学生干部
参赛:
- 校“挑战杯”大学生课外学术科技作品竞赛创新奖
- 校“互联网+”大学生创新创业大赛金奖
- 江苏省“互联网+”大学生创新创业大赛一等奖
- 江苏省电子设计竞赛二等奖
- 全国大学生 FPGA 创新设计邀请赛二等奖、企业特别奖
- 中科芯杯大学生物联网应用设计邀请赛全国三等奖
