工作经历

高级DevOps工程师
煜象科技 ( 杭州) 有限公司
2022.01 - 至今

工作内容:

  • DevOps体系搭建: 2022年开始主导公司内部DevOps体系从0到1的建设,包括CI/CD流水线设计、自动化部署架构、监控告警系统和标准化运维流程的全面实施。
  • CI/CD平台建设: 基于GitLab CI/CD和Jenkins构建多环境自动化部署平台,实现代码提交到生产部署的全流程自动化,覆盖开发、测试、预发布和生产四个环境。
  • 监控与可观测性体系: 建立基于Prometheus+Grafana+AlertManager的监控告警体系,集成ELK日志收集平台,实现系统全链路监控和故障快速定位能力。
  • 容器化与微服务转型: 推动传统应用容器化改造,设计微服务架构部署方案,引入Kubernetes集群管理,提升应用部署灵活性和资源利用率。
  • 项目交付与监控: 在项目交付阶段,负责制定和实施运维计划,确保项目平稳过渡到运维管理。同时,监控系统的性能,及时响应和解决生产环境中的问题。
  • IT系统与信息安全维护: 负责公司IT系统的持续维护和优化,包括OA、ERP、CRM等业务系统。同时,制定和执行信息安全政策,进行风险评估,定期组织安全培训,确保遵守相关法律法规。
  • 数据中心与桌面运维管理: 监督数据中心的服务器和网络设备的监控、维护和升级。高效规划技术支持团队的日常工作,分配任务,管理团队绩效,确保团队成员的专业成长和工作满意度。
  • 预算与供应商管理: 负责部门预算的规划,成本控制和资源分配。同时,与IT服务供应商协商合同,管理供应商关系,保证服务质量和性能符合标准。
  • 技术研究与创新: 跟踪最新IT技术和行业趋势,评估新技术适用性,并推动技术创新,提高运维效率和服务质量。

工作业绩:

  • 部署效率提升: 通过DevOps体系建设,实现应用部署时间从平均2小时缩短至15分钟,部署效率提升87.5%。
  • 故障率降低: 建立完善的监控告警和自动化回滚机制,生产环境故障率降低25%,平均故障恢复时间(MTTR)缩短45%。
  • 团队效率提升: 推动DevOps文化落地,研发与运维协作效率提升40%,代码部署频率从每周2次提升至每日1-2次。
  • 成本优化: 通过容器化和资源调度优化,服务器资源利用率提升35%,年度IT基础设施成本减少约40%,云资源费用节约12万元/年
  • 项目交付效率提升: 通过准确任务分配与协调,缩短平均项目上线周期至3周,客户满意度提升15%。
  • 自动化与效率优化: 开发的自动化脚本在多个项目中复用,成功减少部署时间30%,降低错误率10%。
  • 标准化流程实施: 建立标准化交付物清单,项目交付一致性与可预测性提高20%,运维问题减少25%。
  • 桌面运维优化: 优化桌面运维流程,技术支持响应速度提升20%,问题解决效率提高25%。
  • 团队协作与效率增强: 有效协调团队任务,工作效率提升30%,系统故障率降低15%。
  • IT系统升级管理: 成功领导10个IT系统升级与迁移项目,保障业务的连续性和系统稳定性。
  • DevOps体系演进: 主导从传统CI/CD到GitOps的完整迁移,实现应用部署全流程自动化,部署效率提升30%以上,回滚时间缩短至30秒内。
运维工程师
杭州所思互连科技有限公司
2020.11 - 2022.01

工作内容:

  • 服务器运维: 负责维护服务器系统,及时受理、跟踪和解决服务器异常或故障,并进行统计分析,为业务运行提供可靠支持。
  • DevOps与自动化: 引入DevOps理念和相关工具,建立自动化平台,实现部署流程的自动化和标准化。通过自动化,提升部署效率30%,并有效降低人为操作失误,提高系统稳定性。
  • 团队与流程优化: 与团队协作优化研发流程,搭建CICD(持续集成与持续交付)体系,实现代码集成、测试和部署的自动化。提高了研发效率20%,并显著减少了软件缺陷15%。
  • 运维规划与改进: 制定并执行运维工作计划,优化运维流程,提升问题解决的速度和准确性,提高工作效率和服务质量。
  • 技术转型: 主导从传统到容器化部署(Docker, K8s)的技术转型,加速了应用部署速度50%,并有效优化了资源管理,提升了系统的灵活性和可扩展性。
运维工程师
杭州数跑科技有限公司
2017.09 - 2020.11

工作内容:

  • 运维体系建设: 协助构建和优化运维管理体系,并参与自动化流程规范的制定,提高运维效率。
  • 阿里云产品设计: 定制基于阿里云产品的交付方案,并实施部署,保障云服务资源合理分配,满足项目需求。
  • 开发环境维护: 负责公司及各项目的开发环境搭建、配置和维护,及时处理问题和故障,为项目团队提供技术支持,保障项目正常交付。

项目经历

公司内部DevOps体系建设项目
技术负责人
2022.06 - 至今
项目职责: 负责公司DevOps体系架构设计、技术选型和实施落地,推动研发流程数字化和自动化转型。
项目业绩: 成功构建完整DevOps工具链,实现研发运维一体化,年度节约人力成本约80万元。
PSA O2O Platform ( DS汽车)
系统运维负责人
2019.11 - 至今
项目职责: 负责协助部署架构设计和实施系统运维方案,维护各环境的稳定性,确保项目能够按时交付。
江苏移动云平台-商城
商城运维负责人
2019.05 - 至今
项目职责: 负责商城应用的部署与运维,针对业务需求,策划并实施有效业务变更方案,保障商城平台持续优化与更新。
零跑汽车商城
运维负责人
2018.05 - 至今
项目职责: 负责商城应用的开发、测试和生产环境的搭建部署,并维护各环境的稳定性,确保项目按时交付。
项目业绩: 成功部署并运维零跑商城项目,确保商城稳定运行两年以上,并设计实施从传统分布式部署到K8S容器部署的切换方案。

教育经历

西安电子科技大学
计算机科学与技术
2018 - 2021
本科
杭州职业技术学院
软件技术
2009 - 2012
大专

专业技能

开发环境

Java
Python
Go
Node.js
PHP

CI/CD

Jenkins
GitLab CI
GitHub Actions
Argo CD
DevOps
GitOps
自动化部署

云原生技术

Kubernetes
Docker
K8S
Helm
Minio
Istio
微服务
容器化

存储解决方案

Longhorn
OpenEBS
Redis
MySQL
PolarDBx

网络解决方案

Cilium
Calico
Flannel
服务网格

监控和日志

Prometheus
Grafana
AlertManager
Fluentd
Logstash
ELK

配置管理

etcd
Nacos
配置中心

云平台

阿里云
云计算
云原生