李桂英

15569453155

ming57@gmail.com

南宁

https://github.com/username

https://gitee.com/username

在职

数据建模

18k-28k

广州

男

175

教育经历

清华大学 - 工学学士

2014-09 - 2018-06

课程学习

核心课程：数据结构、算法分析、操作系统、计算机网络、数据库原理。
选修课程：人工智能基础、数据挖掘、计算机图形学。

项目经验

数据建模项目：使用Python和SQL进行电子商务用户行为分析，构建了推荐系统模型，提升了点击率预测准确率至85%。
团队合作：参与开发了基于Hadoop的分布式数据处理应用，处理了TB级数据集，优化了数据建模流程。

研究经历

在导师指导下，研究了机器学习算法在数据建模中的优化应用，重点探讨了随机森林和梯度提升树的性能调优。
技能认证：通过了华为云数据工程师认证，掌握了大数据处理框架和数据建模工具。

北京大学 - 理学硕士

2018-09 - 2021-06

研究方向

主要领域：深度学习、神经网络优化在数据建模中的应用，包括时间序列分析和预测模型。
课程学习：高级数据挖掘、统计学习理论、大数据平台架构。

论文与项目

论文发表：在《计算机学报》上发表论文《基于深度学习的数据建模优化方法》，探讨了卷积神经网络在图像识别数据建模中的改进。
项目经验：领导了一个医疗数据分析项目，使用TensorFlow构建预测模型，实现了患者风险评估准确率提升20%，并应用了交叉验证技术确保模型泛化能力。

实践技能

精通Python和R语言进行数据建模，熟悉Spark和AWS数据处理平台，能够进行大规模数据集的特征工程和模型评估。

工作经历

阿里巴巴 - 数据部

2017-01 - 2018-12

北京

工作内容

数据建模：负责设计和实现企业级数据模型，包括概念模型、逻辑模型和物理模型，使用ER图和数据库规范化标准。
数据库设计：基于MySQL和PostgreSQL进行数据库架构设计，确保数据一致性和完整性，处理大规模数据存储需求。
ETL开发：构建自动化ETL流程，使用Python脚本和Apache Airflow实现数据提取、转换和加载，提升数据处理效率30%。
性能优化：通过索引优化、查询重写和数据分区策略，将数据库查询响应时间减少40%，并监控数据质量。
协作与分析：与数据科学家和业务分析师团队合作，提供数据支持，使用SQL和Python进行数据查询和分析，支持决策制定。

字节跳动 - 数据分析部

2018-01 - 至今

北京

负责用户行为数据建模与分析，主导构建用户画像系统，提升推荐算法效果。

数据处理与清洗：处理海量用户行为数据，使用Python编写ETL脚本，清洗异常数据，保证数据质量。
建模方法：采用决策树、随机森林、梯度提升决策树（GBDT）等机器学习算法，构建用户兴趣模型和留存预测模型。
模型评估与优化：使用AUC、Precision、Recall等指标评估模型性能，通过特征工程和超参数调优提升模型准确率。
可视化分析：利用Power BI制作数据看板，进行业务分析，支持产品决策。
团队协作：与产品、算法、研发团队紧密合作，推动数据建模项目的落地实施，提升数据驱动决策效率。

项目经历

电商用户行为分析与推荐系统 - 数据建模师

2016-03 - 2020-08

阿里巴巴科技公司

项目背景

为了提升用户购物体验和增加转化率，公司开发了推荐系统，基于用户行为数据进行个性化推荐。项目涉及收集和分析海量用户交互数据，包括点击、浏览和购买记录，以构建精准的用户画像和商品关联模型。

任务与职责

负责数据建模，包括数据仓库构建、ETL流程设计和数据清洗。
使用Python和SQL进行数据预处理、特征工程和模型训练，应用协同过滤算法和关联规则挖掘。
处理数据稀疏性和实时性问题，确保模型能够实时响应用户行为变化。
评估模型性能，使用准确率、召回率和F1分数等指标进行优化。

技术难点

数据稀疏性：用户-商品交互矩阵稀疏，导致推荐准确率低，通过引入矩阵分解技术如SVD进行缓解。
实时数据流：需要处理高频率数据更新，使用Flink框架实现实时计算和模型更新，确保推荐系统及时性。
特征工程：从多维度数据中提取关键特征，包括用户历史行为、商品属性和上下文信息，以提高模型泛化能力。

成果

推荐系统上线后，用户点击率提升了15%，转化率提高了10%，带动了整体销售额增长20%。
获得公司年度技术创新奖，并被应用于多个业务场景。

金融风险评估模型优化 - 数据分析师

2018-02 - 2022-04

平安保险集团

项目背景

为了降低贷款违约风险，公司对现有风险评估模型进行了优化。项目基于历史贷款数据，构建预测模型以评估用户信用风险，支持更精准的贷款审批决策。

任务与职责

收集和整合用户信用数据，包括收入、资产、历史贷款记录等，进行数据清洗和标准化。
应用数据建模技术，如逻辑回归、随机森林和梯度提升树，进行特征选择和模型训练。
处理数据不平衡问题，使用过采样和欠采样技术提高模型对少数类（违约）的预测能力。
评估模型性能，采用AUC、召回率和Precision指标，确保模型符合监管要求和业务标准。

技术难点

数据不平衡：违约样本占比不足5%，导致模型偏置，通过SMOTE算法和集成学习方法进行平衡。
特征选择：从数百个变量中识别关键特征，使用相关性分析和递归特征消除（RFE）技术，减少过拟合风险。
模型可解释性：确保模型决策透明，应用SHAP值解释算法，以满足金融行业合规要求。

成果

优化后模型准确率提升到85%，违约率预测误差降低20%，帮助公司减少损失超过500万元。
获得金融创新大赛一等奖，并推广至集团其他业务线。

个人总结

我是一名专注于数据建模领域的专业人士，拥有扎实的理论基础和丰富的实践经验。在数据分析、数据挖掘和机器学习模型构建方面具备深厚的技术功底，熟悉多种建模工具和算法，能够高效完成复杂数据的建模任务，并为业务决策提供有力支持。

在过去的工作中，我成功主导了多个数据建模项目，从需求分析到模型部署全流程参与，积累了丰富的项目经验。通过不断学习和实践，我持续提升自己的建模能力和业务理解能力，力求在数据驱动的时代为企业创造更大价值。

未来，我计划在数据建模领域继续深耕，探索更多前沿技术和应用场景，为企业的数据化转型和智能化升级贡献自己的力量。

作品集

在线零售数据仓库设计

https://github.com/data-modeler/retail-data-warehouse

这是一个基于星型模型的在线零售数据仓库项目，包括事实表和维度表，支持多维分析和ETL过程。使用SQL实现数据库设计，提供高效的数据查询和报告功能。

用户行为预测数据模型

https://dblp.org/persistent/paper/12345

本项目构建了一个机器学习辅助的用户行为预测模型，利用关联规则和决策树算法分析历史数据。模型包括数据预处理、特征工程和模型评估，专注于提高预测准确率和业务洞察。

医疗记录标准化数据建模

https://exampleblog.com/data-modeling-medical

这是一个遵循HL7标准的医疗记录数据模型，采用维度建模技术设计数据库结构，支持电子健康记录系统的集成。模型涵盖病人、就诊和诊断实体，确保数据一致性和合规性。

研究经历

基于深度学习的图像数据建模与优化 - 主研究员

2020-01 - 2022-06

计算机科学与技术系

北京

研究内容

本研究聚焦于利用深度学习技术优化图像数据的建模过程，旨在提升图像识别的准确性和效率。研究涉及大规模图像数据集的构建与预处理，探索卷积神经网络（CNN）和Transformer架构在图像特征提取中的应用。

研究方法

采用混合模型方法，结合CNN进行局部特征提取和Transformer处理全局上下文信息。研究使用了Python和TensorFlow框架，进行了超参数调优和交叉验证，以减少过拟合风险。数据增强技术如旋转、缩放和裁剪被应用于提升模型泛化能力。

研究成果

成功开发了一种新型图像建模算法，将分类准确率从75%提升至89%，并在多个基准数据集（如ImageNet）上验证了其优越性。研究成果发表于顶级国际会议，并被应用于医疗影像分析领域，显著提高了诊断效率。

时间序列数据建模在金融预测中的创新应用 - 项目负责人

2021-03 - 2023-02

经济与金融学院

上海

研究内容

本研究致力于将时间序列建模技术应用于金融市场的预测，重点解决传统模型在处理非线性波动和外部因素影响时的局限性。研究涵盖了股票价格预测和风险评估，利用历史数据模拟市场动态。

研究方法

采用了长短期记忆网络（LSTM）和集成学习方法，结合ARIMA模型进行混合建模。研究使用了Python和Statsmodels库，进行了滚动预测和敏感性分析，以应对市场不确定性。数据来源包括公开的金融数据库和实时交易数据，强调模型的实时更新机制。

研究成果

开发出一种自适应时间序列预测模型，预测误差率降低30%，并成功应用于多个金融机构的决策支持系统。研究成果获得国家自然科学基金支持，并在《金融工程学报》发表，推动了数据建模在金融领域的实际应用，提升了预测的可靠性和实用性。

其他信息

语言能力

英语：流利，能进行专业级的国际沟通、技术文档撰写和数据分析讨论，强调数据建模领域的术语运用。
中文：母语水平，擅长处理中文环境下的数据建模需求和团队协作。

证书

数据建模专业证书：Certified Data Modeler (CDMP) by DAMA International，认证数据建模技能，包括实体关系建模和维度建模。
SQL技能认证：Oracle SQL Expert认证，掌握高级查询优化和数据库建模技术，提升数据建模效率。

3年经验数据建模专家简历模板

课程学习

项目经验

研究经历

研究方向

论文与项目

实践技能

工作内容

项目背景

任务与职责

技术难点

成果

项目背景

任务与职责

技术难点

成果

个人总结

研究内容

研究方法

研究成果

研究内容

研究方法

研究成果

语言能力

证书

更多简历模板

热门简历推荐