7年经验自然语言处理专家

王婷

15901014818

jun72@gmail.com

深圳

https://github.com/username

https://gitee.com/username

在职

自然语言处理

22k-32k

杭州

女

175

教育经历

清华大学 - 学士

2014-09 - 2018-06

主修课程：自然语言处理、深度学习、计算语言学、机器学习、数据结构与算法。

项目经验：

参与开发了基于Python和TensorFlow的智能文本分析系统，实现情感分析功能，使用了LSTM模型处理中文文本数据，提高了分类准确率。
在课程项目中，应用了BERT预训练模型进行命名实体识别任务，优化了中文NER的性能。

研究成果：

获得了校级创新项目资助，研究方向为深度学习在NLP中的应用，使用PyTorch框架构建了多语言文本生成模型。
发表了两篇课程论文，主题包括“基于注意力机制的机器翻译优化”和“中文依存句法分析的挑战”。

北京大学 - 硕士

2018-09 - 2021-06

主修课程：自然语言处理、人工智能原理、深度学习框架、计算语言学、强化学习。

项目经验：

领导了一个研究团队，开发了基于Transformer的中文问答系统，使用了预训练模型微调技术，提升了用户查询响应速度和准确性。
参与了国家重点研发计划子项目，研究面向多模态数据的NLP应用，包括图像描述生成和语音识别集成。

研究成果：

在ACL国际会议发表了一篇论文，标题为“Improving Contextual Embeddings for Low-Resource Languages”，使用了跨语言迁移学习方法。
获得了机器学习领域的校级竞赛奖项，展示了在序列到序列模型和注意力机制方面的专业知识。

工作经历

深度求索（DeepSeek） - 自然语言处理部

2013-01 - 2016-12

北京

数据预处理与特征工程

负责构建大规模中文语料库的预处理流程，包括但不限于分词、词性标注、命名实体识别等。设计并实现基于BERT的语义表示模型，提升下游任务的性能。主导开发了面向工业级NER（命名实体识别）的解决方案，支持日均百万级文本的实时处理。

模型训练与优化

独立完成多任务学习框架的设计与实现，包括情感分析、意图识别等。引入知识蒸馏技术，将复杂模型压缩为移动端可用的小模型。在PyTorch框架下优化训练流程，通过混合精度训练和模型并行技术，将训练时间缩短40%。

智能客服系统研发

领导开发新一代智能客服系统，整合了对话管理、知识图谱检索和情感分析模块。设计基于Transformer的端到端对话系统，显著提升自动回复准确率至92%，客户满意度提升25%。

跨部门协作

与产品经理、算法工程师和前端开发团队紧密合作，推动模型部署落地。制定NLP服务接口规范，确保系统兼容性。撰写技术文档超过20万字，培养新人15人，提升团队整体技术水平。

智言科技 - 自然语言处理事业部

2016-01 - 至今

北京

负责智能医疗领域的文本分析系统开发

设计并实现基于BERT的医学语义相似度计算模块，将问诊问题相似度召回率提升35%。
主导开发医学文本命名实体识别系统，支持ICD-10编码自动标注，准确率达92%。
构建医疗问答知识图谱，整合50万条临床案例，支持复杂医疗问题精准问答。

优化与部署

将BERT模型转换为TensorRT引擎，推理速度提升5倍，支持百万级并发请求。
搭建模型在线服务平台，提供标准化API接口，日均调用量突破200万次。

团队协作

带领5人NLP小组，制定模型开发标准，完成从需求分析到系统落地的全流程管理，项目交付周期缩短40%。

项目经历

社交媒体情感分析系统 - 自然语言处理工程师

2019-09 - 2021-06

智言科技有限公司

项目概述

构建了一套针对中文社交媒体评论的情感分析系统，能够实时处理微博、知乎等平台上的用户评论，为品牌监控和舆情分析提供数据支持。

主要职责与技术实现

设计并实现基于LSTM的情感分析模型，准确率提升至92%
使用BERT预训练模型进行微调，显著提升对复杂语义和上下文理解的准确性
采用数据增强技术（如回译、对抗训练）解决数据不平衡问题
开发分布式数据处理管道，日均处理评论数据量达500万条
实现基于注意力机制的可解释性分析模块，提高模型决策透明度

技术难点与创新

应对社交媒体文本的非正式表达、网络用语及多义词问题
解决长文本情感传播路径分析的技术挑战
设计轻量级模型以满足移动端实时分析需求

个人总结

作为一名自然语言处理专家，我具备扎实的机器学习基础和丰富的项目经验。

专业技能： 精通NLP核心技术，包括文本预处理、情感分析和序列模型，熟练使用Python、TensorFlow和PyTorch框架，擅长模型优化和性能评估。

工作经验： 在AI公司担任NLP工程师，负责开发智能客服系统，成功提升模型准确率和响应效率，参与多个跨领域项目。

职业规划： 致力于探索transformer架构和多语言NLP应用，追求技术创新与实际落地，目标成为领域领导者。

作品集

基于BERT的中文情感分析模型

https://github.com/example/bert-sentiment-analysis

利用预训练的BERT模型对中文文本进行情感分类，准确率超过85%，采用PyTorch框架实现，强调上下文理解与特征提取。

开放域聊天机器人

https://github.com/example/open-domain-chatbot

基于Seq2Seq架构的对话系统，支持多轮交互，使用注意力机制提升响应质量，适用于客服和信息查询场景。

新闻摘要生成系统

https://github.com/example/news-summarization

采用Transformer模型进行文本摘要生成，聚焦信息抽取和语言流畅性，能够自动提炼长文本的关键内容。

研究经历

基于Transformer的中文命名实体识别研究 - 博士后研究员

2020-01 - 2022-06

自然语言处理实验室

北京

研究内容

本研究聚焦于Transformer模型在中文命名实体识别（NER）任务中的优化与应用，旨在提升低资源语言场景下的实体识别精度。研究针对中文特有的长距离依赖和复杂上下文问题，提出了一种结合动态注意力机制的改进模型。

研究方法

采用预训练的BERT-base-chinese模型作为基础框架，引入多头注意力机制和位置编码增强，结合条件随机场（CRF）进行后处理解码。数据方面，使用了ACL-CHINA和SIGHAN-BCC2019数据集，并引入了合成数据增强训练集规模。评估指标包括F1分数、精确率和召回率。

研究成果

实验结果表明，该方法在CoNLL-2003中文NER基准上实现了F1分数92.3%，较传统BERT模型提升4.5%。研究成果发表于ACL 2022会议，并被用于实际工业应用，如智能客服系统，提升了信息抽取效率。

低资源NLP中的迁移学习与多任务学习框架 - 研究生

2018-09 - 2021-07

计算机科学与技术学院

上海

研究内容

本研究探讨了在低资源语言条件下，如何通过迁移学习和多任务学习提升自然语言处理模型的泛化能力。重点解决数据稀缺语言的序列标注问题，如词性标注和命名实体识别，研究了跨语言知识迁移的挑战与解决方案。

研究方法

设计了一种对抗训练与多任务学习相结合的框架，利用生成对抗网络（GAN）模拟源语言数据分布，同时整合多个相关任务（如NER和POS tagging）进行联合训练。采用PyTorch实现模型，并使用Hugging Face Transformers库加载预训练模型。数据增强策略包括回译和合成数据生成。

研究成果

该框架在低资源泰语NER任务中，将F1分数从68.5%提升至82.7%，显著优于基线模型。研究成果发表于EMNLP 2020会议，并开源了相关代码和工具包，已被多个学术团队和企业应用，推动了低资源NLP的发展。

其他信息

语言能力

英语: 熟练掌握，能够进行流利的专业级交流和文档撰写，熟悉英语自然语言处理（NLP）领域的术语和语料库管理。
中文: 母语水平，能够处理复杂的中文NLP任务，如分词、句法分析和情感计算，确保在跨语言项目中的高效协作。

7年经验自然语言处理专家简历模板

数据预处理与特征工程

模型训练与优化

智能客服系统研发

跨部门协作

项目概述

主要职责与技术实现

技术难点与创新

个人总结

研究内容

研究方法

研究成果

研究内容

研究方法

研究成果

语言能力

相关证书

更多简历模板

热门简历推荐