数据工程师
2-2.5万深圳市本科不限经验
职位描述
一、岗位职责:
1、负责数据相关业务应用场景的分析,包括多模态(如图像、文本、表格等)化学制药数据的采集、清洗、标注、转换、存储、分析与可视化;
2、保障数据的安全性和合规性,符合化学制药行业的隐私和安全标准;
3、参与数据平台的相关技术方案设计,负责数据平台核心框架和核心代码开发;有数据平台从0到1相关经验。
4、与模型开发团队合作,针对多模态数据进行模型的训练与优化,可进行算法模型部署,有GPU部署经验的优先。
5、负责系统的开发、测试、部署和维护。
6、熟悉分布式爬虫等技能,负责爬虫系统的设计与优化。
7、负责爬虫代码的日常开发与维护,保证稳定性。
8、负责互联网资源清洗和结构化,网页转码,网页聚合,信息抽取,网页分类。
二、岗位要求
1、本科或以上学历,计算机、数据科学、统计学、自动化或其他相关专业;
2、具备多模态数据处理经验,能够有效处理化学分子及反应图像、文本和表格数据,熟悉相关的数据清洗和转换方法;
3、精通 Python 编程语言,常见的数据处理工具(如 Pandas、NumPy、Scikit-learn 等),能够熟练进行各种类型数据的预处理、特征工程及计算任务;
4、熟悉机器学习和深度学习框架,如 TensorFlow、PyTorch,能够进行数据预处理、特征提取、模型训练和优化,具有深度学习模型部署的经验;
5、熟悉数据平台搭建工作,能搭建hadoop, spark等数据中台。
6、熟悉分布式爬虫架构和反爬知识
7、优秀的团队合作精神、诚实、严谨,具有较强的学习能力。
8、有以下经验者优先:
89发表过计算机、数据工程或相关领域高水平论文或专利;
89参与开源项目,或在GitHub等平台有技术贡献。
89有大厂工作经验。
20,861+ 岗位更新等你来订阅
一键订阅最新的岗位,每周送达
🎉恭喜你,订阅成功
继续订阅您可以在邮箱中随时取消订阅