数据工程师 8000-9999

  • 2025-09-28 15:59 发布
  • 浏览次数:37

职位要求:

  • 工作城市:北京市通州区
  • 招聘人数:2人
  • 职位性质:全职
  • 学历要求:硕士及硕士以上学历
  • 工作经验:不限
  • 语言能力:不限
  • 需求专业:计算机系统结构,计算机软件与理论,计算机应用技术
  • 职能类别:大数据工程师

职位描述:

岗位职责:

1.设计并开发端到端数据流水线,支持多模态数据(视觉、点云、关节状态、语言指令等)的采集、清洗、标注、存储及高效检索,与SaaS平台或仿真工具链集成。

2.构建自动化数据标注系统,优化标注流程质量与效率,确保数据集版本的可追溯性和一致性。

3.开发仿真数据生成工具链,基于Isaac Sim/MuJoCo等平台合成高保真机器人数据,支撑强化学习训练与Sim2Real迁移。

4.结合生成式AI增强数据多样性与逼真度,解决真实场景数据稀缺问题。

5.挖掘高价值数据特征,为算法团队提供针对性训练集,优化具身模型的性能。

6.构建数据驱动的模型评测基准,制定任务评估标准(如抓取成功率、导航精度)。

7.联动算法团队理解数据需求,协同仿真团队优化物理引擎参数,确保数据与模型训练的适配性。

8.支持硬件部署环节,提供数据质量监控方案,辅助模型在机器人端侧的实时推理优化。


岗位要求: 

1.计算机科学、人工智能、机器人、数据工程等相关专业,本科及以上学历。

2.具备机器人竞赛或开源项目(如ROS数据采集)经历,主导过量产级数据闭环项目优先。

3.熟练Python/SQL,掌握PyTorch/TensorFlow框架;熟悉大数据处理工具(Spark/Kafka)及分布式存储(HDFS/对象存储)。

4.熟练使用ROS/ROS2机器人中间件及仿真平台(Isaac Sim/Gazebo),实现多传感器数据同步。

5.掌握数据仓库设计、ETL开发、OLAP引擎应用,具备高并发微服务架构设计经验。

6.熟悉多模态数据处理技术,如时序对齐、点云配准、图像-动作联合标注。

7.深入理解具身智能技术栈:强化学习训练闭环、多模态大模型(如CoT、Diffusion Policy)、机器人运动控制基础。

8.了解Sim2Real技术瓶颈及数据增强解决方案(如域随机化、神经渲染)。


单位简介:

【关于晟世天安】

北京晟世天安科技有限公司成立于2015年,是一家专注于“行业智算+垂类大模型”一体化解决方案的平台型集成商,围绕智能算力基础设施、自研大模型平台与行业AI应用服务,构建面向医疗、科教等关键行业国产化、高性能、安全可靠的智能化底座。公司也是北京市专精特新企业、国家高新技术企业、中关村高新技术企业。

【使命】以AI构建行业新质生产力

【愿景】定义智算与大模型双轮驱动的平台集成新范式

【价值观】客户至上 | 专注创新 | 激情奋进 | 成长思维

【工作城市】北京、上海、深圳、成都

【福利】五险一金、补充医疗保险、通讯补贴、节日福利、带薪年假、技能培训、导师引领、弹性工时、扁平化管理


科学研究和技术服务业
其他企业
50-150人