Skip to main content

数据专家(云平台/agent/训练/具身数据)

Technology
魔法原子机器人科技(无锡)有限公司
苏州-吴中区, 中国3天前截至 2026/7/23
全职

职位描述

负责构建 PB 级具身智能数据流水线,实现从机器人真机数据回流、自动化语义标注到场景挖掘的全链路闭环: 数据闭环体系建设:设计并实现高效的具身数据回流机制,针对机器人失效场景进行自动抓取与仿真还原,支撑技能的快速迭代。 多模态自动化打标:研发基于视觉-语言模型(VLM)的自动化标注系统,将海量原始物理信号(视频、点云、扭矩等)转化为可训练的语义化资产。 数据湖仓与检索架构:构建支持 PB 级规模的分布式湖仓架构,通过向量检索技术实现对复杂场景数据的秒级精准挖掘与提取。 数据质量治理:建立多维度的具身数据评价体系,量化数据的多样性与有效性,优化训练集分布,降低数据采集成本。 任职要求 计算机、自动化相关专业硕士/博士,具有 5 年以上大规模数据平台或 AI 工程化经验。 精通Go语言或Java语言,熟练Python,具备高性能编程能力。 精通 Spark、Flink、Iceberg 等大数据处理技术,具备 PB 级数据处理的实战经验。 熟悉多模态感知算法,对视觉-语言模型(VLM)在数据标注中的应用有深度见解。 有互联网级数据挖掘或搜索推荐架构背景者优先,有具身智能/自动驾驶数据平台经验者优先。

Keywords
5-10年Apache SparkPowerBuilderPureBasic

对这个职位感兴趣吗?