Skip to main content

大模型数据工程师-Data语音

Technology
字节跳动
杭州-绍兴地区, 中国1周前截至 2026/7/13
全职

职位描述

职位描述

1、设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型生产,支撑字节跳动智能语音相关业务算法生产与高效迭代;

2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护;

3、持续提升平台数据生产效率、易用性、降低算法使用成本,探索业界前沿的多模态数据处理相关技术,设计并实现到数据平台中。

职位要求

1、计算机及相关专业本科或本科以上学历,良好的沟通和团队协作能力;

2、扎实的编程基础、良好的编程风格,熟悉多线程编程、分布式计算、网络通信、内存管理、设计模式;

3、3年以上工程研发或者基础架构经验,熟练掌握C/C++、Python、Golang等至少一种开发语言;

4、熟悉多项大数据处理/分析相关的工具/框架,例如Hadoop、HDFS、Hive、MapReduce、Spark、Presto、ClickHouse、Ray、数据湖等;

5、具备分布式系统的研发经验,有优化系统性能问题的能力和经验。

加分项:

1、有前沿模型研发经验,涉及数据、评估、平台相关工作;

2、具有分布式架构设计开发经验;

3、有K8s/Kubeflow/Airflow/Mlops研发或者应用经验;

4、熟悉PyTorch深度学习框架,了解常见的深度学习算法。

Keywords
monthsOfExperience: 36ClickHouseApache HadoopApache SparkPrestoMongodbKubeflowAirflowPythonHadoopHiveMapreduce

¿Te interesa este puesto?