大模型数据工程师-Data语音
Technology
杭州-绍兴地区, 中国1周前截至 2026/7/13
全职
职位描述
职位描述
1、设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型生产,支撑字节跳动智能语音相关业务算法生产与高效迭代;
2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护;
3、持续提升平台数据生产效率、易用性、降低算法使用成本,探索业界前沿的多模态数据处理相关技术,设计并实现到数据平台中。
职位要求
1、计算机及相关专业本科或本科以上学历,良好的沟通和团队协作能力;
2、扎实的编程基础、良好的编程风格,熟悉多线程编程、分布式计算、网络通信、内存管理、设计模式;
3、3年以上工程研发或者基础架构经验,熟练掌握C/C++、Python、Golang等至少一种开发语言;
4、熟悉多项大数据处理/分析相关的工具/框架,例如Hadoop、HDFS、Hive、MapReduce、Spark、Presto、ClickHouse、Ray、数据湖等;
5、具备分布式系统的研发经验,有优化系统性能问题的能力和经验。
加分项:
1、有前沿模型研发经验,涉及数据、评估、平台相关工作;
2、具有分布式架构设计开发经验;
3、有K8s/Kubeflow/Airflow/Mlops研发或者应用经验;
4、熟悉PyTorch深度学习框架,了解常见的深度学习算法。
Keywords
monthsOfExperience: 36ClickHouseApache HadoopApache SparkPrestoMongodbKubeflowAirflowPythonHadoopHiveMapreduce
¿Te interesa este puesto?