1.面向音视频多媒体应用场景,研发音频/视频理解、增强、编辑、生成等AI算法,探索算法创新和业务落地赋能;
2.构建和维护相关研究方向的代码框架、数据基础,紧跟学术前沿,输出创新研究成果。
1.面向音视频多媒体应用场景,研发音频/视频理解、增强、编辑、生成等AI算法,探索算法创新和业务落地赋能;
2.构建和维护相关研究方向的代码框架、数据基础,紧跟学术前沿,输出创新研究成果。
1.计算机、电子信息、数学、声学等相关专业硕士及以上学历;
2.熟练使用Python和C/C++,掌握Pytorch,Tensorflow等深度学习框架之一;
3.3年以上音视频算法开发经验,熟悉音视频AI算法,具有多模态算法的研究经验,包括但不限于视频的理解、编辑和生成,音频的ASR、TTS、声音克隆、降噪,3D建模、渲染、驱动等,对算法研究和落地具有强烈的热情;
4.在CVPR/ICCV/ECCV/NeurPS/ICLR等学术顶会有相关论文发表,或在相关国际竞赛中取得优异成绩者优先;
5.参加过ACM、ICPC等编程大赛并取得优异成绩者优先;6.具有优秀的分析问题和解决问题能力,具有良好的沟通能力和团队合作能力,敢于突破与创新,对解决具有挑战性的问题充满激情。
联系人:刘先生 电话/微信:18108447551 邮箱:liumin@mlslabs.com.cn