Excited to grow your career?
We value our talented employees, and whenever possible strive to help one of our associates grow professionally before recruiting new talent to our open positions. If you think the open position you see is right for you, we encourage you to apply!
Our people make all the difference in our success.
我们正在打造新一代 AI 驱动的在线协作文档平台,将实时协作与智能化能力深度融合。我们正在寻找一位 AI Evaluation Engineer,负责为 AI 系统建立严格的质量标准。您将设计评测框架、构建自动化测试流程,并从多个维度衡量系统表现。您的工作将确保我们的 AI 能力为用户提供可靠、高质量的大规模体验。
岗位职责:
1.负责 AI 产品和 Agent 系统评测体系建设。
2.构建 Benchmark、测试集和典型用户场景数据集。
3.建设自动化评测和回归测试平台。
4.建立效果评估指标体系,包括任务完成率、正确率、稳定性、响应速度和用户满意度等。
5.分析失败案例并推动质量优化。
6.支持模型对比、Prompt 优化和 A/B 实验。
7.建立上线质量门禁和长期质量监控机制。
任职要求:
1.本科或以上学历,3 年以上软件研发、机器学习、数据分析、测试开发或相关经验。
2.有 AI 产品、搜索、推荐、智能助手或机器学习系统评测经验。
3.熟悉实验设计、Benchmark 构建和数据分析方法。
4.具备自动化测试平台或质量平台建设经验。
5.熟练掌握 Python 及常用数据分析工具。
6.具备较强的数据分析能力和工程落地能力。
7.对 AI 产品质量提升有浓厚兴趣。
Our interviews are supported by BrightHire, a tool that helps us create a consistent and thoughtful interview experience and may include recordings. Please refer to our candidate privacy statement for more information of how we use your data.











