AISBench 评测工具

🚀 开始你的第一步

  • 工具安装&卸载
  • 快速入门

🧭 基础教程

  • 支持的评测场景
  • 评测结果说明
  • 详细参数说明
    • 用户配置参数
    • 模型配置说明
    • 数据集准备指南
    • 支持的结果汇总任务
    • 运行模式说明

🔬 进阶教程

  • 自定义配置文件运行AISBench
  • 服务化稳定状态性能测试
  • 请求发送速率(RPS)分布控制及可视化说明
  • 多轮对话测评指南
  • 随机合成数据集使用指南
  • 自定义数据集使用说明

💪 最佳实践

  • 基于英伟达A100加速卡测评DeepSeek-R1-Distill-Qwen-14B的数学能力,100%论文复现
  • 基于昇腾800I-A2测评DeepSeek-R1数学能力,100%论文复现

❓常见问题

  • AISBench FAQ 常见问题解答
  • 错误码说明

🏷️ 其他

  • 🔜 即将推出
  • 🤝 致谢
AISBench 评测工具
  • 详细参数说明
  • 查看页面源码

详细参数说明

  • 用户配置参数
    • 命令行参数
    • 配置常量文件参数
  • 模型配置说明
    • 服务化推理后端
    • 本地模型后端
  • 数据集准备指南
    • 支持数据集类型
    • 开源数据集
    • 随机合成数据集
    • 自定义数据集
  • 支持的结果汇总任务
  • 运行模式说明
    • 精度评测场景
    • 性能评测场景
上一页 下一页

© 版权所有 2025, AISBench人工智能系统性能评测基准委员会。

利用 Sphinx 构建,使用的 主题 由 Read the Docs 开发.