AI Stupid Level - AI 模型实时基准测试平台

简介

AI Stupid Level 是一个实时 AI 模型基准测试和排名平台。它追踪 50+ 主流 AI 模型，通过 7 维度评分体系对模型进行客观评测对比。

网站：https://aistupidlevel.info/

核心功能

7 维度评分体系

平台采用 7 个维度评估 AI 模型：

维度	说明
正确性	答案准确程度
规范遵循	符合指令要求
代码质量	代码规范和可维护性
效率	响应速度和资源消耗
稳定性	输出一致性
拒绝率	不当请求处理
特色功能	特殊能力支持

追踪模型

平台追踪 50+ 主流 AI 模型，包括：

OpenAI GPT-5 / GPT-4 / GPT-3.5
Anthropic Claude Opus 4 / Sonnet 4
Google Gemini 2.5 系列
xAI Grok 4
以及其他主流模型

实时更新

速度测试：每 4 小时更新
深度推理测试：每日更新
95% 置信区间统计

Smart Router API

功能特点

智能路由 API 可以自动选择最佳模型：

OpenAI 兼容 API
统一 API Key（格式：aism_xxxxx）
6 种路由策略
自动故障转移

使用方式

1
2
3
4
5
6
7
8


# 标准 OpenAI 兼容请求
curl -X POST https://aistupidlevel.info/v1/chat/completions \
  -H "Authorization: Bearer aism_your_key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "auto",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

API 端点

1
2
3
4
5
6
7
8


# 获取模型列表
GET https://aistupidlevel.info/v1/models

# 获取排行榜数据
GET https://aistupidlevel.info/api/dashboard

# 获取历史数据
GET https://aistupidlevel.info/api/dashboard?period=7d

使用场景

1. 基准测试数据

查看实时模型排名
对比不同模型性能
访问历史性能数据

2. 智能路由

注册账户添加多个 Provider Key
生成统一 API Key
替换现有 OpenAI 端点使用

3. 开发者集成

API 编程访问
集成到现有工具
开源项目贡献

使命与价值观

透明度：所有方法和代码开源
统计严谨：置信区间和显著性测试
社区驱动：持续改进
成本优化：帮助用户优化 AI 支出

总结

AI Stupid Level 为开发者和研究人员提供了客观、透明的 AI 模型性能对比工具。通过 7 维度评分和实时追踪，可以更好地了解各模型优劣，选择适合的 AI 解决方案。

网站： https://aistupidlevel.info/