<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
  <channel>
    <title>基准测试 - 标签 - cfanzp学习笔记</title>
    <link>https://cfanzp008.github.io/tags/%E5%9F%BA%E5%87%86%E6%B5%8B%E8%AF%95/</link>
    <description>基准测试 - 标签 - cfanzp学习笔记</description>
    <generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>cfan.zp@qq.com (cfanzp)</managingEditor>
      <webMaster>cfan.zp@qq.com (cfanzp)</webMaster><lastBuildDate>Thu, 16 Apr 2026 13:48:00 &#43;0800</lastBuildDate><atom:link href="https://cfanzp008.github.io/tags/%E5%9F%BA%E5%87%86%E6%B5%8B%E8%AF%95/" rel="self" type="application/rss+xml" /><item>
  <title>AI Stupid Level - AI 模型实时基准测试平台</title>
  <link>https://cfanzp008.github.io/aistupidlevel-ai-benchmark/</link>
  <pubDate>Thu, 16 Apr 2026 13:48:00 &#43;0800</pubDate>
  <author>作者</author>
  <guid>https://cfanzp008.github.io/aistupidlevel-ai-benchmark/</guid>
  <description><![CDATA[AI Stupid Level - AI 模型实时基准测试平台 简介 AI Stupid Level 是一个实时 AI 模型基准测试和排名平台。它追踪 50+ 主流 AI 模型，通过 7 维度评分体系对模型进行客观评测对比。
网站：https://aistupidlevel.info/
核心功能 7 维度评分体系 平台采用 7 个维度评估 AI 模型：
维度 说明 正确性 答案准确程度 规范遵循 符合指令要求 代码质量 代码规范和可维护性 效率 响应速度和资源消耗 稳定性 输出一致性 拒绝率 不当请求处理 特色功能 特殊能力支持 追踪模型 平台追踪 50+ 主流 AI 模型，包括：
OpenAI GPT-5 / GPT-4 / GPT-3.5 Anthropic Claude Opus 4 / Sonnet 4 Google Gemini 2.5 系列 xAI Grok 4 以及其他主流模型 实时更新 速度测试：每 4 小时更新 深度推理测试：每日更新 95% 置信区间统计 Smart Router API 功能特点 智能路由 API 可以自动选择最佳模型：]]></description>
</item>
</channel>
</rss>
