site stats
根据 LiveBench 的评分表格,xAI 的 “grok-3-thinking” 总体平均得分 71.57%,在编程任务上得分 67.38%,低于 OpenAI 的 o3-mini-2025-01-31-high(82.74%)和 o1-2024-12-17-high(69.69%)。LiveBench 是一个由 xAI 等机构开发的无污染、客观的 LLM
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多