site stats
根据 LiveBench 的评分表格,xAI 的 “grok-3-thinking” 总体平均得分 71.57%,在编程任务上得分 67.38%,低于 OpenAI 的 o3-mini-2025-01-31-high(82.74%)和 o1-2024-12-17-high(69.69%)。 LiveBench 是一个由 xAI 等机构开发的无污染、客观的 LLM
sign_in_with_google sign_in_with_google

2957 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前