AI快开门

发现最好的AI工具

2025-08-08

模型评测与基准升级

GPT-5、Grok4、Claude 4 Opus、Gemini 2.5 Pro等旗舰模型在LMArena、SWE-Bench、NoCode-bench等多维基准展开对决,o3在首届大模型国际象棋对抗赛夺冠,显示行业竞争焦点正从参数规模转向可验证的综合能力。
2025-08-05

开源生态与竞赛加速创新

阿里开源Qwen-Image、小米开源MiDashengLM-7B、Kaggle首届大模型对抗赛集结谷歌、DeepSeek、Kimi等顶尖模型,通过开放权重与公开Benchmark激发社区快速迭代,缩小开源与闭源差距,推动技术民主化。