AI快开门

发现最好的AI工具

2025-09-20

多模态与Agent模型争霸

UCSD DreamPRM登顶MMMU推理榜超越GPT-5;阿里开源30B Tongyi DeepResearch刷新HLE等评测SOTA;Grok 5未发先火,ARC-AGI微调版已领先OpenAI,轻量级开源与闭源巨兽同台竞技,加速模型能力跃迁。
2024-09-17

多模态基准与模型升级

MMMU-Pro将多模态评测推向“史诗级难度”,过滤纯文本、新增纯视觉问答;OPPO AndesGPT-2.0同步升级多模态能力,显示终端厂商与学术团队正把多模态理解作为下一代AI核心战场。