OpenAI 发布全新 o1 系列模型,首次在复杂推理、数学与代码任务上显著超越 GPT-4o,并可能开启“推理时间 Scaling Law”。团队答疑透露未来可控思考长度,同时因安全策略封禁追问完整思维链,引发行业对 AGI 路径与治理的新讨论。
李飞飞创业公司 World Labs 以 10 亿美元估值获 2.3 亿美元融资,剑指“大世界模型”;腾讯发布 GameGen-O 可一键生成开放世界游戏视频,被视为游戏工作室的“ChatGPT 时刻”。资本与巨头同步押注 3D 感知与生成,有望重塑内容创作与虚拟交互。
Reflection 模型被指成绩造假并道歉,MMLU-Pro 等新基准紧急上线,英伟达科学家称“现有测试已失灵”。行业面临基准饱和、刷榜泛滥的信任危机,推动更严格、可解释的评价体系成为共识。
G20 领导人达成新共识,联手打击 AI 驱动的虚假信息;沈向洋呼吁“主权人工智能”治理框架。全球高层动作频频,凸显 AI 扩散背景下的国家安全、伦理与信息生态挑战。
谷歌向安卓用户免费开放 Gemini Live 新助手,苹果 Apple Watch 将原生支持打鼾/睡眠呼吸暂停检测。巨头把大模型能力下沉到手机、可穿戴,加速边缘 AI 普及并激活新数据入口。
哈佛 Church Lab 综述 LLM 赋能药物发现全流程;A-Alpha Bio 发布全球最大蛋白相互作用数据库 AlphaSeq,获 8 轮融资。AI 正深入生物学底层数据,加速靶点发现与疗法设计。