2025-12-03
AI视频生成进入有声电影时代
Runway Gen-4.5、快手可灵O1、Kling 2.6等模型实现物理光影、重量感、多主体参考及原生音频同步生成,Elo评分登顶Video Arena,标志着AI视频从“无声短片”跃迁至可商用影视级制作,冲击传统内容工业。
2025-06-29
OpenAI核心人才流失潮
Meta连续挖角OpenAI四位华人科学家,涵盖o1核心贡献者、多模态后训练与感知团队负责人,显示巨头间人才争夺进入白热化阶段,或重塑大模型竞争格局并加速技术外溢。
2025-06-09
AI 医疗诊断突破
斯坦福、哈佛联合验证 OpenAI o1 临床推理准确率 78%,超人类医生;国内中南大学、元生 OriGene 等发布轻量级肺癌诊断与靶点发现系统,AI 医疗进入实用拐点。
2025-05-22
AI硬件与芯片突围
OpenAI 65亿美元收购io打造1亿台AI伴侣设备,华为昇腾FlashComm+OptiQuant推理提速80%,小米玄戒O1旗舰处理器商用,软硬件协同成为新焦点,边缘算力、低延迟推理与消费级AI终端进入落地冲刺期。
2025-03-21
国产大模型价格战与性能突围
DeepSeek、阿里通义、字节豆包等国产大模型在推理成本、写作、语音及多模态能力上集中升级,李开复预言未来仅剩三家巨头;同时OpenAI推出史上最贵o1-pro,中外价差高达270倍,凸显国产模型性价比优势与生态卡位关键期。
2025-03-20
推理大模型价格战升级
OpenAI推出百万token 600美元的o1-pro,定价达DeepSeek-R1的270倍;谷歌Gemini升级Canvas语音编程,国产240元数学多模态R1亦亮相。高价旗舰与低价高效模型并存,标志大模型进入“极致性能 vs 极致性价比”双轨竞争,将重塑云厂商、开发者及企业采购策略。
2025-01-30
推理模型蓝图发布
ETH Zurich等机构提出“推理语言模型(RLM)”统一蓝图,系统拆解o1、o3、DeepSeek-V3的强推理机制,指出其是迈向AGI的关键里程碑,为行业提供可复制的方法论,降低复杂问题求解门槛。
2025-01-22
国产大模型密集升级
字节豆包1.5 Pro、网易子曰-o1、DeepSeek-R1等国产模型在推理、多模态、长上下文等维度集体突破,部分指标超越GPT-4o与Claude3.5,并同步开源权重,标志中国大模型进入“可用+可控”新阶段。
2025-01-22
模型蒸馏与评测反思
中科院、北大等研究指出除Claude、Gemini、豆包外,多数主流模型存在“过度蒸馏”,性能反而下降;人大清华提出Search-o1框架,用自主搜索缓解推理模型知识幻觉,推动评测方法升级。
2025-01-21
国产开源大模型爆发
DeepSeek-R1、Kimi k1.5、月之暗面K1.5等国产模型相继开源,性能对标OpenAI o1,成本骤降90%,标志中国大模型进入“性能+性价比”双拐点,加速AI平权与全球竞争。
2025-01-19
搜索增强推理模型新框架
清华人大联合发布Search-o1,让大模型在推理链中主动调用搜索引擎,实时补齐知识缺口,在博士级科学问答等11项评测拿下10项SOTA,整体表现超人类专家。该框架为“慢思考”大模型补全知识幻觉短板提供通用方案,有望重塑科研、代码、医疗等严肃场景应用。
2025-01-12
低成本开源推理模型
UC伯克利团队以不足450美元成本复现OpenAI o1-preview级推理能力,开源32B参数模型Sky-T1,打破“大模型=高算力”神话,引爆社区二次创新热潮,预示推理范式平民化。
2025-01-10
小模型数学推理逆袭o1
微软rStar-Math、360-LLaMA-Factory等方法让7B参数模型在数学基准上超越OpenAI o1,结合自进化与后训练技术,打破“大即好”神话,为端侧低成本高精度推理开辟新路径。
2025-01-07
医疗AI推理大模型突破
港中大发布医疗推理大模型HuatuoGPT-o1,号称“AI华佗”,在复杂疾病诊断上实现类医生级推理;MIT-哈佛团队推出可解释小分子深度学习平台,加速药物发现,医疗AI正从感知走向高阶认知与可解释决策。
2025-01-05
国产大模型技术突围与人才争夺
DeepSeek以1/11算力实现超越Llama 3的性能,复旦等团队揭示OpenAI o1核心思路,显示中国科研团队在模型架构、训练策略上的原创突破,伴随顶尖人才天价挖角,国产大模型进入“技术+人才”双轨超车阶段。
2025-01-02
推理与Agent架构突破
OpenAI o1系列通过深度推理范式刷新性能上限;清华、谷歌、腾讯等多团队同步优化推理对齐与Agent框架,预示2025年成为“AI Agent落地元年”。
2025-01-01
推理时计算缩放引领后训练范式
OpenAI o1系列通过“推理时计算缩放”把算力从预训练转向推理阶段,Google、Anthropic与国内团队同步跟进,证实复杂任务可凭动态思考提升性能,为低成本持续改进模型开辟新路线,冲击传统Scaling Law。
2024-12-21
谷歌Gemini 2.0闪电推理
谷歌推出Gemini 2.0 Flash Thinking,主打“快思考”——推理速度提升5倍,可实时展示思考链,数学、物理、摩斯码等多模态难题秒级解决,直接对标OpenAI o1,加速大模型竞技进入“秒回”时代。
2024-12-20
推理模型军备竞赛
OpenAI、谷歌、Meta等巨头密集发布新一代推理模型(o3、Gemini2.0 Flash Thinking、连续思维链),数学、代码、科学推理能力再刷新SOTA,标志着大模型从“生成”走向“深度思考”,将重塑科研、教育、企业决策等高价值场景。
2024-12-16
预训练时代终结与Scaling新范式
Ilya、OpenAI核心成员及多篇报道共同指出:大模型‘暴力预训练’边际收益递减,Scaling Law正转向推理时计算、强化学习与专用架构。该判断将重塑算力需求、创业方向与资本布局,被视为大模型下半场的分水岭。