2025-11-05
超级模型与多模态突破
llama.cpp 实现本地多模态革命,360 FG-CLIP2 拿下 29 项中英双语第一,谷歌 Gemini Nano Banana2 升级图像生成,北大&兔展 Uniworld V2 刷新中文细节 SOTA,扩散语言模型推理效率大幅提升。端侧与云侧同步跨越,多模态能力正成为下一代模型标配。
2025-07-31
AI编程与开发工具普及
GitHub Copilot 用户破 2000 万,微软 Copilot 新增“智能”模式绑定 GPT-5,Ollama 推出拖拽式桌面客户端让本地模型告别命令行。AI 编程正从代码补全升级为全栈生成与本地无代码体验,开发者生产力再跃升。
2025-07-13
AI人才与巨头博弈
GPT-4o“吉卜力风”核心开发者被Meta挖角,OpenAI再失大将;Meta内部弃用Llama转向Claude写代码,Llama 4口碑滑坡。技术领先背后的人才流动与模型信任危机,正在重塑大厂竞争格局。
2025-06-05
开源生态全面突围
清华、华为、智源、日本Shisa等相继开源超长视频、MoE训练优化、数学证明及日语大模型,叠加NVIDIA Llama-Nemotron系列,开源模型在性能、效率、多模态上正面抗衡闭源,全球AI创新重心向开源倾斜。
2025-04-13
大模型评测与信任危机
Llama 4因“特供版”刷榜被重测后排名暴跌,引发社区对Meta诚信的质疑;同期强化学习推理模型被质疑改进仅为“噪音”,凸显行业对评测公正性与技术真实进展的焦虑。事件折射出大模型竞技缺乏统一标准,信任成本正在升高。
2025-04-08
Llama 4 争议与开源生态震荡
Meta 新旗舰 Llama 4 系列模型因被曝测试集训练、代码能力翻车、竞技场“特供版”刷榜而陷入信任危机;内部员工辞职、社区差评如潮,引发对开源模型透明度与评测公允性的集体反思,连带影响开源生态竞争格局与企业选型信心。
2025-04-07
Llama 4 开源风暴
Meta 发布首个原生多模态 Llama 4 系列,MoE 架构+千万级上下文刷新开源模型上限,但评测差异与实战翻车引发信任危机,开源社区进入“后 Llama”时代。
2025-04-06
Llama 4开源颠覆格局
Meta深夜开源原生多模态Llama 4,首次采用MoE架构,支持千万级上下文,竞技场分数超越DeepSeek,参数减半即可在单张H100运行,重夺开源大模型王座,并带动Meta AI高层变动,标志开源与闭源模型竞争进入新阶段。
2024-12-08
大模型竞技场升级
Llama 3.3 70B性能追平405B、Gemini实验版重夺榜首,加上OpenAI 12天连发与Grok3、GPT-4.5即将登场,圣诞季成为头部厂商秀肌肉的关键窗口,标志着参数效率与迭代速度的新竞赛阶段。
2024-12-07
Meta Llama3.3 70B后训练反超旗舰
Meta发布Llama3.3 70B,仅用后训练优化即超越自家405B与GPT-4、Gemini1.5Pro,开源+高性价比策略再次搅动大模型竞争格局,降低企业与开发者部署顶级模型的硬件门槛,加速行业向“小而强”路线迁移。
2024-12-01
开源与封闭之争:AI治理新焦点
Nature评论直指Meta Llama以“open”之名行有限开放之实,触发社区对AI开源定义、治理与资源集中化的激烈辩论。事件折射出大模型时代“开源”概念被稀释,监管、伦理与商业利益如何平衡成为全球政策制定者的新难题。
2024-11-09
超长上下文与法律推理大模型
清华等提出“无限长上下文”技术让Llama/Qwen百万token全绿;港科大&北大发布全球首个法律o1大模型,开启慢思考专业领域模型新范式,显著拓展大模型应用边界。
2024-11-05
开源大模型持续迭代
腾讯 Hunyuan-Large、上海 AI Lab Llama-o1、清华 RDT 双臂机器人扩散模型等相继开源,长文本、数理推理、具身智能多线并进,降低研发门槛,加速行业应用落地。
2024-10-28
AI搜索与内容生成新形态
Perplexity查询量激增引发微软收购兴趣;Meta接连开源NotebookLlama与LongVU,支持文本转播客、长视频过滤理解;Cohere推出图文一体Embed 3。搜索、播客、长视频等内容形态被AI重新洗牌,流量入口格局或再分配。
2024-09-28
多模态与边缘AI落地
Meta开源多模态Llama 3.2,1B模型可跑手机;MIT ScribblePrompt医学图像分割优于SAM;首个检索增强3D生成模型10秒出图。多模态能力向轻量化、边缘端迁移,开启AR、医疗、XR等场景商业化。
2024-09-26
开源多模态模型爆发
Molmo、Llama 3.2 等新一代开源多模态模型在图像理解、生成速度及端侧部署上全面逼近甚至超越 GPT-4o、Claude 3.5 等闭源标杆,显著降低开发者门槛,加速 AI 应用落地,并倒逼闭源厂商升级迭代。
2024-09-01
大模型推理与芯片竞速
Cerebras发布1800 tokens/s的Llama3.1 8B推理架构,速度较GPU提升20倍;Mamba作者把Llama3蒸馏成混合线性RNN,兼顾效率与效果。专用芯片+新型架构双轮驱动,推理成本有望再降一个量级,为大模型普及铺路。
2024-08-31
开源生态爆发
Llama家族全球下载量一年翻10倍突破3.5亿,阿里Qwen2-VL再为开源阵营添重磅模型,社区与商业公司共建工具链,降低开发者门槛,开源正成为抗衡闭源巨头、塑造行业标准的关键力量。
2024-08-27
开源模型生态冷热
Llama-3.1开源后企业采纳度低于预期,字节跳动、智谱等中国厂商却持续开源生图/大模型API,显示开源与闭源路线在成本、性能与商业落地上的博弈进入新阶段,将直接影响下游开发者生态与云厂商策略。