LLaMA - AI话题 - AI快开门

2025-11-05

超级模型与多模态突破

llama.cpp 实现本地多模态革命，360 FG-CLIP2 拿下 29 项中英双语第一，谷歌 Gemini Nano Banana2 升级图像生成，北大&兔展 Uniworld V2 刷新中文细节 SOTA，扩散语言模型推理效率大幅提升。端侧与云侧同步跨越，多模态能力正成为下一代模型标配。

2025-07-31

AI编程与开发工具普及

GitHub Copilot 用户破 2000 万，微软 Copilot 新增“智能”模式绑定 GPT-5，Ollama 推出拖拽式桌面客户端让本地模型告别命令行。AI 编程正从代码补全升级为全栈生成与本地无代码体验，开发者生产力再跃升。

Copilot 编程 GitHub Ollama 开发者

2025-07-13

AI人才与巨头博弈

GPT-4o“吉卜力风”核心开发者被Meta挖角，OpenAI再失大将；Meta内部弃用Llama转向Claude写代码，Llama 4口碑滑坡。技术领先背后的人才流动与模型信任危机，正在重塑大厂竞争格局。

人才流动 OpenAI Meta Llama Claude

2025-06-05

开源生态全面突围

清华、华为、智源、日本Shisa等相继开源超长视频、MoE训练优化、数学证明及日语大模型，叠加NVIDIA Llama-Nemotron系列，开源模型在性能、效率、多模态上正面抗衡闭源，全球AI创新重心向开源倾斜。

开源模型 Video-XL-2 Shisa V2 Llama-Nemotron 华为MoE

2025-04-13

大模型评测与信任危机

Llama 4因“特供版”刷榜被重测后排名暴跌，引发社区对Meta诚信的质疑；同期强化学习推理模型被质疑改进仅为“噪音”，凸显行业对评测公正性与技术真实进展的焦虑。事件折射出大模型竞技缺乏统一标准，信任成本正在升高。

Llama 4 评测作弊强化学习信任危机大模型竞技

2025-04-08

Llama 4 争议与开源生态震荡

Meta 新旗舰 Llama 4 系列模型因被曝测试集训练、代码能力翻车、竞技场“特供版”刷榜而陷入信任危机；内部员工辞职、社区差评如潮，引发对开源模型透明度与评测公允性的集体反思，连带影响开源生态竞争格局与企业选型信心。

Llama 4 开源模型评测作弊社区信任

2025-04-07

Llama 4 开源风暴

Meta 发布首个原生多模态 Llama 4 系列，MoE 架构+千万级上下文刷新开源模型上限，但评测差异与实战翻车引发信任危机，开源社区进入“后 Llama”时代。

Llama 4 MoE 多模态开源评测争议

2025-04-06

Llama 4开源颠覆格局

Meta深夜开源原生多模态Llama 4，首次采用MoE架构，支持千万级上下文，竞技场分数超越DeepSeek，参数减半即可在单张H100运行，重夺开源大模型王座，并带动Meta AI高层变动，标志开源与闭源模型竞争进入新阶段。

Llama 4 MoE 开源 Meta 多模态

2024-12-08

大模型竞技场升级

Llama 3.3 70B性能追平405B、Gemini实验版重夺榜首，加上OpenAI 12天连发与Grok3、GPT-4.5即将登场，圣诞季成为头部厂商秀肌肉的关键窗口，标志着参数效率与迭代速度的新竞赛阶段。

Llama3.3 Gemini 模型榜单参数效率圣诞发布

2024-12-07

Meta Llama3.3 70B后训练反超旗舰

Meta发布Llama3.3 70B，仅用后训练优化即超越自家405B与GPT-4、Gemini1.5Pro，开源+高性价比策略再次搅动大模型竞争格局，降低企业与开发者部署顶级模型的硬件门槛，加速行业向“小而强”路线迁移。

Llama3.3 开源大模型后训练优化性能超越 Meta

2024-12-01

开源与封闭之争：AI治理新焦点

Nature评论直指Meta Llama以“open”之名行有限开放之实，触发社区对AI开源定义、治理与资源集中化的激烈辩论。事件折射出大模型时代“开源”概念被稀释，监管、伦理与商业利益如何平衡成为全球政策制定者的新难题。

开源治理 Llama Meta AI伦理资源集中

2024-11-09

超长上下文与法律推理大模型

清华等提出“无限长上下文”技术让Llama/Qwen百万token全绿；港科大&北大发布全球首个法律o1大模型，开启慢思考专业领域模型新范式，显著拓展大模型应用边界。

长上下文法律大模型慢思考 System2 Llama

2024-11-05

开源大模型持续迭代

腾讯 Hunyuan-Large、上海 AI Lab Llama-o1、清华 RDT 双臂机器人扩散模型等相继开源，长文本、数理推理、具身智能多线并进，降低研发门槛，加速行业应用落地。

开源大模型长文本推理具身智能 Llama-o1

2024-10-28

AI搜索与内容生成新形态

Perplexity查询量激增引发微软收购兴趣；Meta接连开源NotebookLlama与LongVU，支持文本转播客、长视频过滤理解；Cohere推出图文一体Embed 3。搜索、播客、长视频等内容形态被AI重新洗牌，流量入口格局或再分配。

AI搜索 Perplexity NotebookLlama LongVU 内容生成

2024-09-28

多模态与边缘AI落地

Meta开源多模态Llama 3.2，1B模型可跑手机；MIT ScribblePrompt医学图像分割优于SAM；首个检索增强3D生成模型10秒出图。多模态能力向轻量化、边缘端迁移，开启AR、医疗、XR等场景商业化。

多模态边缘AI 3D生成医学图像 Llama3.2

2024-09-26

开源多模态模型爆发

Molmo、Llama 3.2 等新一代开源多模态模型在图像理解、生成速度及端侧部署上全面逼近甚至超越 GPT-4o、Claude 3.5 等闭源标杆，显著降低开发者门槛，加速 AI 应用落地，并倒逼闭源厂商升级迭代。

开源多模态 Llama 3.2 Molmo 端侧部署

2024-09-01

大模型推理与芯片竞速

Cerebras发布1800 tokens/s的Llama3.1 8B推理架构，速度较GPU提升20倍；Mamba作者把Llama3蒸馏成混合线性RNN，兼顾效率与效果。专用芯片+新型架构双轮驱动，推理成本有望再降一个量级，为大模型普及铺路。

Cerebras 推理加速芯片线性RNN Llama3

2024-08-31

开源生态爆发

Llama家族全球下载量一年翻10倍突破3.5亿，阿里Qwen2-VL再为开源阵营添重磅模型，社区与商业公司共建工具链，降低开发者门槛，开源正成为抗衡闭源巨头、塑造行业标准的关键力量。

Llama 开源模型下载量 Qwen2-VL 开发者生态

2024-08-27

开源模型生态冷热

Llama-3.1开源后企业采纳度低于预期，字节跳动、智谱等中国厂商却持续开源生图/大模型API，显示开源与闭源路线在成本、性能与商业落地上的博弈进入新阶段，将直接影响下游开发者生态与云厂商策略。

开源闭源 Llama 字节智谱

2024-08-15

大模型技术突破与评测

Llama-8B借助搜索引擎在部分任务上超越GPT-4o，OpenAI发布更可靠的SWE-bench Verified编程评测集，Claude与Grok2相继上线“提示缓存”与FLUX.1图像生成，显示基础模型在效率、多模态和工程化方面的持续迭代，为开发者提供更便宜、更快速的API选项。

Llama-8B SWE-bench 提示缓存 FLUX.1 模型评测

# LLaMA