2025-12-27
芯片格局再洗牌
英伟达200亿美元收购Groq、推出NVFP4低精度训练,TPU之父加入老黄阵营,GPU推理效率逼近极限,ASIC+GPU混合架构成新战场,决定未来AI算力成本与模型迭代速度。
2025-12-25
英伟达200亿美元锁定Groq
英伟达非独家授权Groq TPU级芯片技术并挖角其CEO及核心团队,交易估值约200亿美元,为英伟达史上最大技术并购,意在补强推理侧芯片短板,巩固AI算力霸权,或重塑AI芯片竞争格局。
2025-09-18
端侧小模型与推理优化潮
Meta发布MobileLLM-R1瞄准手机端小型推理,Groq融资7.5亿美元推超高速芯片,Ring-mini-2.0以1B参数超10B性能,显示“小而强”模型+专用硬件正成为边缘AI新趋势。
2025-07-30
AI芯片与算力基建融资热
Groq以60亿美元估值洽谈6亿美元融资,AMD发布锐龙AI Max+ 395可在本地跑1280亿参数大模型,无问芯穹提出“三盒方案”打通十万卡到单卡训练,英伟达开源Llama Nemotron Super v1.5实现单卡SOTA推理,显示高性能与低成本算力需求同步飙升,资本与巨头双向加码。
2024-02-27
大模型推理成本与速度博弈
Groq、Mistral Large、Gemini 10M上下文等新模型在速度、成本、长文本上展开拉锯战:Groq宣称快4倍但持有成本10倍于H100,行业重新审视“快”与“省”的边界。
2024-02-23
英伟达业绩爆表统治算力
英伟达Q4营收221亿美元、净利122亿,同比增769%,数据中心占184亿;Groq等挑战者推极致推理芯片却暴露成本天价,凸显英伟达在AI算力供应链的绝对霸主地位与壁垒。
2024-02-22
推理芯片突围英伟达
Groq自研LPU芯片推理速度达GPT-4的18倍,能耗优于GPU;新型光子/存算一体芯片登Nature子刊,强调低功耗与防黑客特性,算力多元化开始冲击英伟达垄断格局。