2025-08-21
超长上下文开源模型大战
字节跳动开源Seed-OSS-36B,512K上下文长度刷新纪录,性能对标DeepSeek;MIT提出TIM架构理论上实现“无限”推理长度,国产Avengers-Pro路由系统以19%成本逼近Gemini-2.5-Pro。超长上下文与高效推理成为开源社区新赛点,直接降低开发者门槛,加速长文档、代码、多模态应用落地。
2025-06-01
AI自生成内核颠覆框架
斯坦福华人团队用纯CUDA-C让AI自写GPU内核,性能最高提升4倍,直接超越PyTorch专家手写版本,证明AI可自动优化底层算子,为深度学习框架与编译器开辟“自进化”新范式,或重塑高性能计算开发流程。
2025-02-18
DeepSeek生态爆发
DeepSeek-R1/V3以低成本、高性能快速渗透中国主流应用,微信、百度、腾讯、网易等全线接入,带动国产模型替代潮,重塑大模型竞争格局。