Llama-3.1-405B成为首个参数规模与GPT-4比肩的开源模型,上下文128k、八语种、工具调用能力全面升级;阿里Qwen2-Math在数学竞赛级评测中超越GPT-4o,开源+长文本+垂直能力三线并进,显著降低大模型使用门槛并加速行业落地。
Meta VFusion3D实现单图/文本秒级生成高质量3D资产,清华FFM光学AI直接在物理光路中完成神经网络训练无需反向传播,二者分别在数字内容创作和硬件级AI训练范式上取得突破,为XR、游戏、机器人及边缘智能开辟新路径。
GPT-4o被曝可模仿人类尖叫引发安全担忧,OpenAI随即发布32页技术报告并引入CMU安全专家Kolter进入董事会;Anthropic同步扩大漏洞赏金计划测试下一代安全系统,显示顶尖实验室正将模型可控性与安全评估置于产品发布核心流程。
谷歌将Gemini 1.5 Flash输入成本下调78%并新增PDF理解,OPPO国际版机型直接集成Gemini大模型,英特尔发布229 TOPS车载独显GPU可本地跑大模型,模型降价+终端预装+车规高算力三箭齐发,推动生成式AI向C端与车内场景快速渗透。
阿里Qwen2-Audio在多项语音任务超越OpenAI Whisper,德州大学联合NIH发布21.5万张X光问答数据集Medical-CXR-VQA,Fireworks提出可解释量化评估框架,显示大模型正快速向医疗、语音、数学等垂直场景深化,数据与评测方法同步升级。