2024-08-10 AI话题 - AI快开门

开源大模型新里程碑

Llama-3.1-405B成为首个参数规模与GPT-4比肩的开源模型，上下文128k、八语种、工具调用能力全面升级；阿里Qwen2-Math在数学竞赛级评测中超越GPT-4o，开源+长文本+垂直能力三线并进，显著降低大模型使用门槛并加速行业落地。

Meta VFusion3D实现单图/文本秒级生成高质量3D资产，清华FFM光学AI直接在物理光路中完成神经网络训练无需反向传播，二者分别在数字内容创作和硬件级AI训练范式上取得突破，为XR、游戏、机器人及边缘智能开辟新路径。

GPT-4o被曝可模仿人类尖叫引发安全担忧，OpenAI随即发布32页技术报告并引入CMU安全专家Kolter进入董事会；Anthropic同步扩大漏洞赏金计划测试下一代安全系统，显示顶尖实验室正将模型可控性与安全评估置于产品发布核心流程。

谷歌将Gemini 1.5 Flash输入成本下调78%并新增PDF理解，OPPO国际版机型直接集成Gemini大模型，英特尔发布229 TOPS车载独显GPU可本地跑大模型，模型降价+终端预装+车规高算力三箭齐发，推动生成式AI向C端与车内场景快速渗透。

阿里Qwen2-Audio在多项语音任务超越OpenAI Whisper，德州大学联合NIH发布21.5万张X光问答数据集Medical-CXR-VQA，Fireworks提出可解释量化评估框架，显示大模型正快速向医疗、语音、数学等垂直场景深化，数据与评测方法同步升级。

CMU-清华LeanSTaR框架让LLM边思考边证明定理刷新miniF2F榜单，UCLA华人研究生联手MIT破解组合数学等差数列难题，吴恩达亲授Python AI新课降低入门门槛，顶级高校与在线教育平台持续为AI研究与应用输送新方法与人才。