← 返回列表

AI行业新闻简报 2025.06.28 周六

📊 6 个话题 📰 24 条新闻 🕐 2025-06-28 05:30

【概览】

谷歌、腾讯、北大密集开源2B-13B多模态小模型,单卡甚至手机即可跑出接近云端的大模型体验,标志“边缘AI”正式迈入可用阶段;OpenAI、谷歌、阿里同步开放“深度研究”级Agent API,让一次性自主检索并生成报告成为标配。端侧智能与自主研究双线并进,AI正从“能对话”走向“能落地”“能干活”。

01 | 开源多模态小模型潮

谷歌Gemma 3n、腾讯混元-A13B、北大RewardAnything本周相继开源,2B-13B参数规模即可在单张中低端GPU甚至2G内存手机上完成部署,多模态理解、工具调用与长文本能力逼近云端大模型。轻量+开源直接拉低开发者门槛,端侧应用有望迎来“App Store”式爆发。

02 | AI深度研究Agent竞速

OpenAI、谷歌、Anthropic本周齐发“深度研究”API,支持一次指令完成联网检索、资料比对与长报告生成;开源社区快速跟进OpenDeepResearcher,阿里发布检索Agent在GAIA基准超越GPT-4o。北大ScholarSearch评测显示学术检索仍是短板,预示Agent竞赛的下一个赛点将是“专业信源精准度”。

03 | 基因组AI突破秒级读变异

谷歌DeepMind推出AlphaGenome,首次用单一大模型在1秒内完成百万碱基级变异注释,精度超越所有专用工具,并登上Nature。该模型统一了突变效应预测、致病性打分与靶点发现等全任务,为精准医疗与新药研发提供“秒级”基础设施,生命科学与大模型进入“双螺旋”共振时代。

04 | 视频生成进入音画同步时代

可灵AI、HeyGen相继上线“视频音效”功能,扩散模型一次生成画面与同步原声,实现“所见即所听”;Suno收购WavTool补全AI音乐编辑闭环。音画同步把多模态创作从“无声短片”推向可直接投放的广告与影视预演,短视频行业面临新一轮生产力洗牌。

05 | AI硬件轻量化浪潮

小米AI眼镜、出门问问TicNote等把大模型塞进眼镜与卡片机身,集成拍摄、支付、翻译与情感陪聊;Hengbot机器狗切入家庭娱乐场景。端侧算力与模型压缩技术成熟,使可穿戴与陪伴类硬件成为轻量级AI的新流量入口,消费级市场有望复制TWS耳机的爆发曲线。

06 | 版权与合规拉锯升级

美联邦法院裁定“已购书籍训练AI属合理使用”,Anthropic随之销毁百万本书达成和解;YouTube、谷歌搜索全面上线AI摘要,出版商用Offerwall工具对冲流量损失。判例+平台规则变化显示,数据使用与内容分润正进入“再平衡”窗口期,低成本获取高质量训练数据的灰色地带被进一步压缩。

【展望】

当“小模型”性能逼近云端、开发门槛降到单卡甚至手机,边缘AI应用将迎来爆发式创新;而“深度研究”级Agent的API化,则把自主信息搜集与报告生成变为通用能力。短期内,端侧生态与专业信源精准度成为竞逐焦点;中长期看,基因组AI与音画同步视频生成将重塑医疗、影视等万亿级市场,版权规则的再平衡也将决定数据红利的可持续性与分配格局。