2025-06-28 AI简报 - AI快开门

【概览】

谷歌、腾讯、北大密集开源2B-13B多模态小模型，单卡甚至手机即可跑出接近云端的大模型体验，标志“边缘AI”正式迈入可用阶段；OpenAI、谷歌、阿里同步开放“深度研究”级Agent API，让一次性自主检索并生成报告成为标配。端侧智能与自主研究双线并进，AI正从“能对话”走向“能落地”“能干活”。

01 | 开源多模态小模型潮

谷歌Gemma 3n、腾讯混元-A13B、北大RewardAnything本周相继开源，2B-13B参数规模即可在单张中低端GPU甚至2G内存手机上完成部署，多模态理解、工具调用与长文本能力逼近云端大模型。轻量+开源直接拉低开发者门槛，端侧应用有望迎来“App Store”式爆发。

02 | AI深度研究Agent竞速

OpenAI、谷歌、Anthropic本周齐发“深度研究”API，支持一次指令完成联网检索、资料比对与长报告生成；开源社区快速跟进OpenDeepResearcher，阿里发布检索Agent在GAIA基准超越GPT-4o。北大ScholarSearch评测显示学术检索仍是短板，预示Agent竞赛的下一个赛点将是“专业信源精准度”。

03 | 基因组AI突破秒级读变异

谷歌DeepMind推出AlphaGenome，首次用单一大模型在1秒内完成百万碱基级变异注释，精度超越所有专用工具，并登上Nature。该模型统一了突变效应预测、致病性打分与靶点发现等全任务，为精准医疗与新药研发提供“秒级”基础设施，生命科学与大模型进入“双螺旋”共振时代。

04 | 视频生成进入音画同步时代

可灵AI、HeyGen相继上线“视频音效”功能，扩散模型一次生成画面与同步原声，实现“所见即所听”；Suno收购WavTool补全AI音乐编辑闭环。音画同步把多模态创作从“无声短片”推向可直接投放的广告与影视预演，短视频行业面临新一轮生产力洗牌。

05 | AI硬件轻量化浪潮

小米AI眼镜、出门问问TicNote等把大模型塞进眼镜与卡片机身，集成拍摄、支付、翻译与情感陪聊；Hengbot机器狗切入家庭娱乐场景。端侧算力与模型压缩技术成熟，使可穿戴与陪伴类硬件成为轻量级AI的新流量入口，消费级市场有望复制TWS耳机的爆发曲线。

06 | 版权与合规拉锯升级

美联邦法院裁定“已购书籍训练AI属合理使用”，Anthropic随之销毁百万本书达成和解；YouTube、谷歌搜索全面上线AI摘要，出版商用Offerwall工具对冲流量损失。判例+平台规则变化显示，数据使用与内容分润正进入“再平衡”窗口期，低成本获取高质量训练数据的灰色地带被进一步压缩。

【展望】

当“小模型”性能逼近云端、开发门槛降到单卡甚至手机，边缘AI应用将迎来爆发式创新；而“深度研究”级Agent的API化，则把自主信息搜集与报告生成变为通用能力。短期内，端侧生态与专业信源精准度成为竞逐焦点；中长期看，基因组AI与音画同步视频生成将重塑医疗、影视等万亿级市场，版权规则的再平衡也将决定数据红利的可持续性与分配格局。

AI快开门

发现最好的AI工具