2025-10-04
多模态精细视觉突破
华中科大白翔团队提出 LIRA 框架,仅增两个轻量模块便将多模态大模型的分割与理解能力同时推至 SOTA,显著抑制幻觉并提升复杂场景下的像素级精度。该方法为自动驾驶、医疗影像等需要高精度视觉任务的行业提供了即插即用的新范式。
2025-08-19
图像/视频生成新范式
X-SAM统一分割、ToonComposer动画上色、图生视频“画两笔就动”、Genie 3世界模型实时交互等技术接连亮相,告别纯文本提示,推动AIGC进入“笔刷+手势”操控时代,降低创作门槛。
2024-11-03
生成式AI重塑游戏与内容
Oasis模型无需游戏引擎实时生成可玩「我的世界」,AI幻觉被反向利用提升图像分割精度,显示生成式AI正从工具变为独立内容生产者。
2024-08-26
AI for Science纵深突破
AlphaSeq以7.5亿条数据刷新蛋白质互作预测,MedSAM-2将SAM 2拓展至3D医学分割,Nat.Chem.Bio.与Chem.Sci.论文展示虚拟筛选与靶点发现新框架,AI正成为生命科学实验的“标准仪器”。