斯坦福、MIT等机构联合论文指控LMArena基准偏袒OpenAI、谷歌、Meta,Meta被曝提交27个Llama4版本仅取最高分,引发对大模型评测公正性的集体质疑,行业呼吁透明可审计的评测体系。
Shopify“AI优先”内部备忘录要求员工用AI替代人力、扩编需先证明AI无法胜任;美国白领遭遇12年最难求职季,AI与自动化被确认已实质影响就业结构,引发对劳动市场长期变革担忧。
英伟达与UIUC把Llama上下文扩至400万token创SOTA;微软Phi-4系列以小参数量逼近GPT-4o推理表现;LoRA冗余研究称可剪枝95%参数不降性能,推动端侧与低成本部署。
浙大联合vivo、港理工分别推出LearnAct与InfiGUI-R1,让手机AI仅一次示范即可学会复杂操作,并具备任务规划与错误反思能力,为移动端Agent落地提供关键技术支撑。
Anthropic发布Integrations功能并升级Claude高级研究模式,网页版同步接入MCP协议,10款主流应用一键调用,开发者30分钟可自建集成,显著降低AI工作流搭建门槛。
北大深圳研究生院成立全球首个AI for Science学院;NCATS数据+图神经网络筛选160万药物组合,51组抗胰腺癌协同效应获验证;几何深度学习预测3D细胞形态药效,AI正加速科学发现与精准医疗。
KAIST开源PaperCoder,多智能体LLM自动把论文转成可运行代码,解决顶级会议仅21%论文开源代码的复现难题;Hugging Face实践开放生态用户数据治理,为社区提供合规范本。