2025-05-02 AI话题 - AI快开门

LMArena榜单操控风波

斯坦福、MIT等机构联合论文指控LMArena基准偏袒OpenAI、谷歌、Meta，Meta被曝提交27个Llama4版本仅取最高分，引发对大模型评测公正性的集体质疑，行业呼吁透明可审计的评测体系。

Shopify“AI优先”内部备忘录要求员工用AI替代人力、扩编需先证明AI无法胜任；美国白领遭遇12年最难求职季，AI与自动化被确认已实质影响就业结构，引发对劳动市场长期变革担忧。

英伟达与UIUC把Llama上下文扩至400万token创SOTA；微软Phi-4系列以小参数量逼近GPT-4o推理表现；LoRA冗余研究称可剪枝95%参数不降性能，推动端侧与低成本部署。

浙大联合vivo、港理工分别推出LearnAct与InfiGUI-R1，让手机AI仅一次示范即可学会复杂操作，并具备任务规划与错误反思能力，为移动端Agent落地提供关键技术支撑。

Anthropic发布Integrations功能并升级Claude高级研究模式，网页版同步接入MCP协议，10款主流应用一键调用，开发者30分钟可自建集成，显著降低AI工作流搭建门槛。

北大深圳研究生院成立全球首个AI for Science学院；NCATS数据+图神经网络筛选160万药物组合，51组抗胰腺癌协同效应获验证；几何深度学习预测3D细胞形态药效，AI正加速科学发现与精准医疗。

KAIST开源PaperCoder，多智能体LLM自动把论文转成可运行代码，解决顶级会议仅21%论文开源代码的复现难题；Hugging Face实践开放生态用户数据治理，为社区提供合规范本。

Meta更新Ray-Ban智能眼镜隐私政策，默认开启语音录制引争议；上汽大众牵手Momenta，从“西技中用”转向“中技西用”，上海车展成中国汽车智能化输出风向标。