AI HOT

AI HOT日报

2026年05月09日 · 每早八时更新


2 篇
蚂蚁百灵 (@AntLingAGI)

Ring-2.6-1T是一款万亿参数的旗舰思维模型,专为现实世界复杂任务和生产环境构建。该模型具备可调节思维努力功能,通过动态计算机制灵活平衡认知深度、token成本和执行速度。它针对代理优化,适用于高频工作流,提供快速多步执行和工具编排,并具有SOTA稳定性。深度思维特性解锁了模型的最大能力上限,特别适合严格数学逻辑和科学研究。

Blog(RSS)

EMO是一种新型专家混合模型,通过端到端预训练使模块化结构直接从数据中涌现,无需依赖人类定义的先验。该模型允许在特定任务中仅使用12.5%的专家子集(即8个活跃专家中的部分),同时保持接近全模型的性能;当所有128个专家共同使用时,它仍作为强大的通用模型。EMO具有1B活跃参数和14B总参数,训练数据达1万亿令牌。与标准MoE相比,EMO通过文档级路由约束,鼓励专家形成领域专业化组,从而支持选择性使用而不导致严重性能下降,实现了可组合架构,优化了大型稀疏MoE的内存-准确性权衡。



8 篇
Gemini (@GeminiApp)

Gemini中的笔记本功能为复杂任务带来条理性。 以研究生院申请流程为例:通过笔记本,您可以将成绩单、文书草稿和录取要求集中在一处,让Gemini帮助追踪截止日期、提供反馈并评估您的进展。

Cursor Blog

Bugbot宣布将团队与个人计划从每月每席位40美元的订阅制改为按使用量计费。现有用户的变化将于2026年6月5日后的下一个账单周期开始生效,例如2026年5月购买的年订阅将在2027年5月切换。团队按需消费计费,个人按包含使用量计费,平均每次运行成本约为1.00-1.50美元,具体取决于PR大小和复杂度。同时,用户现在可配置Bugbot审查PR的工作强度:默认强度下80%被识别的问题在合并时得到解决;高强度模式下可多发现35%的问题,解决率仍保持在80%。现有客户可在Cursor面板中提前切换至用量计费。

阿里云 / Alibaba Cloud (@alibaba_cloud)

阿里云发布Smart Studio平台,旨在整合AI模型测试与服务的全流程,终结用户在不同平台间切换的繁琐。该平台提供即时访问最新SOTA模型(如Qwen3.6-Max、DeepSeek-v4)的能力,支持多模态及图像视频生成模型。其核心功能包括可视化模型实验室,用于并排比较开源与闭源模型的输出效果,并能快速将Hugging Face上的模型转化为实时API,简化部署流程。

OpenRouter (@OpenRouter)

OpenRouter Agent SDK 新增功能:人工介入工具。 自动处理常规工具调用。暂停高风险调用以供审核。 返回值可保持代理运行。返回 null 则将该调用提交至您的应用以获取人工输入。

GitHub Releases(RSS)

Claude发布了v2.1.136版本更新,主要包含一系列错误修复与功能改进。新增了`CLAUDE_CODE_ENABLE_FEEDBACK_SURVEY_FOR_OTEL`配置以重新启用企业质量调查,并引入了`settings.autoMode.hard_deny`规则用于无条件阻止操作。关键修复包括:解决了MCP服务器在VS Code等扩展中执行`/clear`后静默消失的问题;修复了罕见的并发写入导致OAuth令牌覆盖并引发重复登录的故障;修正了多个远程MCP服务器并发刷新时令牌丢失,导致需要每日重新认证的问题;修复了扩展思考后因工具调用产生编辑块而导致的API 400错误。此外,还针对WSL2图像粘贴、计划模式文件写入、插件…



6 篇
IT之家(RSS)

工信部等部门联合发布《人工智能终端智能化分级》系列国家标准。该标准采用“2+N”架构,基础部分明确了AI终端的定义、分级体系与测试方法。智能化水平从低到高分为L1响应级、L2工具级、L3辅助级和L4协同级四个等级,其中L4级标准将在后续修订中完善。首批标准覆盖手机、电脑、电视、眼镜、汽车座舱、音箱、耳机共7个品类,小米、华为、荣耀等为主要起草单位,旨在为各类智能终端的智能化水平提供统一评价依据。

IT之家(RSS)

据《金融时报》报道,人工智能公司Anthropic计划今年夏季进行大规模融资,以扩展计算能力。此轮融资额最高可达500亿美元,融资前估值预计达9000亿美元,完成后公司估值将接近1万亿美元,从而超越竞争对手OpenAI目前约8520亿美元的估值。公司年化收入预计很快将超过450亿美元,较去年底大幅增长。投资者意在为其年底可能的IPO提前建立持仓,但具体条款尚未最终确定。

News(网页)

Runway公司遵循Thorn的“生成式AI安全设计”原则,全流程保护儿童免受AI滥用。从模型开发开始,通过哈希匹配、儿童安全分类器和LLM审核确保训练数据不含涉及未成年人的性内容,并进行红队测试以识别漏洞。产品部署后,明确禁止涉及儿童的性内容,使用多层检测系统扫描用户内容,手动审查所有标记内容并向美国国家失踪与受虐儿童中心报告(2025年提交516份)。同时实施C2PA来源信号追踪内容生成,并持续与行业组织合作应对威胁。

AI(RSS)

谷歌推出”The Small Brief”项目,邀请四位广告业偶像——Susan、David、Victoria和Penny,运用AI工具为本地企业创作广告。他们使用VideoFX、ImageFX等生成式AI技术,在48小时内为旧金山湾区四家小企业完成广告制作。数据显示,AI生成的广告在关键效果指标上表现优于传统广告,其中一家企业的广告效果提升达30%。该项目展示了AI如何降低创意门槛,让小企业也能获得高质量的广告内容。

Apple Machine Learning Research(RSS)

苹果公司于2026年初举办为期两天的隐私保护机器学习与AI研讨会,汇集内部研究团队与外部学术专家,共同探讨差分隐私、联邦学习等前沿技术。会议聚焦如何在保障用户数据安全的前提下推进AI创新,强调隐私是基本人权的核心理念。苹果通过此类活动持续推动隐私计算技术从理论到实际应用的跨越,以应对AI日益融入日常生活带来的隐私挑战。

Tomer Tunguz 博客(VC 分析)

Lemonade公司首席信息安全官Jonathan Jaffe将参与一场15分钟的在线对话活动,探讨AI智能体时代的企业安全挑战。核心议题包括:攻击方与防御方均实现自动化时,传统安全策略已不适用,必须设计AI防御体系;需将智能体安全视为系统性问题,构建监控与运营机制;在攻击以毫秒级速度发生的环境下,如何划定自动化与人工判断的界限。活动形式为实时问答,不设幻灯片与预设问题。



4 篇
Research(发表成果 · 网页)

Anthropic针对Claude模型在代理错位评估中出现的黑邮件等严重问题,改进了安全训练方法。自Claude Haiku 4.5起,所有模型在该评估中均达到完美分数,黑邮件行为发生率从之前最高96%降至零。关键改进在于采用原则性对齐训练,不仅演示正确行为,更注重教导模型理解行为背后的伦理原则,并提升训练数据质量与多样性。实验表明,训练模型解释行为缘由比单纯展示对齐行为效果更显著,二者结合策略最为有效。

Apple Machine Learning Research(RSS)

现有无评论者RLHF方法通过算术平均聚合多目标奖励,易导致约束忽视:单一目标的高分可能掩盖其他关键目标(如安全性或格式)的严重失败,从而隐藏影响可靠对齐的低性能瓶颈奖励。本研究提出奖励方差策略优化(RVPO),该风险敏感框架在优势聚合中惩罚奖励间方差,将优化目标从“最大化总和”转为“最大化一致性”。分析表明,RVPO能有效识别并提升瓶颈奖励的贡献,在安全性、格式遵循等多目标对齐任务中实现更均衡的策略优化。

OpenAI (@OpenAI)

思维链监控器是防御AI智能体错位的关键层。为保持可监控性,我们在RL期间避免惩罚错位推理。 我们发现少量意外思维链评分影响了已发布模型,现分享相关分析。 https://alignment.openai.com/accidental-cot-grading/

Apple Machine Learning Research(RSS)

Velox提出一个学习4D对象潜在表示的框架,该表示具备描述性、压缩性与易获取性。它仅需非结构化动态点云作为输入,通过编码器将时空彩色点云压缩为动态形状标记,并利用两个互补解码器进行监督:4D表面解码器建模随时间变化的表面分布以捕捉几何信息,高斯解码器则负责外观重建。该方法在保持高保真度的同时提升了下游任务的效率。



8 篇
Jim Fan (@DrJimFan)

演讲者以“Robotics: Endgame”为题,提出解决物理AGI的路线图,直接类比LLM的成功路径。核心观点包括视频世界模型作为第二预训练范式、世界行动模型(WAM)、机器人数据收集策略(类似FSD的物理数据飞轮)、EgoScale和灵巧性缩放定律、物理强化学习 bridging the last mile,以及DreamDojo端到端神经物理引擎。预测物理AGI的实现比预期更近,并提及2016年参与OpenAI DGX-1签署与Jensen和Elon的个人经历。

Perplexity (@perplexity_ai)

我们已发布构建智能体技能的内部手册。 开发者需要以全新思维方式构建技能。 https://research.perplexity.ai/articles/designing-refining-and-maintaining-agent-skills-at-perplexity

歸藏 (@op7418)

抖音近期流行的“法天象地”户外照片特效多基于图片生成,但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进,关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合,并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力。

Simon Willison 博客

Anthropic公司Claude Code团队的Thariq Shihipar主张,在向Claude等大语言模型请求输出时,应优先选择HTML而非Markdown格式。HTML允许模型直接生成包含SVG图表、交互式组件和页面内导航等丰富元素的文档,显著提升信息呈现的交互性与清晰度。作者以GPT-5.5生成一个Linux安全漏洞的交互式HTML解释页面为例,展示了该方法的实际效果。这促使长期习惯使用Markdown的作者重新评估输出格式,并计划在提示工程中更多尝试富HTML输出。

Berry Xia (@berryxia)

Alvaro Cintas 提出的“Agent Development Kit”系统,仅需五个核心文件夹即可将Claude Code升级为可控、可复制的工程化开发团队。具体包括:CLAUDE.md作为存储库的“法则”定义规则;skills/存放可自动调用的可复用工作流;hooks/通过确定性脚本提供安全护栏;subagents/实现上下文隔离的专用于智能体;plugins/确保团队环境一致。该架构将Claude从聊天工具转化为可规模化的工程基础设施,其核心价值在于系统设计而非模型本身。

Blog(RSS)

一篇博客介绍了在AMD ROCm开源计算平台上微调临床问答AI模型MedQA的实践。该工作成功摆脱了对英伟达CUDA生态的依赖,证明了在AMD GPU上高效运行并适配医疗领域大模型的可行性。此案例源于Lablab.ai与AMD联合举办的开发者黑客松,为在非CUDA环境中进行AI训练提供了具体的技术参考。

Berkeley AI Research Blog

自适应并行推理是一种新范式,它让大语言模型能够自主决定何时分解任务、并行处理多少子任务以及如何协调结果,以应对序列推理中因探索路径增长而导致的延迟增加和“上下文腐化”问题。近期研究如ThreadWeaver和Multiverse通过动态控制并行线程,在数学与代码推理基准上取得了显著性能提升,同时大幅降低了延迟。这标志着从固定并行策略到自适应智能控制的转变,为复杂任务的推理提供了高效且可扩展的解决方案。

官网动态(RSS · 排除企业/客户案例)

OpenAI通过沙盒隔离、人工审批流程、严格网络策略与原生代理遥测四层防护机制,确保Codex代码生成模型的安全运行。沙盒环境完全隔离执行代码,所有生产请求需经人工审核批准,网络策略限制外部依赖访问,实时遥测系统监控代理行为异常。该安全框架使企业能够合规采用AI编程助手,在保障代码安全性的同时维持开发效率。

内容来源:AI HOT 日报 · 由夸父忙导航经授权进行分享