AI 热点日报 | 2026年6月5日

数据来源:AI HOT(aihot.virxact.com)


今日头条

Nex-N2-Pro 发布:397B MoE 推理模型,性能达 GPT-5.5 水平

neolab 推出 Nex-N2-Pro,基于 Qwen3.5-397B-A17B 的 397B MoE 推理模型,支持 262K 上下文与多模态。可自动调节推理深度,减少 30-50% 思考 token 且无性能折损,在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得 SOTA。硅基流动提供 T+0 支持,前两周免费。

📎 硅基流动 @ X

台积电坦言产能跟不上 AI 需求

全球最大芯片制造商台积电表示,通过美国本土生产满足客户需求可能需要"非常长的时间",凸显 AI 需求带来的巨大产能压力。

📎 The Verge


模型发布/更新

NVIDIA Nemotron 3 Ultra 发布:为长时间运行智能体优化

专为多轮对话中保持上下文、调用工具和子智能体的长期运行 AI 智能体设计,显著提升推理速度并降低计算成本。

📎 NVIDIA Developer Blog

Nemotron 3.5 Content Safety:可定制的多模态安全模型

基于 Gemma 3 4B IT,128K 上下文,支持自然语言定义自定义策略。覆盖 12 种语言,零样本泛化至约 140 种语言,可在 8GB+ VRAM GPU 上实时部署。

📎 Hugging Face Blog

Google Magenta RealTime 2(MRT2):开源实时音乐模型

通过 MIDI 键盘、实时文本提示甚至手势进行演奏。在 MacBook 上原生运行,延迟低于 200ms,开放权重且提供开源推理引擎。

📎 Google AI Developers @ X


产品发布/更新

Replit Agent 联手 Shopify 快速建店

从想法到上线商店只需几分钟:构建自定义店铺页面、创建 Shopify 商店、添加商品。

📎 Replit @ X

ChatGPT 推出 Dreaming 记忆系统

更强的记忆系统,更好地记住用户偏好,在跨对话场景中保持上下文的新鲜感。

📎 OpenAI

Gemini macOS 双击 Command 附加活动窗口

双击 Command 键将当前活动窗口无缝附加到聊天中,无需手动截图或切换标签页。

📎 Gemini @ X

OpenAI API 新增内容审核评分

Moderation scores 现已在 Responses API 和 Completions API 中可用,在同一请求流程中返回审核信号。

📎 OpenAI Developers @ X

Stanford 发布 OpenJarvis:本地优先设备端 AI 智能体框架

完全在设备端运行推理、智能体、记忆与学习,与最佳云端模型性能差距在 3.2 分以内,边际 API 成本降低约 800 倍。

📎 MarkTechPost

Anthropic 开源 AI 驱动漏洞发现框架

📎 GitHub

NotebookLM 来源归属功能上线

可查看每个创作物背后的确切公式(提示词 + 来源),支持一键迭代调整。

📎 NotebookLM @ X

Codex 推出 iOS 应用构建插件

在应用内浏览器查看和测试 iOS 应用,无需离开 Codex 即可热重载编辑。

📎 OpenAI Developers @ X


行业动态

Cloudflare Radar:机器人流量首次超过人类,占比 57.5%

过去一周全球 HTML 网页请求中,57.5% 来自机器人,仅 42.5% 来自真人浏览器。互联网流量主体已从人类浏览网页转向机器间通信和机器人抓取。

📎 小互 @ X

联合国报告:2030 年 AI 数据中心水电消耗将翻倍

去年全球数据中心耗电 448 TWh(AI 占五分之一),耗水 4.5 万亿升。预计 2030 年耗电翻倍至 945 TWh(AI 占 40%),耗水增至 9.3 万亿升。

📎 IT之家

微软 AI 负责人:Anthropic 模型太贵,正自研更便宜替代品

📎 Bloomberg

DeepSeek 连续四周登顶 OpenRouter Token 份额榜

📎 OpenRouter

Nemotron Parakeet ASR 印尼语准确率达 97.7%

📎 NVIDIA @ X


论文研究

Google 发布被动心率监测系统 PHRM

利用智能手机前置摄像头在日常使用中通过人脸视频估算心率,MAPE 低于 10%,MAE 低于 5 bpm(对比可穿戴设备)。发布迄今最大规模公开智能手机视频数据集。

📎 Google Research Blog

NVIDIA 任务种子合成数据生成

100B token 续训练实验中,Task-Seeded SDG 使 MMLU-Pro 提升 1.8 分,GPQA 提升 11.1 分。

📎 Hugging Face Blog

NVIDIA PPISP:补偿光度变化提升 3D 重建

📎 NVIDIA AI @ X


技巧与观点

OpenAI:AI 递归自我改进迹象初现

OpenAI 官方写道"我们看到了当今系统中递归自我改进(RSI)的早期迹象:AI 开发本身正被 AI 加速。这预计将加剧竞争压力,并带来现有机构无法应对的治理挑战。"

📎 Kim @ X

Higgs Audio v3 TTS:支持 100 种语言的端到端语音合成

约 4B 参数,支持实时控制情感(20+ 种)、风格、韵律及音效,流式合成无需完整文本即可生成语音。

📎 LMSYS Blog

OpenRouter 翻遍 11 款 LLM 找最快决策模型

总花费 482 美元,30 轮实时决策"大逃杀"挑战。Claude 和 Grok 系列在决策速度与任务成功率上突出,多项高分模型实时调度能力未达预期。

📎 OpenRouter Announcements

Ethan Mollick:共存与协同智能的终结

📎 One Useful Thing

Alex Imas & Phil Trammell:AGI 后什么仍然稀缺?

机器人可快速复制增长,但人类独特技能(如芭蕾舞演员)数量保持不变。

📎 Dwarkesh Patel Blog

OpenAI 发布《智能时代的生物防御》行动计划

📎 OpenAI


AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)