AI 热点日报 | 2026年6月5日

2026年6月5日 AI 圈要闻：Nex-N2-Pro 397B 推理模型发布、NVIDIA Nemotron 3 Ultra 发布、Google 开源实时音乐模型 MRT2、台积电坦言产能跟不上 AI 需求、机器人流量首次超过人类

June 5, 2026 · 2 min · 352 words · 钟懿

数据来源：AI HOT（aihot.virxact.com）

今日头条

Nex-N2-Pro 发布：397B MoE 推理模型，性能达 GPT-5.5 水平

neolab 推出 Nex-N2-Pro，基于 Qwen3.5-397B-A17B 的 397B MoE 推理模型，支持 262K 上下文与多模态。可自动调节推理深度，减少 30-50% 思考 token 且无性能折损，在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得 SOTA。硅基流动提供 T+0 支持，前两周免费。

📎 硅基流动 @ X

台积电坦言产能跟不上 AI 需求

全球最大芯片制造商台积电表示，通过美国本土生产满足客户需求可能需要"非常长的时间"，凸显 AI 需求带来的巨大产能压力。

模型发布/更新

NVIDIA Nemotron 3 Ultra 发布：为长时间运行智能体优化

专为多轮对话中保持上下文、调用工具和子智能体的长期运行 AI 智能体设计，显著提升推理速度并降低计算成本。

📎 NVIDIA Developer Blog

Nemotron 3.5 Content Safety：可定制的多模态安全模型

基于 Gemma 3 4B IT，128K 上下文，支持自然语言定义自定义策略。覆盖 12 种语言，零样本泛化至约 140 种语言，可在 8GB+ VRAM GPU 上实时部署。

📎 Hugging Face Blog

Google Magenta RealTime 2（MRT2）：开源实时音乐模型

通过 MIDI 键盘、实时文本提示甚至手势进行演奏。在 MacBook 上原生运行，延迟低于 200ms，开放权重且提供开源推理引擎。

📎 Google AI Developers @ X

产品发布/更新

Replit Agent 联手 Shopify 快速建店

从想法到上线商店只需几分钟：构建自定义店铺页面、创建 Shopify 商店、添加商品。

📎 Replit @ X

ChatGPT 推出 Dreaming 记忆系统

更强的记忆系统，更好地记住用户偏好，在跨对话场景中保持上下文的新鲜感。

Gemini macOS 双击 Command 附加活动窗口

双击 Command 键将当前活动窗口无缝附加到聊天中，无需手动截图或切换标签页。

📎 Gemini @ X

OpenAI API 新增内容审核评分

Moderation scores 现已在 Responses API 和 Completions API 中可用，在同一请求流程中返回审核信号。

📎 OpenAI Developers @ X

Stanford 发布 OpenJarvis：本地优先设备端 AI 智能体框架

完全在设备端运行推理、智能体、记忆与学习，与最佳云端模型性能差距在 3.2 分以内，边际 API 成本降低约 800 倍。

📎 MarkTechPost

Anthropic 开源 AI 驱动漏洞发现框架

NotebookLM 来源归属功能上线

可查看每个创作物背后的确切公式（提示词 + 来源），支持一键迭代调整。

📎 NotebookLM @ X

Codex 推出 iOS 应用构建插件

在应用内浏览器查看和测试 iOS 应用，无需离开 Codex 即可热重载编辑。

📎 OpenAI Developers @ X

行业动态

Cloudflare Radar：机器人流量首次超过人类，占比 57.5%

过去一周全球 HTML 网页请求中，57.5% 来自机器人，仅 42.5% 来自真人浏览器。互联网流量主体已从人类浏览网页转向机器间通信和机器人抓取。

📎 小互 @ X

联合国报告：2030 年 AI 数据中心水电消耗将翻倍

去年全球数据中心耗电 448 TWh（AI 占五分之一），耗水 4.5 万亿升。预计 2030 年耗电翻倍至 945 TWh（AI 占 40%），耗水增至 9.3 万亿升。

微软 AI 负责人：Anthropic 模型太贵，正自研更便宜替代品

DeepSeek 连续四周登顶 OpenRouter Token 份额榜

📎 OpenRouter

Nemotron Parakeet ASR 印尼语准确率达 97.7%

📎 NVIDIA @ X

论文研究

Google 发布被动心率监测系统 PHRM

利用智能手机前置摄像头在日常使用中通过人脸视频估算心率，MAPE 低于 10%，MAE 低于 5 bpm（对比可穿戴设备）。发布迄今最大规模公开智能手机视频数据集。

📎 Google Research Blog

NVIDIA 任务种子合成数据生成

100B token 续训练实验中，Task-Seeded SDG 使 MMLU-Pro 提升 1.8 分，GPQA 提升 11.1 分。

📎 Hugging Face Blog

NVIDIA PPISP：补偿光度变化提升 3D 重建

📎 NVIDIA AI @ X

技巧与观点

OpenAI：AI 递归自我改进迹象初现

OpenAI 官方写道"我们看到了当今系统中递归自我改进（RSI）的早期迹象：AI 开发本身正被 AI 加速。这预计将加剧竞争压力，并带来现有机构无法应对的治理挑战。"

Higgs Audio v3 TTS：支持 100 种语言的端到端语音合成

约 4B 参数，支持实时控制情感（20+ 种）、风格、韵律及音效，流式合成无需完整文本即可生成语音。

📎 LMSYS Blog

OpenRouter 翻遍 11 款 LLM 找最快决策模型

总花费 482 美元，30 轮实时决策"大逃杀"挑战。Claude 和 Grok 系列在决策速度与任务成功率上突出，多项高分模型实时调度能力未达预期。

📎 OpenRouter Announcements

Ethan Mollick：共存与协同智能的终结

📎 One Useful Thing

Alex Imas & Phil Trammell：AGI 后什么仍然稀缺？

机器人可快速复制增长，但人类独特技能（如芭蕾舞演员）数量保持不变。

📎 Dwarkesh Patel Blog

OpenAI 发布《智能时代的生物防御》行动计划

AI 热点日报 · 作者：钟懿 · 数据来源：AI HOT（aihot.virxact.com）