AI 热点日报 | 2026年6月5日
数据来源:AI HOT(aihot.virxact.com)
今日头条
Nex-N2-Pro 发布:397B MoE 推理模型,性能达 GPT-5.5 水平
neolab 推出 Nex-N2-Pro,基于 Qwen3.5-397B-A17B 的 397B MoE 推理模型,支持 262K 上下文与多模态。可自动调节推理深度,减少 30-50% 思考 token 且无性能折损,在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得 SOTA。硅基流动提供 T+0 支持,前两周免费。
📎 硅基流动 @ X
台积电坦言产能跟不上 AI 需求
全球最大芯片制造商台积电表示,通过美国本土生产满足客户需求可能需要"非常长的时间",凸显 AI 需求带来的巨大产能压力。
模型发布/更新
NVIDIA Nemotron 3 Ultra 发布:为长时间运行智能体优化
专为多轮对话中保持上下文、调用工具和子智能体的长期运行 AI 智能体设计,显著提升推理速度并降低计算成本。
Nemotron 3.5 Content Safety:可定制的多模态安全模型
基于 Gemma 3 4B IT,128K 上下文,支持自然语言定义自定义策略。覆盖 12 种语言,零样本泛化至约 140 种语言,可在 8GB+ VRAM GPU 上实时部署。
Google Magenta RealTime 2(MRT2):开源实时音乐模型
通过 MIDI 键盘、实时文本提示甚至手势进行演奏。在 MacBook 上原生运行,延迟低于 200ms,开放权重且提供开源推理引擎。
产品发布/更新
Replit Agent 联手 Shopify 快速建店
从想法到上线商店只需几分钟:构建自定义店铺页面、创建 Shopify 商店、添加商品。
ChatGPT 推出 Dreaming 记忆系统
更强的记忆系统,更好地记住用户偏好,在跨对话场景中保持上下文的新鲜感。
📎 OpenAI
Gemini macOS 双击 Command 附加活动窗口
双击 Command 键将当前活动窗口无缝附加到聊天中,无需手动截图或切换标签页。
OpenAI API 新增内容审核评分
Moderation scores 现已在 Responses API 和 Completions API 中可用,在同一请求流程中返回审核信号。
Stanford 发布 OpenJarvis:本地优先设备端 AI 智能体框架
完全在设备端运行推理、智能体、记忆与学习,与最佳云端模型性能差距在 3.2 分以内,边际 API 成本降低约 800 倍。
Anthropic 开源 AI 驱动漏洞发现框架
📎 GitHub
NotebookLM 来源归属功能上线
可查看每个创作物背后的确切公式(提示词 + 来源),支持一键迭代调整。
Codex 推出 iOS 应用构建插件
在应用内浏览器查看和测试 iOS 应用,无需离开 Codex 即可热重载编辑。
行业动态
Cloudflare Radar:机器人流量首次超过人类,占比 57.5%
过去一周全球 HTML 网页请求中,57.5% 来自机器人,仅 42.5% 来自真人浏览器。互联网流量主体已从人类浏览网页转向机器间通信和机器人抓取。
📎 小互 @ X
联合国报告:2030 年 AI 数据中心水电消耗将翻倍
去年全球数据中心耗电 448 TWh(AI 占五分之一),耗水 4.5 万亿升。预计 2030 年耗电翻倍至 945 TWh(AI 占 40%),耗水增至 9.3 万亿升。
📎 IT之家
微软 AI 负责人:Anthropic 模型太贵,正自研更便宜替代品
DeepSeek 连续四周登顶 OpenRouter Token 份额榜
Nemotron Parakeet ASR 印尼语准确率达 97.7%
论文研究
Google 发布被动心率监测系统 PHRM
利用智能手机前置摄像头在日常使用中通过人脸视频估算心率,MAPE 低于 10%,MAE 低于 5 bpm(对比可穿戴设备)。发布迄今最大规模公开智能手机视频数据集。
NVIDIA 任务种子合成数据生成
100B token 续训练实验中,Task-Seeded SDG 使 MMLU-Pro 提升 1.8 分,GPQA 提升 11.1 分。
NVIDIA PPISP:补偿光度变化提升 3D 重建
技巧与观点
OpenAI:AI 递归自我改进迹象初现
OpenAI 官方写道"我们看到了当今系统中递归自我改进(RSI)的早期迹象:AI 开发本身正被 AI 加速。这预计将加剧竞争压力,并带来现有机构无法应对的治理挑战。"
📎 Kim @ X
Higgs Audio v3 TTS:支持 100 种语言的端到端语音合成
约 4B 参数,支持实时控制情感(20+ 种)、风格、韵律及音效,流式合成无需完整文本即可生成语音。
OpenRouter 翻遍 11 款 LLM 找最快决策模型
总花费 482 美元,30 轮实时决策"大逃杀"挑战。Claude 和 Grok 系列在决策速度与任务成功率上突出,多项高分模型实时调度能力未达预期。
Ethan Mollick:共存与协同智能的终结
Alex Imas & Phil Trammell:AGI 后什么仍然稀缺?
机器人可快速复制增长,但人类独特技能(如芭蕾舞演员)数量保持不变。
OpenAI 发布《智能时代的生物防御》行动计划
📎 OpenAI
AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)