AI 热点日报 | 2026年6月9日

数据来源:AI HOT(aihot.virxact.com)


今日头条

小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPU 节点运行 1T MoE

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。6 月 8 日至 23 日开放申请。

📎 小米 MiMo @ X

苹果 WWDC 2026:发布第三代 AFM 模型与 Core AI 框架

苹果推出第三代 Apple Foundation Models(AFM),与 Google 合作定制,包含五个模型,覆盖从设备端到服务器端,驱动全新 Siri 和 Apple Intelligence 功能。同时发布 Core AI 框架和下一代 Apple Intelligence,将 AI 能力深度集成到 iPhone、iPad 和 Mac 中。受 DMA 影响,Siri AI 在欧盟将随 iOS 27 延迟上线。

📎 Apple ML Research · 📎 Apple Newsroom


模型发布/更新

VoxCPM2:面壁智能发布 2B 多语言语音生成模型

基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力,在公开 TTS 基准上达到 SOTA。模型权重、微调代码和推理工具以 Apache 2.0 开源。

📎 面壁智能 OpenBMB @ X

全球首个:高德发布 3D 原生城市世界模型 ABot-Earth 0.5

已建成覆盖 190 多个国家和地区的 3D 地图。用户输入卫星图或文字描述,10 分钟即可在消费级 GPU 上生成公里级 3D 城市,输出可编辑 3DGS 格式,可直接导入 Unity 等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。

📎 IT之家


产品发布/更新

Runway Aleph 2.0 编辑模型:一键适配任意视频格式

上传现有视频,选择想要的宽高比,Aleph 2.0 自动填充场景的其余部分,就像一开始就这样制作的一样。已在桌面 Web 应用上线。

📎 Runway @ X

Kimi Code 焕新升级:一行命令安装,毫秒级启动

新增视频理解能力(支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码),集成同花顺、天眼查等权威数据源,支持 ACP 协议,可在 JetBrains、Zed 中使用,底层视觉推理由 Kimi K2.6 模型提供。

📎 月之暗面

微信 AI 官宣内测:两种接入模式供开发者选择

微信开发者官方发布指引,确认微信 AI 正在内测阶段。自动模式可授权平台读取小程序源码,无需额外开发即可让微信 AI 直接操作页面;开发模式下开发者可自主开发技能,审核后由微信 AI 调用。两种模式可同时开启。

📎 IT之家

Claude 为 Connector 开发者推出性能监控仪表盘

已发布 Connector 的所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因。基于 MCP 构建的 Connector 目录已有超 300 个第三方 Connector,每日被数百万人使用。

📎 Claude Blog

NotebookLM 重大升级:智能体能力与高级推理

支持对话中的智能体能力、更高级的推理以及一系列新的输出格式,处理复杂的多步骤研究问题从未如此简单。已面向 Google AI Ultra 订阅者推出。

📎 NotebookLM @ X

ChatGPT 新增数据图表生成功能

将数据和比较直接转化为图表,已支持移动端和网页端。

📎 ChatGPT @ X


行业动态

OpenAI 向 SEC 机密提交 S-1 草案,正式启动 IPO 进程

上市时间未定,但保密提交是 IPO 流程的关键一步。同日奥尔特曼宣布 OpenAI 进入第三发展阶段,目标让 AI 普及、易用且安全,三大核心目标:打造自动化 AI 研究员、推动经济提速、为每人配备专属 AGI。奥尔特曼计划到 2028 年由 AI 主导研究。

📎 OpenAI · 📎 IT之家

NVIDIA 与 LG 集团合作建设 AI 工厂,加速物理 AI 与自动驾驶

双方整合 NVIDIA AI 工厂平台与 LG 的消费电子、机器人技术,连接 AI 模型开发、物理 AI 数据生成、机器人仿真训练、边缘部署全链路。LG 电子将利用 NVIDIA Isaac Sim 仿真训练 CLOiD 家用机器人,LG CNS 集成 NVIDIA 机器人技术。

📎 NVIDIA AI Blog

生数科技与华策影视达成战略合作,共建 AI 视听创制中心

双方以华策影视科技产教示范区为载体、Vidu 视频生成大模型为技术底座,设立"AI 视听创制中心",探索 AI 虚拟制作与实拍结合。同时在浙江华策影视学校设立 AI 影视创制专业。

📎 生数科技

英国借助 NVIDIA 技术将主权 AI 雄心转化为行动

AI 云提供商数量翻倍,基于 5,400 个 GH200 的 Isambard-AI 超级计算机全由零碳电力驱动。主权 AI 基金资助四家 NVIDIA Inception 初创公司,其中 Doubleword 实现 70 倍冷启动加速、4 倍 KV 缓存压缩,推理成本降低 90-95%。

📎 NVIDIA AI Blog

OpenAI 推出 Economic Research Exchange 经济研究交流平台

启动经济研究交流平台,研究 AI 对就业、生产力和经济的影响,现开放研究项目申请。

📎 OpenAI


论文研究

Anthropic:为生物学 AI 智能体铺路

实验让 Claude、GPT 等科研智能体从 NCBI Virus 数据库中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需准确率。加入确定性检索层 gget virus 后准确率接近 100%。研究指出当前生物学数据基础设施碎片化,确定性检索工具是实现可靠智能体工作流的关键。

📎 Anthropic Research

Perplexity 与哈佛:AI 智能体提效 87% 降本 94%

超过 3 个月的研究表明,使用 Perplexity Computer 的工人在完成任务上比仅使用搜索快 87%,成本低 94%,且满意度更高。

📎 Perplexity @ X

腾讯混元发布首个音频编辑基准 MMAE

联合上海交大、南洋理工等机构推出 MMAE,这是首个全面评估 AI 语音/音频编辑能力的基准。当前模型在该基准上的精确匹配率低于 5%,暴露了可靠音频编辑的短板。MMAE 包含 2000 个真实场景高保真样本、17741 条细粒度评估项,覆盖 7 种模态、6 种任务复杂度。

📎 腾讯混元 @ X


技巧与观点

微软 AI CEO:超级智能即将到来,但不会取代你的工作

Mustafa Suleyman 在 Decoder 访谈中表示超级智能不会导致大规模失业。透露微软与 OpenAI 去年 10 月签署新合同,微软获准独立追求超级智能,已组建超级智能团队、训练前沿模型,并在 Build 大会上发布 7 个全模态新模型。

📎 The Verge

小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕

只需说一句"把链接翻译成中文字幕视频"即可全自动完成:下载、Whisper 本地转写、AI 翻译润色、烧字幕、出文稿。转写本地运行不花 API 费。支持 YouTube、Bilibili、抖音及本地文件,字幕精确到词级时间戳,每行不超过 12 字,双语模式下中文大英文小。已开源。

📎 小互 @ X

Hivemind 推出面向 AI 编程智能体的持续学习功能

收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体。内置 SkillOpt 使技能持续训练:Claude Code 准确率提升 +19.1 分,Codex 提升 +24.8 分。开源,一行命令安装。

📎 Kim @ X

邵猛开源 Brand to DESIGN.md 技能,提醒复刻易生新"AI Slop"

开源 Brand to DESIGN.md Skill,让 Agent 学习设计品味后复刻网站。但他指出这种复刻缺少设计精髓,仅皮毛相仿,反而从 Anti-AI-slop 衍生出新的"AI Slop"。

📎 邵猛 @ X

Claude Code GA 一周年回顾:验证与自动模式

Anthropic 回顾 Claude Code 正式发布一年来的历程:验证最佳实践、为何构建自动模式、例程和循环,以及下一步计划。

📎 Claude Devs @ X

OpenRouter Advisor:让小模型求助高级顾问模型

新服务器工具 Advisor 让较小的模型咨询一个更高智能的"顾问"模型,帮助它们逃出困境循环,并帮助开发者迁移到更便宜的模型。

📎 OpenRouter @ X


AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)