AI 热点日报 | 2026年6月9日
数据来源:AI HOT(aihot.virxact.com)
今日头条
小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPU 节点运行 1T MoE
小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。6 月 8 日至 23 日开放申请。
苹果 WWDC 2026:发布第三代 AFM 模型与 Core AI 框架
苹果推出第三代 Apple Foundation Models(AFM),与 Google 合作定制,包含五个模型,覆盖从设备端到服务器端,驱动全新 Siri 和 Apple Intelligence 功能。同时发布 Core AI 框架和下一代 Apple Intelligence,将 AI 能力深度集成到 iPhone、iPad 和 Mac 中。受 DMA 影响,Siri AI 在欧盟将随 iOS 27 延迟上线。
📎 Apple ML Research · 📎 Apple Newsroom
模型发布/更新
VoxCPM2:面壁智能发布 2B 多语言语音生成模型
基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力,在公开 TTS 基准上达到 SOTA。模型权重、微调代码和推理工具以 Apache 2.0 开源。
全球首个:高德发布 3D 原生城市世界模型 ABot-Earth 0.5
已建成覆盖 190 多个国家和地区的 3D 地图。用户输入卫星图或文字描述,10 分钟即可在消费级 GPU 上生成公里级 3D 城市,输出可编辑 3DGS 格式,可直接导入 Unity 等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。
📎 IT之家
产品发布/更新
Runway Aleph 2.0 编辑模型:一键适配任意视频格式
上传现有视频,选择想要的宽高比,Aleph 2.0 自动填充场景的其余部分,就像一开始就这样制作的一样。已在桌面 Web 应用上线。
Kimi Code 焕新升级:一行命令安装,毫秒级启动
新增视频理解能力(支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码),集成同花顺、天眼查等权威数据源,支持 ACP 协议,可在 JetBrains、Zed 中使用,底层视觉推理由 Kimi K2.6 模型提供。
📎 月之暗面
微信 AI 官宣内测:两种接入模式供开发者选择
微信开发者官方发布指引,确认微信 AI 正在内测阶段。自动模式可授权平台读取小程序源码,无需额外开发即可让微信 AI 直接操作页面;开发模式下开发者可自主开发技能,审核后由微信 AI 调用。两种模式可同时开启。
📎 IT之家
Claude 为 Connector 开发者推出性能监控仪表盘
已发布 Connector 的所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因。基于 MCP 构建的 Connector 目录已有超 300 个第三方 Connector,每日被数百万人使用。
NotebookLM 重大升级:智能体能力与高级推理
支持对话中的智能体能力、更高级的推理以及一系列新的输出格式,处理复杂的多步骤研究问题从未如此简单。已面向 Google AI Ultra 订阅者推出。
ChatGPT 新增数据图表生成功能
将数据和比较直接转化为图表,已支持移动端和网页端。
行业动态
OpenAI 向 SEC 机密提交 S-1 草案,正式启动 IPO 进程
上市时间未定,但保密提交是 IPO 流程的关键一步。同日奥尔特曼宣布 OpenAI 进入第三发展阶段,目标让 AI 普及、易用且安全,三大核心目标:打造自动化 AI 研究员、推动经济提速、为每人配备专属 AGI。奥尔特曼计划到 2028 年由 AI 主导研究。
NVIDIA 与 LG 集团合作建设 AI 工厂,加速物理 AI 与自动驾驶
双方整合 NVIDIA AI 工厂平台与 LG 的消费电子、机器人技术,连接 AI 模型开发、物理 AI 数据生成、机器人仿真训练、边缘部署全链路。LG 电子将利用 NVIDIA Isaac Sim 仿真训练 CLOiD 家用机器人,LG CNS 集成 NVIDIA 机器人技术。
生数科技与华策影视达成战略合作,共建 AI 视听创制中心
双方以华策影视科技产教示范区为载体、Vidu 视频生成大模型为技术底座,设立"AI 视听创制中心",探索 AI 虚拟制作与实拍结合。同时在浙江华策影视学校设立 AI 影视创制专业。
📎 生数科技
英国借助 NVIDIA 技术将主权 AI 雄心转化为行动
AI 云提供商数量翻倍,基于 5,400 个 GH200 的 Isambard-AI 超级计算机全由零碳电力驱动。主权 AI 基金资助四家 NVIDIA Inception 初创公司,其中 Doubleword 实现 70 倍冷启动加速、4 倍 KV 缓存压缩,推理成本降低 90-95%。
OpenAI 推出 Economic Research Exchange 经济研究交流平台
启动经济研究交流平台,研究 AI 对就业、生产力和经济的影响,现开放研究项目申请。
📎 OpenAI
论文研究
Anthropic:为生物学 AI 智能体铺路
实验让 Claude、GPT 等科研智能体从 NCBI Virus 数据库中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需准确率。加入确定性检索层 gget virus 后准确率接近 100%。研究指出当前生物学数据基础设施碎片化,确定性检索工具是实现可靠智能体工作流的关键。
Perplexity 与哈佛:AI 智能体提效 87% 降本 94%
超过 3 个月的研究表明,使用 Perplexity Computer 的工人在完成任务上比仅使用搜索快 87%,成本低 94%,且满意度更高。
腾讯混元发布首个音频编辑基准 MMAE
联合上海交大、南洋理工等机构推出 MMAE,这是首个全面评估 AI 语音/音频编辑能力的基准。当前模型在该基准上的精确匹配率低于 5%,暴露了可靠音频编辑的短板。MMAE 包含 2000 个真实场景高保真样本、17741 条细粒度评估项,覆盖 7 种模态、6 种任务复杂度。
📎 腾讯混元 @ X
技巧与观点
微软 AI CEO:超级智能即将到来,但不会取代你的工作
Mustafa Suleyman 在 Decoder 访谈中表示超级智能不会导致大规模失业。透露微软与 OpenAI 去年 10 月签署新合同,微软获准独立追求超级智能,已组建超级智能团队、训练前沿模型,并在 Build 大会上发布 7 个全模态新模型。
小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕
只需说一句"把链接翻译成中文字幕视频"即可全自动完成:下载、Whisper 本地转写、AI 翻译润色、烧字幕、出文稿。转写本地运行不花 API 费。支持 YouTube、Bilibili、抖音及本地文件,字幕精确到词级时间戳,每行不超过 12 字,双语模式下中文大英文小。已开源。
📎 小互 @ X
Hivemind 推出面向 AI 编程智能体的持续学习功能
收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体。内置 SkillOpt 使技能持续训练:Claude Code 准确率提升 +19.1 分,Codex 提升 +24.8 分。开源,一行命令安装。
📎 Kim @ X
邵猛开源 Brand to DESIGN.md 技能,提醒复刻易生新"AI Slop"
开源 Brand to DESIGN.md Skill,让 Agent 学习设计品味后复刻网站。但他指出这种复刻缺少设计精髓,仅皮毛相仿,反而从 Anti-AI-slop 衍生出新的"AI Slop"。
📎 邵猛 @ X
Claude Code GA 一周年回顾:验证与自动模式
Anthropic 回顾 Claude Code 正式发布一年来的历程:验证最佳实践、为何构建自动模式、例程和循环,以及下一步计划。
OpenRouter Advisor:让小模型求助高级顾问模型
新服务器工具 Advisor 让较小的模型咨询一个更高智能的"顾问"模型,帮助它们逃出困境循环,并帮助开发者迁移到更便宜的模型。
AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)