AI 热点日报 | 2026年5月29日

数据来源：AI HOT（aihot.virxact.com）

今日头条

Anthropic 完成 650 亿美元 H 轮融资，估值达 9650 亿美元

Anthropic 宣布完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资，投后估值达 9650 亿美元。公司表示 Claude 的企业部署持续增长，年化收入已突破 470 亿美元。此轮融资将用于推进 AI 安全与可解释性研究、扩展算力，并规模化产品与合作伙伴关系。Anthropic 近期已显著扩大计算容量，并宣布 Claude 已登陆 AWS、Google Cloud 和 Microsoft Azure 三大云平台。

📎 Anthropic Newsroom

DeepSeek 计划完成融资后立即申请科创板 IPO

独家消息：DeepSeek 计划在完成当前约 500 亿美元（3500 亿人民币）融资轮后，立即申请科创板（A股）IPO。该信息由参与本轮融资的一位大型基金经理证实。

📎 X.PIN @ X

模型发布/更新

Claude Opus 4.8 发布：编码、智能体技能与推理全面升级

Anthropic 发布 Claude Opus 4.8，作为 Opus 4.7 的升级版本，在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用，价格与前代相同。新功能包括：用户可控制任务投入程度、“动态工作流"特性（2.5 倍速模式价格降至以往三分之一）。在 Online-Mind2Web 测评中得分 84%，超越 Opus 4.7 和 GPT-5.5。诚实度与对齐表现也得到提升，代码错误漏检率降低了约 75%。

📎 Anthropic Newsroom

xAI Grok Build 0.1 通过 API 进入公开测试

xAI 的最新编码模型 Grok Build 0.1 已通过 xAI API 进入公开测试阶段，专为智能体编码任务训练，支持网页开发、调试和 MCP。推理速度超过 100 tokens/秒，定价为输入 $1/m tokens、输出 $2/m tokens。除编码外，也适用于通用智能体及工具调用场景，可通过 OpenRouter 和 Vercel AI Gateway 获取。

📎 xAI News

Nano Banana Pro 与 Nano Banana 2 正式发布

🍌 Nano Banana Pro（gemini-3-pro-image）和 Nano Banana 2（gemini-3.1-flash-image）现已正式发布，可通过 Gemini API 投入生产使用。

📎 Google AI for Developers @ X

商汤发布信息图生成模型升级版

商汤科技升级其信息图生成模型 SenseNova-U1-8B-MoT-Infographic，8B 参数在四个关键维度优化：文本准确性与可读性增强、布局一致性与合理性提升、图表与示意图质量提高、新增学术内容渲染支持。

📎 商汤 SenseTime @ X

产品发布/更新

Claude Code 引入"动态工作流”，可并行运行数十至数百个子智能体

Claude Code 推出"动态工作流"功能，使 Claude 能端到端处理复杂任务。通过动态编写脚本，在单个会话中并行运行数十到数百个子智能体来完成工作，并会在结果呈现前进行验证。适用于跨代码库的 bug 查找、大规模迁移等需要多角度分析的任务。现已在研究预览阶段可用，支持 CLI、桌面端、VS Code 扩展以及 API、Amazon Bedrock、Vertex AI 等平台。

📎 Claude Blog

Perplexity Computer 集成微软 Office 套件

Perplexity Computer 现已登陆 Microsoft Excel、Word、PowerPoint 和 Outlook。用户可在应用程序侧边栏直接使用 Computer 协调工作——起草文档、建模、制作演示文稿、处理电子邮件。

📎 Perplexity @ X

Mistral AI 发布 Search Toolkit 可组合搜索框架

Mistral AI 发布 Search Toolkit 公共预览版，用于构建 AI 应用生产级搜索管道的可组合框架。整合数据摄取、检索和评估工具于单一框架与共享接口，使团队能更专注于提升搜索质量。开源，可部署在云端、本地或边缘环境，支持企业搜索、RAG 等多种场景。

📎 Mistral AI News

Replit Canvas：智能体设计工具发布

Replit 发布 Canvas——专为构建精美网站、应用、营销资产而设计的智能体设计工具。

📎 Replit @ X

Google 推出 Google Pay & Wallet Developer MCP Server

Google 推出 Google Pay & Wallet Developer MCP Server，将 AI 开发助手和 IDE 安全连接到实时 API 与账户上下文。开发者无需离开开发环境，即可搜索官方文档、验证 Wallet pass 定义、检查集成状态及管理商户账户。

📎 Google Developers Blog

Sesame 发布 iOS 应用，由 Oculus 创始人创办的对话式 AI 初创公司

由 Oculus 创始人创办的 AI 初创公司 Sesame 发布 iOS 应用，将对话式 AI 智能体带给公众。应用提供更自然的来回交互体验，设计上区别于传统聊天机器人，旨在让用户感觉更像在和真人对话。

📎 TechCrunch

行业动态

Qwen3.7-Max 登顶 OpenRouter 热门大模型榜

Qwen3.7-Max 以 77.3B tokens 的使用量登顶 OpenRouter 热门大语言模型榜单。

📎 阿里云 @ X

OpenRouter 获得 1.13 亿美元 B 轮融资

AI 模型聚合平台 OpenRouter 宣布完成 1.13 亿美元 B 轮融资，由 CapitalG 领投，NVentures、ServiceNow Ventures 等多家机构参投，现有投资者 Andreessen Horowitz 与 Menlo Ventures 也参与了本轮。

📎 OpenRouter Announcements

阿尔特曼和阿莫代伊纷纷收回 AI 引发就业危机的预测

📎 Hacker News / Fortune

Apple 努力将庞大 Gemini 模型塞进 iPhone 以驱动新 Siri

Apple 正尝试将大型 Gemini 模型集成到 iPhone 以支持全新 Siri 功能。由于模型规模庞大，本地处理可能无法完全实现，云端组件很可能是必然选项。

📎 Ars Technica

OpenAI 发布前沿治理框架

OpenAI 发布"前沿治理框架"，阐述其 AI 安全、安全与风险管理实践如何与欧盟和加州新出台的法规要求对齐。

📎 OpenAI

论文研究

hexoai 开源 SIA 框架：AI 智能体实现递归自我改进

hexoai 开源的 SIA（自我改进 AI）框架展示了 AI 智能体不仅能优化外部工作流，还能通过任务反馈直接更新自身模型权重。论文报告显示，SIA 在 LawBench 基准上性能提升 56.6%，GPU kernels 运行耗时减少 91.9%，单细胞 RNA 去噪任务相比基线提升 502%。

📎 Rohan Paul @ X

SGLang 团队与 AMD 合作：MI355X GPU 推理成本比 NVIDIA B200 低 40%

SGLang 与 AMD 团队合作，使 AMD Instinct MI355X GPU 在运行 DeepSeek-R1 时实现极具竞争力的总拥有成本。在 129 tok/s/user 的交互延迟下，成本为每百万 token $0.169，比 NVIDIA B200（SGLang）方案低 40%。24 块 AMD GPU 达到 2,436 tok/s/GPU，每 GPU 吞吐量比使用 48 块 GPU 的 B200 SGLang 方案高 1.25 倍。

📎 LMSYS Blog

技巧与观点

华为何庭波：今年秋季新麒麟手机芯片性能"跳跃性"提升

华为何庭波提出半导体新演进路径"韬（τ）定律"，以"时间缩微"（如逻辑折叠）替代"几何缩微"作为新指导原则。过去 6 年华为已基于此自主研发 381 款芯片。今年秋季将发布首个完整"韬芯片"，性能、集成度相比去年是"跳跃性"提升。

📎 IT之家

英伟达 AI 框架 Polar 让 Codex 跑分暴涨 594.74%

英伟达研究团队开源智能体强化学习框架 Polar，无需重写现有智能体执行框架，通过在模型 API 边界放置智能体接入 GRPO 训练。基于 Qwen3.5-4B 模型，Polar 将 Codex 在 SWE-Bench Verified 上的 pass@1 分数从 3.8% 提升至 26.4%（增涨 594.74%）。其 prefix_merging 技术将训练步骤从 1185 次降至 218 次，GPU 平均利用率从 20.4% 升至 87.7%。

📎 IT之家

AI 智能体时代下的安全变革

Lemonade 的 CISO Jonathan Jaffe 指出，AI 对攻击者和防御者同样强大，但可被利用的漏洞窗口正在缩小。安全团队正向工程团队转型，每个智能体（单个终端上可能运行 200 到 10000 个）都需要被赋予身份，并在操作点由策略进行更复杂的管控——这已超越当前身份与访问管理系统的能力。

📎 Tomer Tunguz 博客

AI 热点日报 · 作者：钟懿 · 数据来源：AI HOT（aihot.virxact.com）

今日头条#

Anthropic 完成 650 亿美元 H 轮融资，估值达 9650 亿美元#

DeepSeek 计划完成融资后立即申请科创板 IPO#

模型发布/更新#

Claude Opus 4.8 发布：编码、智能体技能与推理全面升级#

xAI Grok Build 0.1 通过 API 进入公开测试#

Nano Banana Pro 与 Nano Banana 2 正式发布#

商汤发布信息图生成模型升级版#

产品发布/更新#

Claude Code 引入"动态工作流”，可并行运行数十至数百个子智能体#

Perplexity Computer 集成微软 Office 套件#

Mistral AI 发布 Search Toolkit 可组合搜索框架#

Replit Canvas：智能体设计工具发布#

Google 推出 Google Pay & Wallet Developer MCP Server#

Sesame 发布 iOS 应用，由 Oculus 创始人创办的对话式 AI 初创公司#

行业动态#

Qwen3.7-Max 登顶 OpenRouter 热门大模型榜#

OpenRouter 获得 1.13 亿美元 B 轮融资#

阿尔特曼和阿莫代伊纷纷收回 AI 引发就业危机的预测#

Apple 努力将庞大 Gemini 模型塞进 iPhone 以驱动新 Siri#

OpenAI 发布前沿治理框架#

论文研究#

hexoai 开源 SIA 框架：AI 智能体实现递归自我改进#

SGLang 团队与 AMD 合作：MI355X GPU 推理成本比 NVIDIA B200 低 40%#

技巧与观点#

华为何庭波：今年秋季新麒麟手机芯片性能"跳跃性"提升#

英伟达 AI 框架 Polar 让 Codex 跑分暴涨 594.74%#

pgvector 向量搜索系统构建指南：语义、混合、稀疏与量化#

OpenRouter 支持 Flex 与 Priority 服务层级#

四步保障 AI 生成应用安全#

AI 智能体时代下的安全变革#