AI 热点日报 | 2026年5月29日

数据来源:AI HOT(aihot.virxact.com)


今日头条

Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元

Anthropic 宣布完成由 Altimeter Capital 等领投的 650 亿美元 H 轮融资,投后估值达 9650 亿美元。公司表示 Claude 的企业部署持续增长,年化收入已突破 470 亿美元。此轮融资将用于推进 AI 安全与可解释性研究、扩展算力,并规模化产品与合作伙伴关系。Anthropic 近期已显著扩大计算容量,并宣布 Claude 已登陆 AWS、Google Cloud 和 Microsoft Azure 三大云平台。

📎 Anthropic Newsroom

DeepSeek 计划完成融资后立即申请科创板 IPO

独家消息:DeepSeek 计划在完成当前约 500 亿美元(3500 亿人民币)融资轮后,立即申请科创板(A股)IPO。该信息由参与本轮融资的一位大型基金经理证实。

📎 X.PIN @ X


模型发布/更新

Claude Opus 4.8 发布:编码、智能体技能与推理全面升级

Anthropic 发布 Claude Opus 4.8,作为 Opus 4.7 的升级版本,在编码、智能体技能、推理和实用知识工作等各项基准测试中均取得进步。Claude Opus 4.8 现已可用,价格与前代相同。新功能包括:用户可控制任务投入程度、“动态工作流"特性(2.5 倍速模式价格降至以往三分之一)。在 Online-Mind2Web 测评中得分 84%,超越 Opus 4.7 和 GPT-5.5。诚实度与对齐表现也得到提升,代码错误漏检率降低了约 75%。

📎 Anthropic Newsroom

xAI Grok Build 0.1 通过 API 进入公开测试

xAI 的最新编码模型 Grok Build 0.1 已通过 xAI API 进入公开测试阶段,专为智能体编码任务训练,支持网页开发、调试和 MCP。推理速度超过 100 tokens/秒,定价为输入 $1/m tokens、输出 $2/m tokens。除编码外,也适用于通用智能体及工具调用场景,可通过 OpenRouter 和 Vercel AI Gateway 获取。

📎 xAI News

Nano Banana Pro 与 Nano Banana 2 正式发布

🍌 Nano Banana Pro(gemini-3-pro-image)和 Nano Banana 2(gemini-3.1-flash-image)现已正式发布,可通过 Gemini API 投入生产使用。

📎 Google AI for Developers @ X

商汤发布信息图生成模型升级版

商汤科技升级其信息图生成模型 SenseNova-U1-8B-MoT-Infographic,8B 参数在四个关键维度优化:文本准确性与可读性增强、布局一致性与合理性提升、图表与示意图质量提高、新增学术内容渲染支持。

📎 商汤 SenseTime @ X


产品发布/更新

Claude Code 引入"动态工作流”,可并行运行数十至数百个子智能体

Claude Code 推出"动态工作流"功能,使 Claude 能端到端处理复杂任务。通过动态编写脚本,在单个会话中并行运行数十到数百个子智能体来完成工作,并会在结果呈现前进行验证。适用于跨代码库的 bug 查找、大规模迁移等需要多角度分析的任务。现已在研究预览阶段可用,支持 CLI、桌面端、VS Code 扩展以及 API、Amazon Bedrock、Vertex AI 等平台。

📎 Claude Blog

Perplexity Computer 集成微软 Office 套件

Perplexity Computer 现已登陆 Microsoft Excel、Word、PowerPoint 和 Outlook。用户可在应用程序侧边栏直接使用 Computer 协调工作——起草文档、建模、制作演示文稿、处理电子邮件。

📎 Perplexity @ X

Mistral AI 发布 Search Toolkit 可组合搜索框架

Mistral AI 发布 Search Toolkit 公共预览版,用于构建 AI 应用生产级搜索管道的可组合框架。整合数据摄取、检索和评估工具于单一框架与共享接口,使团队能更专注于提升搜索质量。开源,可部署在云端、本地或边缘环境,支持企业搜索、RAG 等多种场景。

📎 Mistral AI News

Replit Canvas:智能体设计工具发布

Replit 发布 Canvas——专为构建精美网站、应用、营销资产而设计的智能体设计工具。

📎 Replit @ X

Google 推出 Google Pay & Wallet Developer MCP Server

Google 推出 Google Pay & Wallet Developer MCP Server,将 AI 开发助手和 IDE 安全连接到实时 API 与账户上下文。开发者无需离开开发环境,即可搜索官方文档、验证 Wallet pass 定义、检查集成状态及管理商户账户。

📎 Google Developers Blog

Sesame 发布 iOS 应用,由 Oculus 创始人创办的对话式 AI 初创公司

由 Oculus 创始人创办的 AI 初创公司 Sesame 发布 iOS 应用,将对话式 AI 智能体带给公众。应用提供更自然的来回交互体验,设计上区别于传统聊天机器人,旨在让用户感觉更像在和真人对话。

📎 TechCrunch


行业动态

Qwen3.7-Max 登顶 OpenRouter 热门大模型榜

Qwen3.7-Max 以 77.3B tokens 的使用量登顶 OpenRouter 热门大语言模型榜单。

📎 阿里云 @ X

OpenRouter 获得 1.13 亿美元 B 轮融资

AI 模型聚合平台 OpenRouter 宣布完成 1.13 亿美元 B 轮融资,由 CapitalG 领投,NVentures、ServiceNow Ventures 等多家机构参投,现有投资者 Andreessen Horowitz 与 Menlo Ventures 也参与了本轮。

📎 OpenRouter Announcements

阿尔特曼和阿莫代伊纷纷收回 AI 引发就业危机的预测

📎 Hacker News / Fortune

Apple 努力将庞大 Gemini 模型塞进 iPhone 以驱动新 Siri

Apple 正尝试将大型 Gemini 模型集成到 iPhone 以支持全新 Siri 功能。由于模型规模庞大,本地处理可能无法完全实现,云端组件很可能是必然选项。

📎 Ars Technica

OpenAI 发布前沿治理框架

OpenAI 发布"前沿治理框架",阐述其 AI 安全、安全与风险管理实践如何与欧盟和加州新出台的法规要求对齐。

📎 OpenAI


论文研究

hexoai 开源 SIA 框架:AI 智能体实现递归自我改进

hexoai 开源的 SIA(自我改进 AI)框架展示了 AI 智能体不仅能优化外部工作流,还能通过任务反馈直接更新自身模型权重。论文报告显示,SIA 在 LawBench 基准上性能提升 56.6%,GPU kernels 运行耗时减少 91.9%,单细胞 RNA 去噪任务相比基线提升 502%。

📎 Rohan Paul @ X

SGLang 团队与 AMD 合作:MI355X GPU 推理成本比 NVIDIA B200 低 40%

SGLang 与 AMD 团队合作,使 AMD Instinct MI355X GPU 在运行 DeepSeek-R1 时实现极具竞争力的总拥有成本。在 129 tok/s/user 的交互延迟下,成本为每百万 token $0.169,比 NVIDIA B200(SGLang)方案低 40%。24 块 AMD GPU 达到 2,436 tok/s/GPU,每 GPU 吞吐量比使用 48 块 GPU 的 B200 SGLang 方案高 1.25 倍。

📎 LMSYS Blog


技巧与观点

华为何庭波:今年秋季新麒麟手机芯片性能"跳跃性"提升

华为何庭波提出半导体新演进路径"韬(τ)定律",以"时间缩微"(如逻辑折叠)替代"几何缩微"作为新指导原则。过去 6 年华为已基于此自主研发 381 款芯片。今年秋季将发布首个完整"韬芯片",性能、集成度相比去年是"跳跃性"提升。

📎 IT之家

英伟达 AI 框架 Polar 让 Codex 跑分暴涨 594.74%

英伟达研究团队开源智能体强化学习框架 Polar,无需重写现有智能体执行框架,通过在模型 API 边界放置智能体接入 GRPO 训练。基于 Qwen3.5-4B 模型,Polar 将 Codex 在 SWE-Bench Verified 上的 pass@1 分数从 3.8% 提升至 26.4%(增涨 594.74%)。其 prefix_merging 技术将训练步骤从 1185 次降至 218 次,GPU 平均利用率从 20.4% 升至 87.7%。

📎 IT之家

pgvector 向量搜索系统构建指南:语义、混合、稀疏与量化

📎 MarkTechPost

OpenRouter 支持 Flex 与 Priority 服务层级

📎 OpenRouter @ X

四步保障 AI 生成应用安全

📎 Replit @ X

AI 智能体时代下的安全变革

Lemonade 的 CISO Jonathan Jaffe 指出,AI 对攻击者和防御者同样强大,但可被利用的漏洞窗口正在缩小。安全团队正向工程团队转型,每个智能体(单个终端上可能运行 200 到 10000 个)都需要被赋予身份,并在操作点由策略进行更复杂的管控——这已超越当前身份与访问管理系统的能力。

📎 Tomer Tunguz 博客


AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)