AI 热点日报 | 2026年6月3日

数据来源:AI HOT(aihot.virxact.com)


今日头条

微软发布首款高级推理模型 MAI-Thinking-1

微软在 Build 2026 上发布首款自研高级推理 AI 模型 MAI-Thinking-1,定位"中等规模",在关键软件工程基准上达到领先模型水平。微软称其完全从头使用干净数据训练,未涉及从第三方模型知识蒸馏。这标志着微软在自研 AI 模型上的重大突破,此前其长期依赖 OpenAI,近期两家公司已重新协商合作协议。

📎 The Verge

Claude Code 新增动态工作流功能

Claude Code 推出动态工作流,允许模型在运行时即兴创建和协调多智能体框架处理复杂任务。通过执行特定 JS 文件生成拥有独立上下文的子代理,解决长时间执行中的智能惰性问题。适用于研究、安全分析、代码审查等场景。

📎 Claude Blog


模型发布/更新

Holo3.1:快速本地计算机使用智能体

基于 Qwen 的计算机使用智能体,提供 0.8B 到 35B-A3B 四种尺寸,首次发布 FP8、Q4 GGUF 和 NVFP4 量化检查点。在 AndroidWorld 基准上 35B-A3B 得分从 67% 提升至 79.3%,NVFP4 量化实现 1.74 倍 token 吞吐量提升。

📎 Hugging Face Blog

阶跃星辰 Step 3.7 Flash 发布

196B MoE 架构,专注推理效率。采用多矩阵分解注意力机制,KV-cache 成本仅为 DeepSeek 模型的约 22%。Apache 2.0 许可,已通过 Fireworks AI 提供服务。

📎 阶跃星辰 @ X


产品发布/更新

Claude Platform 新增 CLI 工具

每个 API 端点均可从终端运行,支持调用 Messages API、启动 Claude 托管智能体并将结果管道传输到 shell。

📎 Claude Devs @ X

OpenAI Codex 发布 Python SDK

可通过 pip install openai-codex 将 Codex 直接嵌入应用,复用 Codex 登录态,内置顶级编程和生图能力。

📎 Vista @ X

Google DeepMind 开源科学智能体工具包

Science Skills 已在 GitHub 开源,专为科学发现构建的自主智能体工具包。

📎 Google AI Developers @ X

微软开源 Adaptive Spec-driven Scoring 评估框架

开发者可通过文本描述快速生成 AI 行为测试,用于模型评估与回归测试。

📎 TechCrunch

Runway API 推出 Aleph 2.0 视频编辑

支持多镜头序列中编辑最长 30 秒、1080p 视频,仅修改指定部分。

📎 Runway @ X

GitHub Copilot 应用:智能体原生的桌面体验

微软 Build 2026 上发布,定位为"智能体原生的桌面体验",让 AI 以用户习惯的方式工作。

📎 GitHub Blog

Replit 与微软发布 Fabric 集成

组织可在 Replit 中构建内部工具,直接发布到 Microsoft Fabric,内置安全与治理功能。

📎 Replit @ X


行业动态

Anthropic 扩展 Project Glasswing 计划

从约 50 个合作伙伴扩展至约 150 个新组织,覆盖电力、水务、医疗等关键基础设施行业。利用 Claude Mythos Preview 等前沿模型扫描漏洞协助修复,同时推出 Claude Security 产品线。

📎 Anthropic Newsroom

Nathan Lambert 离开 Ai2

主导 OLMO 和 Tulu 等开源模型项目的研究员 Nathan Lambert 宣布离职,结束 2.5 年工作,称其为"职业生涯巅峰",未来继续深耕开源模型。

📎 Nathan Lambert @ X

SK 海力士计划五年内晶圆产能翻倍

会长崔泰源宣布,因 AI 数据中心和 AI PC 普及持续拉动存储需求,预计供需紧张延续至 2030 年。SK 海力士市值已首次突破 1 万亿美元。

📎 IT之家

Anthropic 支持美国 AI 行政令实施

📎 Anthropic @ X

OpenAI 呼吁全球领导力推进青年 AI 安全

📎 OpenAI

Travelers 借助 OpenAI 部署 AI 理赔助手

📎 OpenAI


论文研究

微软 Aurora 天气预报速度超传统超算数千倍

📎 Microsoft Research @ X

Anthropic 可解释性研究:区分因果效应相似的特征

提出 TWERA 方法,通过分析特征的下游连接预测实际影响,更准确识别模型内部因果组件。

📎 Anthropic Transformer Circuits

Codex 正成为每个人的生产力工具

OpenAI 报告指出 Codex 正通过 AI 增强研究、数据分析、工作流自动化与内容创作变革知识工作。

📎 OpenAI


技巧与观点

为了不花 120 刀,我把电脑清理软件做成了开源 Skill

作者用 Codex 分析 MacBook 存储,发现 B 站缓存等大量可清理空间(激进方案超 140G),制作开源跨平台 AI 清理 Skill。通过三色分级(绿/黄/红)展示,实测清理释放近 120G 空间。

📎 卡兹克 @ X

商汤开源 SenseNova-Skills AI 办公技能套件

涵盖图像信息图表生成、数据分析、PPT 创建和深度研究四大核心功能,面向 OpenClaw 与 HermesAgent 等智能体。

📎 商汤 @ X

Claude Code 团队实践:智能体编程如何重塑工程组织

核心变化包括规划转向即时模式、上下文收集"先问 Claude"、代码审查中 Claude 处理风格与测试、人工专注法律安全。

📎 Claude Blog

Gemini Spark:最令人印象深刻也最可怕的 AI 体验

📎 The Verge

开放模型的繁荣生态:69.1% 的 token 使用量来自开源

OpenRouter 数据显示开放模型产生 69.1% 的 token 使用量,闭源 30.9%。开放模型市场领导地位频繁更迭,竞争激烈。

📎 Tomer Tunguz Blog

Gary Marcus:为什么事情终将崩塌

📎 Gary Marcus Substack

Karpathy 分享学习方法论

📎 Rohan Paul @ X


AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)