AI 热点日报 | 2026年6月3日
数据来源:AI HOT(aihot.virxact.com)
今日头条
微软发布首款高级推理模型 MAI-Thinking-1
微软在 Build 2026 上发布首款自研高级推理 AI 模型 MAI-Thinking-1,定位"中等规模",在关键软件工程基准上达到领先模型水平。微软称其完全从头使用干净数据训练,未涉及从第三方模型知识蒸馏。这标志着微软在自研 AI 模型上的重大突破,此前其长期依赖 OpenAI,近期两家公司已重新协商合作协议。
Claude Code 新增动态工作流功能
Claude Code 推出动态工作流,允许模型在运行时即兴创建和协调多智能体框架处理复杂任务。通过执行特定 JS 文件生成拥有独立上下文的子代理,解决长时间执行中的智能惰性问题。适用于研究、安全分析、代码审查等场景。
模型发布/更新
Holo3.1:快速本地计算机使用智能体
基于 Qwen 的计算机使用智能体,提供 0.8B 到 35B-A3B 四种尺寸,首次发布 FP8、Q4 GGUF 和 NVFP4 量化检查点。在 AndroidWorld 基准上 35B-A3B 得分从 67% 提升至 79.3%,NVFP4 量化实现 1.74 倍 token 吞吐量提升。
阶跃星辰 Step 3.7 Flash 发布
196B MoE 架构,专注推理效率。采用多矩阵分解注意力机制,KV-cache 成本仅为 DeepSeek 模型的约 22%。Apache 2.0 许可,已通过 Fireworks AI 提供服务。
📎 阶跃星辰 @ X
产品发布/更新
Claude Platform 新增 CLI 工具
每个 API 端点均可从终端运行,支持调用 Messages API、启动 Claude 托管智能体并将结果管道传输到 shell。
OpenAI Codex 发布 Python SDK
可通过 pip install openai-codex 将 Codex 直接嵌入应用,复用 Codex 登录态,内置顶级编程和生图能力。
Google DeepMind 开源科学智能体工具包
Science Skills 已在 GitHub 开源,专为科学发现构建的自主智能体工具包。
微软开源 Adaptive Spec-driven Scoring 评估框架
开发者可通过文本描述快速生成 AI 行为测试,用于模型评估与回归测试。
Runway API 推出 Aleph 2.0 视频编辑
支持多镜头序列中编辑最长 30 秒、1080p 视频,仅修改指定部分。
GitHub Copilot 应用:智能体原生的桌面体验
微软 Build 2026 上发布,定位为"智能体原生的桌面体验",让 AI 以用户习惯的方式工作。
Replit 与微软发布 Fabric 集成
组织可在 Replit 中构建内部工具,直接发布到 Microsoft Fabric,内置安全与治理功能。
行业动态
Anthropic 扩展 Project Glasswing 计划
从约 50 个合作伙伴扩展至约 150 个新组织,覆盖电力、水务、医疗等关键基础设施行业。利用 Claude Mythos Preview 等前沿模型扫描漏洞协助修复,同时推出 Claude Security 产品线。
Nathan Lambert 离开 Ai2
主导 OLMO 和 Tulu 等开源模型项目的研究员 Nathan Lambert 宣布离职,结束 2.5 年工作,称其为"职业生涯巅峰",未来继续深耕开源模型。
SK 海力士计划五年内晶圆产能翻倍
会长崔泰源宣布,因 AI 数据中心和 AI PC 普及持续拉动存储需求,预计供需紧张延续至 2030 年。SK 海力士市值已首次突破 1 万亿美元。
📎 IT之家
Anthropic 支持美国 AI 行政令实施
OpenAI 呼吁全球领导力推进青年 AI 安全
📎 OpenAI
Travelers 借助 OpenAI 部署 AI 理赔助手
📎 OpenAI
论文研究
微软 Aurora 天气预报速度超传统超算数千倍
Anthropic 可解释性研究:区分因果效应相似的特征
提出 TWERA 方法,通过分析特征的下游连接预测实际影响,更准确识别模型内部因果组件。
📎 Anthropic Transformer Circuits
Codex 正成为每个人的生产力工具
OpenAI 报告指出 Codex 正通过 AI 增强研究、数据分析、工作流自动化与内容创作变革知识工作。
📎 OpenAI
技巧与观点
为了不花 120 刀,我把电脑清理软件做成了开源 Skill
作者用 Codex 分析 MacBook 存储,发现 B 站缓存等大量可清理空间(激进方案超 140G),制作开源跨平台 AI 清理 Skill。通过三色分级(绿/黄/红)展示,实测清理释放近 120G 空间。
📎 卡兹克 @ X
商汤开源 SenseNova-Skills AI 办公技能套件
涵盖图像信息图表生成、数据分析、PPT 创建和深度研究四大核心功能,面向 OpenClaw 与 HermesAgent 等智能体。
📎 商汤 @ X
Claude Code 团队实践:智能体编程如何重塑工程组织
核心变化包括规划转向即时模式、上下文收集"先问 Claude"、代码审查中 Claude 处理风格与测试、人工专注法律安全。
Gemini Spark:最令人印象深刻也最可怕的 AI 体验
开放模型的繁荣生态:69.1% 的 token 使用量来自开源
OpenRouter 数据显示开放模型产生 69.1% 的 token 使用量,闭源 30.9%。开放模型市场领导地位频繁更迭,竞争激烈。
Gary Marcus:为什么事情终将崩塌
Karpathy 分享学习方法论
AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)