AI 热点日报 | 2026年5月30日
数据来源:AI HOT(aihot.virxact.com)
今日头条
阶跃星辰发布 Step 3.7 Flash,开源大模型聚焦智能体效率
阶跃星辰发布开源大模型 Step 3.7 Flash,主打智能体工作流效率。在 ClawEval-1.1(67.1分)和 SimpleVQA Search(79.2分)评测中排名第一。架构为 198B 参数 MoE,约 11B 活跃参数,支持 256K 上下文,具备多模态理解能力,可处理图像、文档并生成代码或调用工具执行任务。工具使用可靠性 τ²-bench 得分超过 98%,兼容 Claude Code、MCP 协议等工具链,支持在 Mac Studio M4 Max 等设备本地运行。模型权重以 Apache 2.0 许可开源。
OpenAI 推出实时翻译模型,支持 70+ 语言输入
OpenAI 发布实时翻译模型 gpt-realtime-translate,支持任意语言的语音输入,翻译成 13 种输出语言。该模型为专用模型,针对实时翻译场景优化。OpenAI 正在智能眼镜上运行此功能。
模型发布/更新
小米开源 ControlFoley 可控视频音效生成模型
小米大模型应用团队发布开源可控视频音效生成模型 ControlFoley,解决创作中的可控性难题。支持三类任务:文本引导视频配音、文本控制视频配音、参考音频控制视频配音。在 VGGSound-Test 等多个 benchmark 上取得开源 SOTA 表现,代码、模型权重和在线 Demo 均已开放。
📎 IT之家
Qwen-VLA:从理解世界到在其中行动
产品发布/更新
Codex 可自主管理对话线程与并行任务
Codex 现在可以创建对话线程、搜索它们、整理它们、固定重要线程,并为并行任务启动工作树。帮助用户自动化管理大量 Codex 对话。
Codex Windows 版现已支持计算机使用功能
Windows 用户现可在 Codex 上使用计算机使用功能,让 Codex 直接在 Windows 电脑上执行操作。通过 ChatGPT 移动应用,可在工作继续进行时随时随地启动、审查和引导任务。
Gemini Omni 可将草图变为现实
Gemini Omni 能将简单草图变为新现实。用户可在 Gemini 应用中上传有人画圆的视频,输入提示词"当我画完这个圆时,它变成了___“即可体验。
ChatGPT 对话目录功能上线
适用于包含 5 条以上回复的对话,帮助用户轻松管理和查找冗长的 ChatGPT 对话。
Gemini 本月更新:全新界面与智能体助手
从全新设计的 Gemini 界面,到 Gemini Spark 提供的全天候智能体辅助,本月更新涵盖全新 UI 和 AI 助手功能。
Runway API 持续扩展模型与端点支持
新增 Seedance 2.0、GPT Image 2、HappyHorse 1.0、Nano Banana Pro、Magnific Precision Upscaler V2 等模型接入。
OpenRouter 支持模型生成文件补丁
OpenRouter 现支持 “apply_patch” 服务器工具,允许任何模型通过 Responses API 使用 V4A diffs 提出文件编辑建议,模型生成补丁后在服务器端验证 diff 语法。
Guardrails:保护智能体、数据与成本
OpenRouter 发布 Guardrails,一套可配置的安全与治理工具,提供预算执行、零数据保留、模型与提供商限制、提示词注入防御及数据丢失预防等功能。
行业动态
中央网信办等四部门:提升全民人工智能素养,加快人才培育
中央网信办等四部门联合印发《2026年提升全民数字素养与技能工作要点》,部署六项重点任务,明确要求"提升全民人工智能素养”,涵盖强化人工智能赋能教育、加快人才培育、深化普及应用等方面。
📎 IT之家
波士顿儿童医院利用 AI 解锁新诊断
波士顿儿童医院通过部署 OpenAI 技术,成功帮助诊断超过 40 种罕见病病例,用于改善患者护理并减轻运营负担。
📎 OpenAI
滑铁卢大学未来实验室展示 AI 原型
滑铁卢大学未来实验室学生开发了用于重塑教育和工作未来的 AI 原型,包括手语辅导工具等。
论文研究
GPIC:大规模视觉生成基准数据集发布
Fei-Fei Li(World Labs)发布适用于大规模生成模型新时代的视觉生成基准数据集 GPIC,引发学界关注。
技巧与观点
Kog 团队实现 3,000 tokens/s 超高推理速度
Kog 团队在标准数据中心 GPU 上实现极高单用户推理速度:8× AMD MI300X 上达 3,000 tokens/s,8× NVIDIA H200 上达 2,100 tokens/s。相比常规推理速度(100-300 tokens/s)提升 10-30 倍。核心思路是将 LLM 解码视为内存流问题,通过协同设计 monokernel、重建同步机制、针对性内存访问映射及 Laneformer 模型架构消除阻塞点。
Adam’s Law:高频词写 Prompt 效果更好
FaceMind 团队用 100 种语言和四大核心任务实验发现,使用预训练语料中出现频率更高的词汇(高频表达)撰写提示词或进行微调,可显著提升大语言模型表现。这被总结为 Adam’s Law(文本频率定律)。原理在于高频表达让模型在最熟悉的概率空间内工作,从而优化输出质量。
Cursor 团队发布《开发者习惯报告》:AI 推动开发向更大规模演进
报告显示:开发者周均代码产出从约 3.6K 行增至 8.6K 行;AI 智能体单次会话工具调用数增加约 30%;被接受的 AI 代码 60 分钟后留存率从约 76% 提升至约 81%。AI 已从个人辅助工具演进为推动开发向更大规模任务与自动化基础设施发展的核心力量。
📎 邵猛 @ X
Claude Code——文档中未提及的所有可配置选项
📎 Hacker News / Building Better
当公司过于"AI 上瘾"时会发生什么?
Box 创始人 Aaron Levie 将决定用 AI 替代员工的人最不了解工作实际内容的现象称为"AI psychosis"。ClickUp 近期部署 AI 智能体裁员 22% 即是一例。2026 年科技行业裁员规模已接近 2025 年全年。
特斯拉 FSD 安全性宣称遭质疑
路透社调查发现特斯拉 FSD 安全数据经不起推敲,11 位交通安全研究人员指出其统计方法存在缺陷,竞争对手 Waymo 采用更严谨的统计方法。目前 FSD 仍需驾驶员主动监督,安全部署可能还需数年。
📎 IT之家
Cognition 的 Scott Wu:AI 编程智能体不应取代人类
AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)