AI 热点日报 | 2026年6月8日
数据来源:AI HOT(aihot.virxact.com)
模型发布/更新
Harness-1:基于强化学习训练的有状态搜索 20B 检索子智能体
UIUC 与 Chroma 联合推出 Harness-1,一个 20B 参数的检索子智能体。它通过强化学习在一个有状态搜索框架中训练,维护候选池、重要性标注集、证据图和验证记录,由策略决定搜索、筛选、验证及停止的时机。Harness-1 在 8 个基准测试上达到 0.730 平均 curated recall,比下一个最佳开源子智能体高出 11.4 个百分点,仅落后于 Opus 4.6。模型权重和框架代码均已公开。
产品发布/更新
Her · हेर:Claude Code 会话分析工具
专为 Claude Code 设计的会话分析工具。用户上传 .jsonl 文件后,Her 用自然语言重建每轮交互,标记部署、配置变更、秘密等高风险操作并定位到具体轮次。展示 token 消耗、所用工具、子智能体和 MCP 服务器,并结合 Anthropic 与社区最佳实践给出改进建议。内置"Ask Her"问答功能,使用 Nemotron-Mini-4B 模型在 Hugging Face ZeroGPU 上运行,不调用第三方 AI API。
OpenRouter 上线 Opus 4.8 实时缓存命中率与有效价格查询
现在可以从 Pricing 标签查看实时缓存命中率和历史流量数据,帮助开发者评估不同模型提供商的实际使用成本。
NVIDIA 与 KRAFTON、NC、T1 在韩国庆祝 RTX Spark 发布
NVIDIA CEO 黄仁勋前往韩国介绍 RTX Spark 超芯片。该芯片集成 30 年 NVIDIA 技术,可在 Windows 笔记本上实现全天续航,以 1440p 超 100fps 运行 AAA 游戏,支持 DLSS 4.5 Ray Reconstruction。黄仁勋与 Faker 共同亮相 T1 电竞场馆,并突袭江南区网吧演示《PUBG》。
行业动态
ChatGPT 要变 AgentGPT 了:OpenAI 筹备史上最大改版
OpenAI 正筹备 ChatGPT 自 2022 年上线以来最大规模改版,从聊天机器人转向超级应用/Agent 平台,整合 Codex、图像生成及第三方应用(Canva、Booking)。高管称"聊天已死",目标成为跨平台个人 AI 助手。ChatGPT 有 9 亿周活用户、5000 万付费用户、月收入 20 亿美元但未盈利。OpenAI 刚完成 1220 亿美元融资,估值 8520 亿美元,IPO 目标估值超万亿美元。竞争对手 Anthropic 估值已达 9650 亿美元。
📎 宝玉 @ X
特朗普政府与 OpenAI 讨论通过公共财富基金入股 AI 初创公司
据 FT 报道,方案是 AI 企业捐赠小部分股权至公共财富基金,基金通过账户或分红将收益返还美国公民,而非政府直接运营公司。政治背景:选民担忧失业、数据中心成本与企业控制,而 AI 公司需要华盛顿在基建、采购和监管上的支持。
OpenAI 仍推进超级应用计划,“聊天已死”
技巧与观点
苹果秘密会议内幕:它终于认真对待 AI
苹果在一次内部秘密会议后终于决定将 AI 作为核心战略,相关进展预计将在 WWDC 2026 上公布。
“我在田里雇了一名工程师,它叫 Codex”——北海道一个西兰花农的 8 个真实 AI 用法
日本农民富安弘毅用 ChatGPT 和 Codex 解决农场实际问题:拍照识别病害、卫星 NDVI 监测、远程控制温室卷帘、为农场群聊开发机器人、追踪播种数量、学习 RTK-GPS 自动转向、设计农场管理数据库。他说 AI 让传统昂贵的自动化变得低成本可及,“如同身边有一位超级工程师”。
GPT-5.5 vs Opus 4.8 设计效果大对比
宝玉对比了两大模型的设计能力,认为 Opus 4.8 效果远优于 GPT-5.5。推荐搭配 baoyu-design Skill + Opus 4.8 获得最佳效果:描述屏幕需求即可生成精良 HTML,点击预览中任意元素即可发出修改指令。工具已开源。
📎 宝玉 @ X
Symbolica 2.0:适用于 Python 和 Rust 的可编程符号系统发布
Harness 工程:在智能体优先的世界中运用 Codex
OpenAI 官方发布的 Harness 工程实践文章,介绍在智能体优先的世界中如何有效使用 Codex。
📎 OpenAI
Slop、生产力,以及为何 AI 驱动的世界进展甚微
Gary Marcus 引用 FT 数据图表,认为精准提炼了 AI 行业"产出多、实质进展少"的困境。
AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)