数据来源:AI HOT(aihot.virxact.com)


今日头条

首个统一科学大模型 LOGOS 正式开源

LOGOS 由 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院开源,尝试用统一的“科学语法”把蛋白质、小分子、材料等对象都编码进同一个基础模型。首发的 LOGOS-1B 只有 10 亿参数,但在多个 AI4S 任务上已经能匹配甚至超过领域专用方法:例如逆合成预测 Top-1 准确率达到 74.8%,口袋位点识别仅用序列表征就做到 58.5% Top-n 准确率,MOF 材料生成指标 NBB 提升到 17.78%。这类统一建模路线的意义在于,不再把每个科学子领域拆成彼此隔离的模型栈,而是开始验证跨学科知识迁移能否在同一底座里成立。

📎 公众号:通义实验室(千问)


模型发布/更新

火山引擎上线豆包实时语音模型 3.0 API,并开启邀测

火山引擎上线豆包实时语音模型 3.0(Seeduplex)API 服务,并同步开启邀测。这个模型定位为原生全双工端到端语音大模型,重点强调三件事:复杂多人场景下更稳的抗干扰、更低的误打断与误回复率,以及更快的动态判停。官方给出的数据是判停延迟缩短约 250ms、复杂场景抢话比例下降 40%、用户主动打断延迟缩短约 300ms,并支持在实时交互里调用工具完成发邮件、定日历等任务。

📎 公众号:火山引擎

Grok TTS 在盲测中拿到 96 分“人类感”得分

xAI 公布,Grok TTS 在 Vapi 的 Humanness Index 盲测里获得 96 分,接近真人语音的 100 分。这个指标本质上测的是听众在固定声音和固定文本条件下,对语音“像不像真人”的主观感受。虽然它不等同于更全面的语音系统评估,但从产品化角度看,TTS 的自然度竞争已经进入高度贴近真实配音的阶段。

📎 X:xAI (@xai)

GPT-5.5 Instant 提升 ChatGPT 健康问答能力,并已面向免费用户开放

OpenAI 表示,GPT-5.5 Instant 经过医生主导评估和健康场景优化后,健康问答能力已经接近其前沿 Thinking 模型。按官方口径,模型每周服务超过 2.3 亿 ChatGPT 健康信息用户,在准确性、安全性、解释不确定性和沟通质量上都有显著提升,过去两个月生产流量中的健康类事实性问题率下降了 71%。这类更新很值得关注,因为它代表 OpenAI 正在把更高质量的专业场景能力下放给默认和免费层用户。

📎 X:Greg Brockman (@gdb)


产品发布/更新

Claude Code 现已支持 artifacts

Claude Code 新增 artifacts 能力,可以把当前编码或调试会话自动生成成交互式网页,并随着对话继续实时刷新。适用场景包括 PR 走查、系统说明、上线清单、事件复盘和调试仪表盘。它的关键价值不在“再多一个导出格式”,而在于把原本只存在于本地会话里的中间工作产物,直接变成团队内可共享、可审阅的状态面板,减少工程协作里的同步摩擦。

📎 Claude:Blog(网页)

Adobe 把 AI 智能体扩展到 Photoshop、Premiere 等 Creative Cloud 应用

Adobe 开始以公开测试形式把 AI Assistant 推进到 Photoshop、Premiere、Illustrator、InDesign 等多款 Creative Cloud 应用中。按照披露能力,它可以自动完成换背景、素材分拣、粗剪、批量生成文件和版式更新等多步骤常规操作。与此同时,Firefly 也新增了品牌套件、产品图转短视频和 Quick Cut 自动剪辑能力。对创意软件来说,这意味着 AI 正从“单点生成工具”转向“软件内工作流代理”。

📎 The Decoder:AI News(RSS)

DeepSeek 识图模式正式上线 App 和网页端

DeepSeek 在 6 月 18 日把识图模式正式推到网页端和 App 端,成为快速模式、专家模式之外的新入口。打开后用户可以直接上传图片并让模型进行图像理解,而不只是 OCR 式文字提取。虽然这不是一次全新模型发布,但它意味着 DeepSeek 正在把此前偏技术性的多模态能力,真正转成面向普通用户的日常交互入口。

📎 IT之家(RSS)


行业动态

八部门发文:支持消费者购买 AI 相关产品

商务部等八部门发布《关于加快“人工智能+消费”发展的实施意见》,明确提出用好个人消费贷款财政贴息政策,支持消费者购买 AI 手机、智能电脑、智能电视、智能家居、AI 眼镜、智能网联汽车和人形机器人等产品。文件同时强调把 AI 更深地推入居家服务、养老、文旅、餐饮和教育等消费场景。它释放的信号很直接:AI 不再只被当作产业升级议题,也开始被纳入更广义的消费刺激政策工具箱。

📎 IT之家(RSS)

Noam Shazeer 离开 Google,加入 OpenAI

AI 研究员 Noam Shazeer 转投 OpenAI,再次引发头部实验室的人才流动关注。Shazeer 是 Transformer 共同作者之一,也是当代大模型路线的关键人物。相比单一人事新闻,更值得关注的是其背后的行业信号:在前沿模型能力越来越接近的阶段,顶尖研究者与组织结构本身,正在重新成为决定竞争格局的关键变量。

📎 X:Yuchen Jin (@Yuchenj_UW)

Grok 原生集成 Databricks Agent Bricks

Databricks 在 2026 Data + AI Summit 上宣布,Grok 模型已原生进入 Agent Bricks 平台,可与其他前沿及开源模型一起在统一受控环境中使用。对企业客户来说,这件事的重点不是“又多一个模型能选”,而是模型接入层正在持续平台化,企业越来越倾向在自己的 Lakehouse、权限、治理和评估体系里消费模型能力,而不是直接和单一模型厂商绑定。

📎 xAI:News(网页)


论文研究

Anthropic Project Fetch 第二阶段:Claude Opus 4.7 自主完成任务,速度约为人类团队 20 倍

Anthropic 发布 Project Fetch 第二阶段结果:在不需要人类协助的情况下,Claude Opus 4.7 完成了整套机器人任务,速度约为最快人类团队的 20 倍,比没有 Claude 的团队快 37 倍以上。论文中最值得看的不是单个成绩,而是它展示了通用模型规模化之后,机器人任务里“感知、规划、写代码、调试”这些环节如何开始被统一吸收进同一智能体工作流。

📎 Anthropic:Research(发表成果 · 网页)

MosaicLeaks:研究智能体在结合私有文档与外部检索时容易泄密

Hugging Face 与 ServiceNow 发布 MosaicLeaks,专门测试研究型智能体在处理“本地私有资料 + 公网检索”混合任务时的隐私泄露风险。作者构造了 1001 条多跳研究链,发现如果单纯优化任务表现,智能体往往会更频繁地把私有信息带到公开答案里。论文提出的隐私感知深度研究训练方法,把严格链成功率从 48.7% 提升到 58.7%,同时把泄露率从 34.0% 压到 9.9%。这类工作对未来企业研究代理很关键,因为它触及了“会做事”和“守住边界”之间的根本冲突。

📎 Hugging Face:Blog(RSS)

OpenAI 与哈佛等合作:o3 Deep Research 辅助诊断儿童罕见病

波士顿儿童医院、哈佛大学与 OpenAI 在《NEJM AI》发表研究,用 o3 Deep Research 重新分析 376 例此前未确诊的儿童罕见病病例,最终新增建立 18 例诊断,额外诊断率 4.8%。这里最重要的不是把模型描述成“替代医生”,而是它作为证据驱动的候选解释生成器,能够帮助专家把长期无解病例重新拉回可验证流程里。

📎 OpenAI:官网动态(RSS · 排除企业/客户案例)


技巧与观点

驾驭 Claude Code:CLAUDE.md、技能、钩子、规则与子智能体各自适合什么

Claude 官方系统性解释了 Claude Code 的七种自定义方式,包括 CLAUDE.md、规则、技能、子智能体、钩子、输出样式和附加系统提示。对工程团队最实用的一点,是它把这些机制的加载时机、上下文成本、压缩行为和适用场景说清了。也就是说,团队终于可以不再把所有约束都塞进一个超长提示词,而是按作用域和生命周期分层组织智能体行为。

📎 Claude:Blog(网页)

超越 LoRA:参数高效微调选择开始回到基准而不是口号

Hugging Face 回顾了参数高效微调(PEFT)技术版图,指出 LoRA 依然占据事实标准地位,但许多“超越 LoRA”的论文结论并不稳固,往往对超参数和比较基线不够公平。文章的价值在于,它没有继续重复技术口号,而是强调统一 API、公开基准和可复现实验对于微调技术选择的重要性。对实际落地团队来说,这比再多一个新缩写更有意义。

📎 Hugging Face:Blog(RSS)

Google 回顾 A2A 协议一周年:协作型智能体生态正在成形

Google 总结了 Agent-to-Agent(A2A)协议发布一周年的进展,强调相比传统 REST API,A2A 更适合生成式 AI 场景中的安全边界、上下文隔离、动态自主性和任务分发。配套案例 FoldRun 说明,未来多个模型、多个系统之间的协作方式,可能会越来越依赖这类“智能体对智能体”的标准接口,而不是每个团队各自手搓一层胶水集成。

📎 Google Developers Blog(RSS)


AI 热点日报 · 作者:钟懿 · 数据来源:AI HOT(aihot.virxact.com)