AI 行业日报 · Daily Intelligence

第 0002 期

edition-0002 · 2026年5月7日

Top 10 新闻 5 个关键词 2026/05/07
本期导语

本期聚焦AI安全与算力博弈:Anthropic Mythos已能大规模挖掘零日漏洞,引发安全格局巨变;Anthropic与Google签署2000亿美元算力协议,中美差距缩至2.7%。OpenAI、DeepSeek相继更新旗舰模型,企业自主智能体浪潮涌起,AI正快速从实验走向规模化生产部署。

# AI安全 # 基础设施竞争 # 中美AI博弈 # 企业智能体 # 开源模型
Top 10 · 本期精选
01
Anthropic · TechCrunch · CNBC

Anthropic Claude Mythos 发现数万个零日漏洞,开启 Project Glasswing

Anthropic 推出 Claude Mythos Preview,已在 Firefox、各主流操作系统和浏览器中识别出数万个此前未知的漏洞,合作方涵盖苹果、微软、亚马逊等科技巨头。这标志着 AI 在网络安全领域的能力已全面超越绝大多数顶级人类专家,但双刃剑效应同步放大了攻击风险。Anthropic CEO 警告称当前正处于网络安全的"危险时刻",该模型以受控方式定向用于防御修复。

AI安全
02
The Information · CNBC · Engadget

Anthropic 承诺向 Google Cloud 投入 2000 亿美元,占 Alphabet 积压订单逾 40%

Anthropic 与 Google 签署为期五年的算力协议,将在 Google Cloud 和 TPU 芯片上花费高达 2000 亿美元,TPU 算力将于 2027 年起陆续交付。这笔创纪录的基础设施绑定协议使 Anthropic 占据 Alphabet 云收入积压超过 40%,AI 头部公司的算力锁仓策略正在重塑整个云计算市场,其他买家将面临更长等待期与更高成本。

基础设施竞争
03
OpenAI · TechCrunch · Axios

OpenAI 发布 GPT-5.5 Instant:幻觉率降低 52.5%,新增记忆来源功能

OpenAI 将 ChatGPT 默认模型升级为 GPT-5.5 Instant,在医疗、法律等高风险场景的幻觉声明减少 52.5%,同时新增"记忆来源"控件,用户可查看并管理 ChatGPT 个性化响应所依赖的上下文和历史对话。该模型减少了不必要的追问和过度格式化,付费用户还可通过 Gmail 等连接更强的跨平台上下文。

模型更新
04
CNBC · TechCrunch · Fortune

DeepSeek V4 发布:1.6 万亿参数开源旗舰,深度整合华为昇腾芯片

中国 DeepSeek 发布 V4-Pro 和 V4-Flash 预览版,V4-Pro 总参数量达 1.6 万亿(激活 490 亿),是目前规模最大的开放权重模型,上下文窗口高达 100 万 token,并与华为"超节点"昇腾 950 芯片深度集成。V4-Flash 每百万输入 token 仅需 0.14 美元,再次以低价搅动全球 AI 市场,表明中国在算力受限下的技术突破路径日趋成熟。

开源模型
05
Stanford HAI · The Next Web · IEEE Spectrum

斯坦福 2026 AI 指数:中美顶级模型差距收窄至 2.7%,AI学者赴美骤降 89%

斯坦福 HAI 年度报告显示,中美最佳 AI 模型的性能差距从 2023 年最高 31 个百分点骤降至 2.7%,中国以仅为美国 1/23 的私人投资实现近乎追平。更值得关注的是 AI 人才流动逆转:AI 学者移居美国人数较 2017 年下降 89%,其中过去一年骤降 80%,对美国长期 AI 领导地位构成深层挑战。

中美AI博弈
06
NIST · CNN · Al Jazeera

谷歌、微软、xAI 同意发布前接受美国政府 AI 安全测试

美国商务部 CAISI 与 Google DeepMind、微软和 xAI 签署协议,政府可在 AI 模型公开发布前进行安全评估,测试对象包括去除安全护栏的"裸模型"。此举是对 Anthropic Mythos 展示出的高危网络攻击能力的直接回应,标志着美国 AI 监管体系从自愿测试向更具约束力的预发布审查机制演进。

AI监管
07
Google Blog · Google Cloud

Google 发布 Gemini 3.1 Flash-Lite:速度提升 2.5 倍,每百万 token 仅 0.25 美元

Google 推出 Gemini 3.1 Flash-Lite,响应速度比上代 2.5 Flash 快 2.5 倍,输出生成速度提升 45%,在 Arena.ai 排行榜获得 1432 Elo 分,且在同档位推理和多模态基准中表现领先。极低定价与卓越性能的结合体现了 AI 行业在普惠化方向的加速竞争,有效降低了中小企业和开发者的使用门槛。

模型更新
08
VentureBeat · Writer

Writer 发布无需提示的自主 AI 智能体,向微软、Salesforce、亚马逊宣战

企业 AI 平台 Writer 推出事件驱动型自主智能体,可自动监控 Gmail、Slack、Gong、SharePoint 等应用,无需人工触发即可执行复杂多步骤工作流,新增 Adobe Experience Manager 连接器及企业级治理控件。这是对微软 Copilot、Salesforce Agentforce 和 Amazon Q Business 的正面挑战,代表企业 AI 从"响应提示"向"主动感知与行动"的范式跃迁。

企业智能体
09
TechCrunch · The Information

OpenAI 计划年底将员工扩至 8000 人,AI 行业人才军备竞赛加剧

面对 Anthropic 等对手的激烈竞争,OpenAI 计划到 2026 年底将员工人数从约 4300 人翻倍至 8000 人,年化营收已突破 300 亿美元。这场大规模扩招折射出整个 AI 行业对顶尖研究与工程人才的争夺,与此同时斯坦福报告揭示的 AI 人才"逆向流动"趋势也让这场竞争更加复杂。

行业动态
10
VentureBeat · Subquadratic

初创公司 Subquadratic 宣称突破 Transformer 二次方复杂度根本限制

迈阿密初创公司 Subquadratic 从隐身模式浮出,自称构建了首个完全突破注意力机制二次方复杂度约束的大型语言模型——该约束自 2017 年以来定义并制约了所有主流 AI 系统。若声明属实,将从根本上改变大模型的长文本处理能力与计算效率,但独立技术验证仍有待进行,业界保持审慎期待。

前沿研究