最新分析：将上下文扩展至1000万令牌，使Codex网络安全自主工作量提升3倍

最新分析：将上下文扩展至1000万令牌，使Codex网络安全自主工作量提升3倍 | AI快讯详情 | Blockchain.News

据Ethan Mollick在X平台披露，将模型上下文从300万提升到1000万令牌，使Codex在网络安全任务中的独立工作时长从3.1小时提升到10.5小时，显示超长上下文显著增强代理型工具链吞吐（来源：Ethan Mollick，2026年4月5日X贴文）。据其对METR时间视界分析的独立扩展，在进攻性网络安全领域观测到能力翻倍时间为5.7个月，前沿模型在需10.5小时人类专家投入的任务上达到50%的成功率（来源：Ethan Mollick，引用METR方法）。根据METR既有研究，以达标用时衡量模型进步具有稳健性；该网络安全领域数据表明，具备1000万令牌上下文的代理更易实现端到端流程扩展（来源：METR报告；Mollick分析）。对企业而言，这带来可即刻落地的机会，包括自主红队助手、持续漏洞研究流水线与长上下文代码审计服务，前提是获得1000万令牌上下文与完善治理措施（来源：Ethan Mollick；METR）。

原文链接

详细分析

根据Ethan Mollick于2026年4月5日在Twitter上的分享，提高AI令牌限制从300万到1000万，将Codex在网络安全任务上的独立工作量增加了三倍，从3.1小时延长到10.5小时。这一发现扩展了METR著名的时域分析，应用于进攻性网络安全领域，使用真实人类专家计时数据。Mollick指出，AI能力的倍增时间为5.7个月，前沿模型在人类专家需10.5小时的任务上成功率达50%。这一AI发展趋势突显了更大上下文窗口如何使AI自主处理复杂操作，对网络安全行业的企业意味着威胁检测和漏洞评估的效率提升。全球网络安全市场预计到2026年将达到3454亿美元，根据2023年Statista报告，AI整合可通过订阅服务捕捉市场份额。主要玩家如Palo Alto Networks正采用AI进行威胁情报，而扩展令牌限制可提供连续监控功能。实施挑战包括数据隐私，可通过GDPR标准解决。伦理含义强调双重用途技术评估，如2022年Center for a New American Security指南。未来预测显示，到2028年AI可能独立处理30小时任务，变革行业自动化操作。企业可投资AI培训和伙伴关系，实现预测威胁建模的应用，同时确保透明以防网络冲突升级。这一演变不仅突显定制AI解决方案的货币化潜力，还强调平衡实施以利用益处而不损害安全。

Codex METR 上下文窗口前沿模型网络安全

Ethan Mollick

@emollick

Professor @Wharton studying AI, innovation & startups. Democratizing education using tech