最新分析:将上下文扩展至1000万令牌,使Codex网络安全自主工作量提升3倍
据Ethan Mollick在X平台披露,将模型上下文从300万提升到1000万令牌,使Codex在网络安全任务中的独立工作时长从3.1小时提升到10.5小时,显示超长上下文显著增强代理型工具链吞吐(来源:Ethan Mollick,2026年4月5日X贴文)。据其对METR时间视界分析的独立扩展,在进攻性网络安全领域观测到能力翻倍时间为5.7个月,前沿模型在需10.5小时人类专家投入的任务上达到50%的成功率(来源:Ethan Mollick,引用METR方法)。根据METR既有研究,以达标用时衡量模型进步具有稳健性;该网络安全领域数据表明,具备1000万令牌上下文的代理更易实现端到端流程扩展(来源:METR报告;Mollick分析)。对企业而言,这带来可即刻落地的机会,包括自主红队助手、持续漏洞研究流水线与长上下文代码审计服务,前提是获得1000万令牌上下文与完善治理措施(来源:Ethan Mollick;METR)。
原文链接详细分析
根据Ethan Mollick于2026年4月5日在Twitter上的分享,提高AI令牌限制从300万到1000万,将Codex在网络安全任务上的独立工作量增加了三倍,从3.1小时延长到10.5小时。这一发现扩展了METR著名的时域分析,应用于进攻性网络安全领域,使用真实人类专家计时数据。Mollick指出,AI能力的倍增时间为5.7个月,前沿模型在人类专家需10.5小时的任务上成功率达50%。这一AI发展趋势突显了更大上下文窗口如何使AI自主处理复杂操作,对网络安全行业的企业意味着威胁检测和漏洞评估的效率提升。全球网络安全市场预计到2026年将达到3454亿美元,根据2023年Statista报告,AI整合可通过订阅服务捕捉市场份额。主要玩家如Palo Alto Networks正采用AI进行威胁情报,而扩展令牌限制可提供连续监控功能。实施挑战包括数据隐私,可通过GDPR标准解决。伦理含义强调双重用途技术评估,如2022年Center for a New American Security指南。未来预测显示,到2028年AI可能独立处理30小时任务,变革行业自动化操作。企业可投资AI培训和伙伴关系,实现预测威胁建模的应用,同时确保透明以防网络冲突升级。这一演变不仅突显定制AI解决方案的货币化潜力,还强调平衡实施以利用益处而不损害安全。
Ethan Mollick
@emollickProfessor @Wharton studying AI, innovation & startups. Democratizing education using tech