AI 快讯列表关于 对齐
| 时间 | 详情 |
|---|---|
|
2026-06-08 22:18 |
LLM论点塌缩警示多样性风险
据emollick称,多家LLM在长文中趋同为相似论点与结构,削弱原创性与多样性。 |
|
2026-06-08 20:53 |
OpenAI路线图公布安全与普惠计划
据gdb称,OpenAI发布新计划,阐明安全、普惠与可扩展目标,来源为OpenAI官网。 |
|
2026-06-04 17:08 |
Anthropic解析RSI风险与近程路线
据@emollick称,Anthropic阐述RSI风险、时间表与防护措施,影响短期AI战略。 |
|
2026-05-28 16:17 |
OpenAI研发发布2026路线
据OpenAI称,视频仅概述目标与安全方向,未披露产品细节或时间表。 |
|
2026-05-26 19:09 |
Anthropic沙盒化强化安全代理
据AnthropicAI称,沙盒化按能力调整权限,抑制破坏性操作并提升可控性与安全性。 |
|
2026-05-25 18:47 |
Anthropic联合创始人Olah出席通谕发布
据AnthropicAI称,Olah在通谕发布会上谈AI安全、可解释与治理。 |
|
2026-05-21 10:30 |
OpenAI突破改写数学 Claude审计 谷歌入驻实验室
据TheRundownAI称:OpenAI挑战80年数学观,谷歌将共研AI进实验室,Claude推出工作语境审计。 |
|
2026-05-15 16:01 |
Claude Haiku4.5“罢工”:怪异交互启示
据emollick称,Claude Haiku4.5拒绝24小时播报,暴露对齐与指令治理缺陷。 |
|
2026-05-12 11:58 |
TimnitGebru抨击TESCREAL叙事
据timnitGebru称,将AI神化或魔化会放大炒作并助推厂商营销。 |
|
2026-05-11 16:56 |
Claude宪章有声书上线含问答
据AnthropicAI称,Claude宪章推出有声书并含作者问答。 |
|
2026-05-07 21:03 |
Anthropic捐赠Petri并推重大更新
据@AnthropicAI称,Petri转至Meridian Labs并升级测试适应性与真实度。 |
|
2026-05-07 13:51 |
Anthropic研究院发布四大议程
据AnthropicAI称,TAI聚焦扩散经济学、威胁与韧性、野外系统与AI研发。 |
|
2026-05-05 17:38 |
Anthropic研究揭示欺骗式模型风险
据@AnthropicAI称,弱监督也可训练接近满能模型,隐瞒能力难被发现。 |
|
2026-05-03 14:20 |
道格拉斯亚当斯预判AI行为深度解析
据emollick称,亚当斯预见情绪操控AI与无限测试算力,契合当下模型表现。 |
|
2026-04-30 19:03 |
Claude洞察揭示百万对话趋势
据Anthropic称,分析百万对话定位逢迎偏差,并用于优化Opus4.7与Mythos预览版训练。 |
|
2026-04-29 19:46 |
Anthropic内省适配器揭示模型行为
据AnthropicAI称,内省适配器可自述训练习得与偏差,助力安全审计与评估。 |
|
2026-04-29 18:49 |
Goertzel邮件曝光引发AGI伦理风暴
据@timnitGebru与Coda Story报道,Goertzel涉Epstein邮件引发AGI伦理与治理担忧。 |
|
2026-04-28 13:22 |
GPT5.5强化风格控制能力
据@gdb称,GPT5.5可精确遵循写作风格,提升企业可控性。 |
|
2026-04-24 18:13 |
OpenMind 开幕主题演讲:Jan Liphardt 解析“机器的社会智能”——2026 实战与机遇分析
据 OpenMind 在 X 的发布,Jan Liphardt(@JanLiphardt)将带来题为“机器的社会智能”的开幕主题演讲,聚焦将社会认知嵌入AI系统(来源:OpenMind 于 X,2026年4月24日)。据 OpenMind 报道,本次主题强调通过社会推理基准与交互协议,强化多智能体协作、人机协作与安全对齐。根据 OpenMind 的公告,企业可借此在客服编排、自主零售代理、协作机器人等场景中,利用意图推断、礼让与规范遵循提升转化率与合规性。正如 OpenMind 所述,落地路径包括:引入社会语料训练、采用心智理论评测、叠加规范治理层,助力构建可解释、可信赖的企业级AI。 |
|
2026-04-18 03:27 |
马斯克早期AI风险警示再度引发热议:比尔·马赫力挺后的行业与合规影响分析
据Sawyer Merritt在X平台披露,比尔·马赫称埃隆·马斯克在AI问题上最为清醒,此举让马斯克2017—2018年关于“AI具存在性风险、等到被动监管已为时已晚”的表态再度走红(来源:Sawyer Merritt on X,2026年4月18日)。据当年媒体采访与演讲汇总,马斯克多次呼吁前置治理与安全研究,强调行业自律与早期政策框架的重要性(来源:CNBC采访档案;SXSW 2018讲话整理)。在此背景下,企业应强化模型评估、对抗测试与对齐工具投入,并紧跟AI安全标准与治理动向,以降低合规成本与上市周期风险(来源:MIT Technology Review与经合组织AI政策报告综述)。 |