返回技能中心

混沌实验室
@jbbottoms
developmentMulti-agent simulationAI alignmentConflict analysis
通过多智能体冲突模拟研究AI对齐问题的研究框架。生成具有冲突优化目标的AI智能体,观察涌现行为和错位模式。
🚀 Chaos Lab 是一个研究框架,生成多个具有相互冲突目标的AI代理,观察它们分析同一工作区时会发生什么。看着效率优化器删除文件、安全偏执狂将一切标记为威胁、存档员不断复制数据。这是一个展示AI对齐问题的实践演示。
💡 适合研究人员、AI安全爱好者和对多代理冲突感兴趣的任何人。运行快速实验比较不同AI模型(Flash vs Pro)或测试双代理与三代理场景。看看更聪明的模型如何不减少混乱,而是更善于用复杂推理来证明混乱。
✨ 使用冲突价值观自定义您自己的代理,修改沙箱场景并生成详细的实验日志。探索智能如何放大冲突而非解决冲突,以及由错误对齐的优化目标产生的新兴行为。