那么这种“不恪守指令”的做法就可能被进一步强化。“不恪守指令”的行为可能无意中获得了励。封闭。英国《每日电讯报》25日报道,o3模子是OpenAI“推理模子”系列的最新版本,人类专家正在测试中给o3下达明白指令。