我开悟用minimax写代码,结果我让他用ModalA的output替换ModalB的observation中的cmd部分,结果minimax没搞懂非对称critic/actor设计,以为actor和critic维度一样结果替换了错误的部分,然后死活训不出来导航modal,查了2天也没找到bug在哪,结果看了回放灵光迸现,检查了一下obs维度,果不其然,SB minimax给我吧维度拼接错误了,怪不得训练的还不错的运控模块死活走不动路,合着压根没执行command
垃圾Minimax
发布于 3 小时前 3 次阅读 143 字 预计阅读时间: 1 分钟

Comments NOTHING