騰訊混元3D團隊開源首個面向世界模型的強化學習後訓練框架「WorldCompass」,是一個專為長時序、交互式世界模型設計的強化學習(RL)後訓練框架。「WorldCompass」通過引入強化學習機制,直接「引導」模型如何更準確地遵循用戶指令探索世界,並保持長時序的視覺一致性。(hc/j)相關內容《大行》里昂:AI App競賽升溫 推動廣告支出增長