DeepMind發(fā)表博客文章,提出一種稱為SAC-X(計劃輔助控制)的新學習范式,旨在解決讓AI以最少的先驗知識,從頭開始學習復雜控制問題的挑戰(zhàn)。
這在真實環(huán)境中成功讓機械臂從頭開始學習拾放物體。SAC-X 是基于從頭開始學習復雜的任務這種想法,即一個智能體首先應該學習并掌握一套基本技能。就像嬰兒在爬行或走路前必須具有協(xié)調(diào)能力和平衡能力,為智能體提供與簡單技能相對應的內(nèi)在目標(具有輔助作用),這會增加它理解和執(zhí)行更復雜任務的可能性。研究者認為,SAC-X是一種通用的強化學習方法,未來可以應用于機器人以外的更廣泛領(lǐng)域。