標簽：MiniWob

AI鍵盤俠來了：DeepMind開始訓練智慧體像人一樣“玩”電腦

DeepMind 從 77 名人類參與者那裡收集了超過 240 萬個 104 MiniWob++ 任務演示，總計大約 6300 小時，並使用模仿學習和強化學習（RL）的簡單混合來訓練智慧體...

時間：2022-02-24標籤：智慧 MiniWob ++ 任務 DeepMind