谷歌開發乒乓球機械人
近日,谷歌旗下“深層思維”(DeepMind)公司宣佈,該公司研發團隊開發出一款乒乓球機械人,可在比賽中達到人類業餘乒乓球選手的水平。
與象棋、圍棋等純戰略遊戲不同,乒乓球對機械人的綜合能力提出了更高要求,如高速運動、實時精准控制、戰略決策和系統設計。自二十世紀八十年代起,不少研究人員將乒乓球作為機械人測試的基准並開發了多款乒乓球機械人,而谷歌DeepMind無疑是一個新的突破。
研發團隊在預印本網站arXiv上發文介紹,這是首個在乒乓球比賽中達到人類業餘選手水平的學習型機械人智能體,其主體為一個六軸機械臂,可通過底部滑軌前後左右移動。龍門架橫跨桌子,長度為四米,縱向可移動兩米。此外,手臂上裝有一個3D打印的球拍手柄和短顆粒橡膠的球拍。
為了評估智能體的技能水平,該機械人與廿九名乒乓球運動員進行了比賽,這些運動員的技能水平分別為初學者、中級、高級和超高級,由專業教練評定。在與人類進行的廿九場比賽中,機械人贏得十三場,勝率為百分之四十五。對戰者皆是機械人未見過的人類選手,技能水平從初級選手到高級選手不等。研究人員說,機械人輸掉了所有與高級選手的比賽,但贏得了所有與初級選手的比賽以及百分之五十五與中級選手的比賽。
為實現人類水平的速度和表現,研發團隊採用了分層和模塊化的策略架構,使機械人不僅能掌握正手上旋球、反手推擋等“低級技能”,還可通過相當於大腦的“高級控制器”來制定策略。比賽時,“高級控制器”可根據比賽實況、機器人自身能力以及對手能力制定最佳技能方案。賽後,機械人還能分析對戰數據,並不斷提高技能。
研究人員表示,這款機械人仍有諸多不足之處,如反手打法較弱,不擅長應對快球、過高過低或強烈旋轉的球等。他們將嘗試通過改進控制算法、優化硬件等方式進一步提升機械人的性能。
事實上,DeepMind團隊對乒乓球機械人的研究已經持續了數年。二○二○年,DeepMind推出了一種無模型算法,該算法通過以每秒一百次的頻率控制機器人的關節,成功實現了在各種發球中八成的回球率。到二○二二年七月,谷歌進一步發佈了i-Sim2Real技朮,利用深度強化學習使機械人能夠在高速動態環境中進行乒乓球比賽,並與人類玩家連續互動超過四分鐘,完成三百四十次擊球。
月 比