Technology: AI can outrace champion Gran Turismo drivers
라이벌 자동차와의 접전을 펼치는 자동차 레이스 게임 '그란 투리스모'에서 세계 챔피언 레벨의 플레이어 상대에게 승리한 인공 지능(AI) 에이전트에 대해 보고하는 논문이자연 에 게재된다.이 에이전트는 레이스 에티켓을 지키면서 뛰어난 주행 속도, 차량 제어, 전술을 선보였다.이번 지견은 자율항법이나 AI의 기초연구에 도움이 될지도 모른다.
AI의 적용가능 예의 대부분에서는 인간과 연관하면서 물리적 시스템에서 실시간으로 의사결정을 하는 것이 요구된다.자동차 레이스는 그러한 상황의 한 예다.운전자는 정지 마찰 한계로 차량을 조작하면서 복잡한 전술적 조작을 수행하여 라이벌 차량을 추월하거나 차단해야합니다.플레이 스테이션용 게임의 하나인 「그란 투리스모」와 같은 레이스 시뮬레이션은, 실제의 레이스 카의 제어의 과제를 재현하고 있어, 기계 학습에 있어서 고난도의 적용 예가 되고 있다.
이번 Peter Wurman은 심층 강화 학습을 사용하여 Gran Turismo Sophy(GT Sophy)라고 명명한 AI 에이전트에게 '그란 투리스모'를 플레이하는 방법을 가르쳤다. GT Sophy는 레이스 코스에서 사용하는 효율적인 가속과 제동 기술을 습득하도록 훈련되었으며, 다양한 상황에서 또는 상대방에 차단되었을 때 다른 경로를 찾는 방법을 배웠습니다.고성능 AI 훈련에서 가장 어려운 측면 중 하나는 레이스 에티켓(외부 인간의 심판이 결정한 일련의 완만한 규칙)을 위반함에 따른 벌칙을 확실히 회피하는 것이다. GT Sophy는 1가지 차량(시속 3킬로미터를 넘는 차량 포함)과 자동차 레이스장의 조합에 따라 다른 레이스 과제가 제시된 상황에서 세계 최고의 e스포츠 드라이버 300명과 대접전을 맡아 승리를 거두었다.
경쟁적 과제(체스, 포커 등)로 컴퓨터가 최강의 인간을 이겨낸다는 흐름이 이어지고 있지만, 이번 결과는 이 흐름을 계승하는 새로운 단계이다. Wurman은 이번 지식은 자동차 레이싱 게임의 즐거움을 향상시킬 뿐만 아니라 전문 드라이버 훈련과 새로운 레이싱 기술 발견을 위한 현실적이고 높은 수준의 경쟁 상황을 만들 수 있다고 제안합니다.또한, 이 방법은 현실 세계의 시스템(로봇, 공중 드론, 자율주행차 등)에도 적용될 수 있다.
[영어 원문 »]
「Nature 관련지 주목의 하이라이트」는, 네이처 홍보 부문이 보도 관계자용으로 작성한 릴리스를 번역한 것입니다.보다 정확하고 상세한 정보가 필요한 경우에는 원저 논문을 참조하십시오.
※이 기사는 「Nature Japan 주목의 하이라이트」에서 전재하고 있습니다.
원본 텍스트: "기술 : AI가 '그란 투리스모'의 챔피언 드라이버를 추월"