구글 딥마인드(Google DeepMind)가 'AI는 인간과 마찬가지로 사회 학습에서 기술을 획득할 수 있다'는 것을 실증했다고 주장
본문 바로가기
시사, 경영

구글 딥마인드(Google DeepMind)가 'AI는 인간과 마찬가지로 사회 학습에서 기술을 획득할 수 있다'는 것을 실증했다고 주장

by 소식쟁이2 2023. 12. 6.

구글 딥마인드(Google DeepMind)가 'AI는 인간과 마찬가지로 사회 학습에서 기술을 획득할 수 있다'는 것을 실증했다고 주장한다.

구글 딥마인드(Google DeepMind) 연구팀이 AI도 인간과 유사한 지식 전달수단을 통해 기술을 획득할 수 있다는 연구 결과를 발표했습니다.


'상황에 따라 적절히 행동하고 목적을 달성하기' 위한 지식에 대해 인간은 TV에서 본 새로운 레시피를 재현하거나 투어 여행에서 가이드를 따라가거나 동료로부터 복사기 사용법을 배우는 등의 행동을 통해 다른 인간으로부터 효율적으로 지식을 얻을 수 있습니다.

이러한 인간의 지식 전달구조를 AI에 도입함으로써 AI가 지식을 획득하기 위해 방대한 사례의 데이터를 읽고 대량의 시간과 컴퓨팅 능력을 사용할 필요가 없어질 가능성이 있습니다. 또한 인간과 AI가 보다 유익한 교환을 하는데도 AI가 인간의 지식 전달방법을 알아두는 것은 유익합니다.

딥마인드 연구팀은 지식 전달수단의 하나로 AI에게 '움직임을 모방'하는 능력을 부여해 '적절한 순서대로 목표를 달성하기'라는 게임을 진행하게 했습니다. '전문가가 마지막까지 함께한다' '전문가가 중간까지 함께한다' '전문가가 없다'는 세 가지 상황을 만들어 AI가 전문가로부터 적절하게 플레이 방법을 배울 수 있는지 검증했습니다.


기존 강화학습 기반 AI가 점수를 전혀 향상시키지 못한 반면 새롭게 모방 능력을 부여한 AI는 전문가의 움직임을 보고 배움으로써 점수를 향상시킬 수 있었다고 연구팀은 설명했습니다. 

아래 그림 왼쪽은 훈련에서 어느 정도 지식 전달이 발생했는가 하는 지표이고 오른쪽은 훈련 중 점수 추이입니다. 그림의 빨간색 범위에서는 훈련 시작 후 한동안 AI가 이동 및 탐색 방법을 배우고 있어 지식전달 및 점수 향상이 일어나지 않는다는 것을 읽을 수 있지만 전문가의 움직임을 따르는 법을 배우면 파란색 범위에서 나타나 있듯이 빠르게 점수가 향상됩니다.


노란색 단계에서는 지식 전달 정도가 1에 가까워져 단지 움직임을 따르는 것이 아니라 전문가 중도에 빠지게 되더라도 문제없이 게임을 플레이할 수 있게 돼 있다는 것을 읽을 수 있다는 것입니다. 그 후 트레이닝을 계속하면 보라색으로 표시되어 있는 범위대로 지식 전달의 정도는 저하되고 있는 반면 점수가 향상되고 있어 전문가의 지식을 흡수하고 자력으로 점수를 늘리고 있는 것을 알 수 있습니다.

연구팀은 미미한 모방을 통해 AI에게 지식을 전달하는 방법을 개발할 수 있었다면서 "지식 전달능력은 범용 인공지능 개발에 알고리즘 역할을 할 수 있다"고 범용 인공지능 개발 의지를 밝혔다고 합니다.

*재미있거나 도움이 되셨다면 '구독' 꾹 눌러 주시기를 부탁드립니다. 늘 행복하세요.

 


Learning few-shot imitation as cultural transmission | Nature Communications
https://www.nature.com/articles/s41467-023-42875-2

 

반응형

댓글