[논문] Code as Policies: Language Model Programs for Embodied Control
카테고리: Papers
태그: CaP
0. Abstract
Code-writing LLM이 자연어 command를 입력으로 받아, robot policy code를 생성할 수 있음을 발견했다.
이 policy code는 perception output(ex. 객체 탐지)을 입력으로 받아 처리하거나 제어 primitive APIs의 매개변수를 설정하는 함수 또는 피드백 루프로 표현할 수 있다.
여러 개의 예시 command(주석 형식)과 Few-shot prompting을 통해 그에 대응하는 policy code를 입력으로 제공하면
LLM은 새로운 명령을 받아들이고, API 호출을 자율적으로 재구성해 새로운 policy code를 생성할 수 있다.
또한 LLM은 classic logic structures를 연결하고, third-party libraries(Numpy, Shaply)같은 것을 참조해 수학적 연산을 수행할 수 있어
이를 통해 robot policy를 만들 수 있다.
이렇게 만들어진 policy는 다음과 같은 것을 수행할 수 있다.
- spatial-geometric reasoning
- 새로운 instructions 일반화
- “더 빠르게”같은 모호한 표현을 문맥에 따라 정확한 수치 값으로 변환
이 논문은 Code as Policies (CaP)를 제안한다. 이는 Language Model generated Program(LMPs)를 로봇 중심으로 공식화 한 것이다.
이 접근법의 핵심은 hierarchical code-gen으로 정의되지 않은 함수를 재귀적으로 정의해 더 복잡한 코드 작성이 가능하다는 것이다.
댓글남기기