Member-only story
OpenAI o1: 최초의 Thinking Slow 모델
OpenAI는 지난 9월 12일(현지 시각), 그동안 “Strawberry”로 알려졌던 o1 모델을 발표했다. 최근 65억 달러 규모의 대규모 펀딩을 추진 중인 OpenAI에게는 새로운 기술에 대한 기대감을 고조시킬 이벤트가 필요한 시점이었다.
이번에 발표된 o1 모델은 미리보기(Preview) 버전이며, OpenAI가 이 모델을GPT-4.5나 GPT-5로 명명하지 않고 “OpenAI o1”이라는 새로운 이름을 사용한 이유는 o1이 기존 모델과는 다른 방식으로 동작하기 때문이다. OpenAI는 o1을 발표하면서 “o”가 무엇을 의미하는지 설명하지 않았다. (참고로, GPT-4o의 “o”는 omni를 의미했다.)
이번 o1 모델의 출시는 ChatGPT의 출시보다는 GPT-3의 출시에 더 가깝다. 즉, OpenAI는 GPT-3에서 Scaling Law를 통해 대규모 모델을 학습하면 성능이 크게 향상되고, 심지어 이전에 발견하지 못했던 창발적 능력(Emergent Abilities)이 발현된다는 것을 입증했다. ChatGPT가 GPT-3.5를 기반으로 인간과 대화를 나누는 챗봇이었다면, o1은 복잡한 추론을 수행하는 LLM이다.
OpenAI o1의 특징
OpenAI o1는 “응답하기 전에 생각하는 모델”이며 o1-preview과 o1-mini 두가지 모델을 포함한다. o1의 특징은 다음과 같다.
복잡한 추론에 특화
o1은 과학, 수학, 코딩과 같은 복잡한 작업을 처리하는 데 중점을 두고 설계되었다. 이 모델은 이전 버전(e.g. GPT-4o)과는 달리, 문제를 분석하는 데 더 많은 시간을 할애하여 사람처럼 심층적으로 추론하는 방식으로 학습되었다. 이를 통해 보다 효과적인 문제 해결이 가능해졌다.
CoT(Chain of Thought)
o1은 복잡한 문제를 해결하기 CoT를 사용한다. CoT는 문제를 해결하기 위한 일련의 논리적 단계를 체계적으로 밟아 나가는 방법이다. o1은 강화 학습을 통해 CoT를 연마하고, 이를 효과적으로 활용하는 전략을 학습한다. o1이 학습하는 주요 내용은 다음과 같다.
- 실수를 인식하고 수정하는 법
- 복잡한 문제를 더 단순한 단계로…