노엄 브라운과 OpenAI o1: AI 추론의 패러다임을 바꾸다
노엄 브라운과 OpenAI o1: AI 추론의 패러다임을 바꾸다 지금까지의 거대언어모델(LLM)이 '다음에 올 단어를 통계적으로 예측'하는 데 집중했다면, 이제 AI는 '스스로 논리적 단계를 밟아 사고하고 검증' 하는 단계에 접어들었습니다. 그 중심에는 포커와 전략 게임 AI의 세계적 권위자, 노엄 브라운(Noam Brown) 과 OpenAI의 새로운 모델 o1 이 있습니다. 1. 노엄 브라운은 누구인가? (추론 AI의 설계자) 노엄 브라운은 OpenAI에 합류하기 전부터 '게임 이론'과 '전략적 추론' 분야에서 독보적인 업적을 남긴 인물입니다. 그의 연구 철학은 o1 모델의 뿌리가 되었습니다. 리브라투스(Libratus) & 플루리부스(Pluribus): 메타(구 페이스북) 재직 시절, 세계 최고의 포커 플레이어들을 꺾은 AI를 개발했습니다. 포커는 상대의 패를 알 수 없는 '불완전 정보 게임'이기에 단순 계산을 넘어선 고도의 심리적, 논리적 추론이 필요합니다. 시세로(Cicero): 인간과의 협상과 외교가 필요한 전략 게임 '디플로머시'에서 상위 1%의 성적을 거둔 AI를 구축했습니다. 추론의 확장 법칙: 그는 AI가 학습(Training) 단계뿐만 아니라 실제 답을 내놓는 실행(Inference) 단계 에서 더 많은 계산 자원을 투입할 때 성능이 비약적으로 향상된다는 점을 증명했습니다. 2. OpenAI o1의 핵심: 생각의 사슬(Chain of Thought) o1 모델(코드네임 스트로베리)이 기존 GPT-4o와 결정적으로 다른 점은 사용자에게 최종 답변을 내놓기 전, 내...