Member-only story

DeepSeek R1 분석: AI가 AI를 개발하는 Self-Evolution 모델

daewoo kim
37 min read4 days ago

DeepSeek R1이 2025년 1월 20일 공개된 후 불과 일주일 만에 미국 증시는 개장과 동시에 기술주 중심으로 주가가 급락했다. 특히 AI를 주도해 온 미국 빅테크 기업들의 주가는 큰 폭으로 하락했는데, 그 이유는 간단했다. 미국의 주요 AI 기업들이 수십억 달러를 투자해 이룬 성과를 중국의 DeepSeek이 단 수백만 달러 수준의 비용으로 달성했다고 주장했기 때문이다. 이를 두고 a16z의 마크 안드레센은 과거 미국과 소련의 우주 경쟁에서 소련이 스푸트니크를 성공적으로 발사했을 때 미국이 받은 충격에 비유하며, “스푸트니크 쇼크”급 사건이라고 평가했다. (물론 DeepSeek이 발표한 개발 비용이 과장되었을 가능성은 크지만, 본문에서는 이에 대한 논의는 다루지 않을 예정이다.)

DeepSeek R1이 출시된 지 한 달이 지났다. 이젠 초기의 충격에서 벗어나 DeepSeek R1이 가지는 진정한 의미를 차분히 분석할 시점이다. OpenAI의 o1 모델과 비교할 만한 성능을 갖춘 DeepSeek R1은 단순한 연구 결과를 넘어 새로운 AI 개발 방향성을 제시하는 중요한 사례로 평가받고 있다. 필자는 이 글을 통해 DeepSeek R1이 제시하는 새로운 AI 학습 패러다임이 우리에게 어떠한 의미를 던지는지 깊이 탐구해보고자 한다.

DeepSeek는 어떤 기업인가?

DeepSeek R1을 알아보기 전에 먼저 DeepSeek의 창업자인 (Lian Wenfeng, 40)에 대해 알아보자. 그는 2002년 중국 저장대학교에 입학하여 정보통신공학 석사를 취득한 후, 2010년에 졸업하였다. 대학 졸업 후 그는 퀀트 투자를 연구했으며, 2015년 대학 동창 두 명과 함께 헤지펀드 회사 High Flyer를 설립했다. 량원펑은 AI 및 알고리즘을 활용해 주가 변동 패턴을 분석함으로써 막대한 부를 축적하였고, 현재 80억 달러의 자산을 관리하는 회사로 성장시켰다.

량원펑은 2019년부터 헤지펀드 투자 기법을 정교화하기 위해 AI 분야에 집중하기 시작했으며, 2023년 하이 플라이어의 AGI 연구 조직을 분사시켜 DeepSeek을 창업하였다. 그의 창업 목표는 바로 AGI였다. DeepSeek은 해외 유학파 없이 모두 중국 현지 출신으로 구성되어 있으며, 중국 내에서 AI 인재들에게 가장 높은 연봉을 제공하는 기업으로 알려져 있다.

량원펑은 지난해 한 인터뷰에서 중국 AI가 발전하려면 모방에서 벗어나 독창성을 가져야 하며 AI 생태계를 형성하는 것이 중요하는 것을 역설하였다.

DeepSeek의 주요 연구 결과

1. DeepSeek V2 (2024.06)

  • MoE기반 LLM: 총 236B의 파라미터. 토큰당 21B가 활성화됨

--

--

daewoo kim
daewoo kim

Written by daewoo kim

AI developer & Author | Working@semiconductor-industry. I write and share about what I learn.

No responses yet