AlphaGo의 충격 그 이상.. ChatGPT의 충격

16 min readFeb 4, 2023

OpenAI의 ChatGPT가 출시 2달만에 월 사용자 1억명을 돌파했다고 한다. 투자은행 UBS는 ChatGPT가 1월에 월간 활성 사용자 수(1달동안 한번이라도 접속한 사람의 수) 1억명을 돌파한 것으로 추정했다. 이렇게 화제를 모왔던 AI service는 ChatGPT가 최초이자 다른 서비스에서도 없었던 일이다.

AI의 겨울에서 다시 여름으로

OpenAI는 지난해 말 ChatGPT를 선보이면서 AI에 대한 대중들의 관심를 재점화하였다. 몇몇 전문가들과 블로거들은 기다렸다는 듯이 3번째 AI의 겨울이 오고 있음을 경고하고 있었던 때였다.

GPT-3 이후 Generative AI에 대한 관심이 고조되었지만, 실제로 상용화 서비스 시점은 알 수 없었다. 자율주행차는 각 메이커들이 약속한 상용화 시점인 2021년을 훌쩍 넘겼으며 레벨-3 수준의 자율주행차도 출시되지 않았다. 더 이상 CES 2023에서 자율주행 차량은 화제꺼리가 되지 않는 상황이었다.

AI의 겨울은 투자가 줄어든다는 것이고 AI 스타트업은 죽음을 의미한다. AI의 발전을 위해선 대중의 관심이 필요했고, 대중의 관심을 받지 못하면 AI는 긴 겨울에 들어가곤 하였다. 대중들로 하여금 AI에 대한 관심을 끄는데 가장 효과적인 것은 역시나 인간과 기계의 대결과 같은 이벤트였다.

IBM Deep Blue vs Gary Kasparov

첫번째 AI와 인간의 대결은 체스였다. IBM은 세계 체스 챔피언 카스파로프와 대결을 추진하여 IBM의 Deep blue 슈퍼컴퓨터가 1996년에 1승 2무 3패로 패배하였지만, 이듬해인 1997년에 2승 3무 1패로 승리를 거두는데 성공하였다.

그 당시만하더라도 아직까지 컴퓨터가 인간의 두뇌를 뛰어넘지 못 할 것이라는 것이 대중의 인식이었다. 하지만 IBM의 Deep Blue가 체스에서 거둔 것이었다. 이 당시 IBM의 Deep Blue는 세계 259위 슈퍼컴퓨터였다.

내가 대학을 재학 중이라서 당시 국내 신문과 방송들 또한 IBM Deep Blue의 승리를 대대적으로 보도하였던 것이 기억난다.

Source: What Is Intelligence? 20 Years After Deep Blue, AI Still Can’t Think Like Humans https://www.livescience.com/59068-deep-blue-beats-kasparov-progress-of-ai.html

IBM Watson의 TV 퀴즈쇼 Jeopardy 우승

두번째 인간과 AI의 대결은 체스 게임이 아닌 퀴즈 대결이었다. IBM의 슈퍼컴퓨터 Watson은 2011년 TV 유명 퀴즈쇼 제퍼디(Jeopardy!)에 출연하여 인간 퀴즈 챔피언 켄 제닝스와 브래드 루터를 압도하며 승리하였다. 1997년에 체스에서 인간을 승리한 후 14년만의 일이었다.

Watson이 인간의 언어를 실시간으로 분석해야 하기 때문에 체스보다 어려운 과정이었다. 이후 Watson는 큰 기대를 받으며 헬스케어 등에 적용되었으나 실제로는 낮은 신뢰성으로 인해 더이상 사용되지 못하고 시장에서 퇴출되었다.

AlphaGo의 충격

세번째 인간과 AI의 대결은 체스와 비교할 수도 없이 더 복잡한 경우 수를 계산해야 하는 바둑이었다. 구글은 AlphaGo를 내 세워 이세돌과 대결하여 4대 1로 승리하였다. TPU v1 48개를 사용한 결과였다.

이세돌과 AlphaGo의 첫번째 대국이 이었던 16년 3월 9일은 나 또한 생생히 기억하고 있다. 그 당시 이사한지 얼마되지 않아 집정리를 하느니라 대국 중계를 직접 보지는 못 했지만 나 또한 당연히 이세돌이 이길 것으로 생각하다가 뒤늦게 인터넷에서 네티즌들이 난리가 난 사실을 알았다.

1국을 AlphaGo가 이긴 것이다. AlphaGo의 승리는 위 두 가지 경우보다 대중들에 더 큰 반향을 미쳤다. 이때부터 AI가 인간을 뛰어넘을 것이라는 전망이 나오기 시작하였다.

“이겼다. 우리는 달에 착륙했다.”

구글 딥마인드 데미스 하사비스 최고 경영자가 한 말이다.

ChatGPT 서비스 가입방법

현재 openAI는 무료로 ChatGPT를 베타서비스 하고 있다. ChatGPT의 사용법은 어렵지 않다.

https://chat.openai.com 에서 ChatGPT 계정을 만든 후 사용 가능하다. (계정을 만들 때 구글 또는 MS의 계정으로 가입하고, 휴대폰 번호 인증이 필요하다.)

인증 후 초기 ChatGPT 화면에서 다음과 같은 안내문이 나오고 마지막 “Done” 버튼을 선택하면 사용할 수 있는 준비가 되었다.

ChatGPT의 안내문을 정리하자면..

시스템 향상을 위해서 openAI의 AI trainer들이 리뷰를 한다는 것, 이 때문에 민감한 정보에 대해 공유하지 말 것을 권고하고 있다.
ChatGPT의 응답이 좋거나 도움이 되지 않는다면 알려달라고 한다.

이제 ChatGPT를 사용할 준비가 되어있다. ChatGPT의 초기화면에 ChatGPT의 제한 사항부터 눈에 들어온다.

때때로 부정확한 정보를 생성할지 모른다.
때때로 해로운 명령이나 편향된 컨텐츠를 생성할지 모른다.
2021년 이후 세계와 사건에 대해 제한된 지식을 가진다.

ChatGPT를 사용해보자!

이제부터 간단한 질문부터 시작하기로 하자. 사실관계를 판단하기 위해 필요에 따라 구글 검색도 병행하였다.

먼저 ChatGPT에게 자신이 할 수 있는 일에 대해 물어봤다. “Chat”이란 접두어가 붙어서 단순한 chatbot 정도로 생각할 수 있지만 훨씬더 많은 일을 할 수 있다. ChatGPT가 설명한 것처럼 5가지 케이스에 대해 테스트를 해보았다.

1)질의 응답(Question Answering)

[대중음악 질문]

내 블로그 명(moon-walker)의 주인공 마이클 잭슨에 대해 질문해봤다. 그의 생애를 요약해주었다.

추가 질문을 해봤다. 한글 문장이 매끄럽지 못하지만 대충 맞는 사실이다. 정확하게 말하자면 Propofol 중독이 아닌 “과다복용”으로 인한 사망이 맞다.

ChatGPT가 이전 질문을 기억하는지 마이클 잭슨을 대명사로 다시 질문하였다. 질문의 ‘그’가 마이클 잭슨인지 정확히 알고 있습니다.

한글로 질문한 것과 영어로 질문한 것을 비교해봤다. 대답 내용도 좀더 풍부해졌다. 또한 “팝의 황제”라는 호칭이 있느냐 없느냐에 따라 질문도 달라지는 것을 알 수 있다. (OpenAI가 다국어 처리를 어떻게 하는지에 대해 좀더 확인해볼 필요가 있다.)

[스포츠 질문]

호불호가 있는 질문을 해봤다. ChatGPT는 주관적인 대답을 회피하고 있다. (개인적인 의견으로 메시는 이번 월드컵 우승으로 인해 축구의 신이 되었다. 이젠 호날두가 비빌 상대가 아니다.)

추가적으로 2022년 월드컵에 대해 질문을 해봤다. 역시나 2022년도 데이터를 학습하지 못했다.

[과학 질문]

요즘 천문학에 관심이 많아 천문학 서적이나 천문학 유튜버의 영상을 보곤 한다. 토성의 고리가 생긴 이유에 대해 물어봤다.

뭔가 그럴듯하지만 하나씩 사실관계를 따져보면 사실이 아니다. (약간 실망감이 든다..)

Google 검색을 통해 사실 확인을 해봤다. Google은 한국천문연구원(KASI)의 홈페이지를 상단에 노출하고 bold체로 토성의 고리가 생긴 이유에 대해 알려준다. (역시 구글 God…)

[공학 질문]

지난 블로그 글에 대해 질문을 해봤다. 비교적 정확하게 설명하고 있다. (오..) ChatGPT로 논문을 작성할 날도 멀지 않은 것 같다.

2) 자연어 생성 (Language Generation)

영화 대부 part-1의 스토리를 마이클 콜레오네가 아닌 소니 콜레오네가 돈 콜레오네가 되는 스토리 라인으로 바꿔달라고 요청하였다.

ChatGPT는 소니의 다혈질에 충동적인 성격을 알고 있어서 새로운 스토리라인을 작성해줬습니다. 만일 질문 prompt를 좀더 세밀하게 적었다면 좀더 재밌는 스토리라인이 나왔을 것이다.

화제가 되고 있는 ChatGPT의 coding 실력을 실험해봤다. 간단한 프로그램은 순식간에 생성해냈다. Github의 코드 또한 학습했나 보다.

그럼 좀더 복잡한 코드에 대해 요청했다.

아래는 ChatGPT가 작성한 코드이다. 놀랍지 않은가? 이제 프로그래머의 고연봉 시대도 조만간 끝날 날이 올지도 모르겠다. (실제 돌려보고 동작 유무에 대해 확인할 계획이다.)

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

# Initialize a ResNet model
model = ResNet(BasicBlock, [2, 2, 2, 2], num_classes=10)

# Define a loss function and optimizer
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

# Load the MNIST dataset
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307,), (0.3081,))
])
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=100, shuffle=True, num_workers=2)

# Train the model
for epoch in range(10):  # loop over the dataset multiple times
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
    print('Epoch %d loss: %.3f' % (epoch + 1, running_loss / len(trainloader)))

print('Finished Training')

3) 텍스트 요약 (Text Summation)

ZDNET 기사 중에서 Amazon Fire HD 10 Plus에 대해서 요약을 요청하였다. 어떤가? 이제 기자의 밥줄도 끊어질 날이 얼마 남지 않은 것 같다.

The 7 best cheap tablets of 2023

Tablets are a handy tool, whether you're trying to keep up with your favorite shows, take notes on the go, or just want…

www.zdnet.com

4) 감정 분석 (Sentiment Analysis)

기분이 좋아지는 80년대 팝을 추천해 줄 것을 요청하자 ChatGPT는 내 감정을 이해하고 비교적 신나는 대중적인 80년대 팝을 추천해주었다. (단, Uptown Funk는 2014년도 노래이다. 아직까지 완벽하지는 않은 것 같다.)

또한 내가 추천에 대해 감사를 표현하자 그에 대한 그럴듯한 답변을 생성해 놓았다.

5) 대화 생성 (Conversational Modeling)

위의 대화를 이어나가기로 했다. 아직까지는 사실을 나열하는 느낌이 난다. 그리고 AI 모델은 감정까지 학습하지 못하는 대답을 생성하였습니다. 아직까지 AI 모델에 Personalization을 적용하는 것은 무리가 있는 것 같다.

ChatGPT의 한계

OpenAI 는 그들의 블로그에서 ChatGPT의 한계점을 명확하게 밝히고 있다.

ChatGPT: Optimizing Language Models for Dialogue

We've trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for…

openai.com

OpenAI가 지적한 ChatGPT의 한계 외 직접 ChatGPT를 사용하면서 느낀 한계점은 다음과 같다.

1) 최신정보의 부재

GPT-3는 21년도 데이터만을 가지고 있다. 22년도에 대한 사실에 대해 물어본다면 제대로된 답변을 할 수 없을 것이다. 하지만 이러한 문제는 시간이 지날 수록 데이터셋을 확보하여 해결할 수 있을 것으로 보인다.

2) Hallucination

사실이 아닌 것을 사실인 것처럼 대답할 수 있다. 마치 환각에 빠진 사람이나 망상에 빠진 사람처럼 근거가 없는 이야기를 사실인 것처럼 이야기할 수 있다. 이는 ChatGPT를 사용하는 사용자들이 한결같이 지적하고 있는 점이다.

따라서 최근 가짜 뉴스가 판치는 세상에 ChatGPT가 기름을 붓는 나비효과를 가져올 수 있다. 세상을 선동하는 매체들은 약간의 사실과 다수의 거짓을 적당히 혼합하면 대중들을 선동하는데 충분하다라는 것을 잘 알고 있다. 교묘한 사실 왜곡에 ChatGPT가 충분히 사용될 수 있을 것이다.

3) 개인 맞춤형 대화 지원이 어려움

OpenAI 의 설명으로는 아직까지 ChatGPT가 이전 대화를 기억할 수 정보량은 한계가 있다. (현재는 최대 약 3천 단어) 이전 대화를 기억하는 것은 사용자에 적합한 대답을 생성하고 개인화된 대화를 위해 반드시 필요하다.

4) 특별히 혁신적이지 않음

ChatGPT가 혁신적인 것이냐라고 질문하였을 때, 대중에게는 이전에 보지 못한 것이라 혁신적이라고 생각할지 모르지만, ChatGPT의 기술은 특별하게 비밀스러운 것이 아니다. 개인적으로 ChatGPT의 성공 비결은 혁신의 결과보다는 사용자가 사용할 수 있는 API 수준으로 재빨리 제공한 것이라고 생각된다.

Meta의 수석 AI 과학자인 얀 르쿤은 지난 1월 Zoom을 통해 언론과 경영진과 진행한 소규모 모임에서 “ChatGPT는 기본 기술 측면에서 특별히 혁신적이지 않다”라고 하였다.

ChatGPT는 OpenAI만 만들 수 있는 기술이 아니라 Google과 Meta, 6개의 신생기업들도 가능한 기술이라는 것이다. ChatGPT에 사용된 Self-Supervised Learning, Transformer는 OpenAI만의 고유한 기술이 아니며 여러 연구자들과 기업이 만든 기술임은 강조한다.

얀 르쿤은 ChatGPT를 2011년 Jeopardy 쇼에서 우승한 IBM의 왓슨 컴퓨터와 DARPA의 2005년 자율주행 challenge에서 우승을 한 Sebastian Thrun와 비교하였다. 그는 ChatGPT를 “특별히 기존 과학에 비해 특별한 것은 아니지만 매우 잘 만든 공학이다”로 설명한다.

“그렇다면 왜 Google과 Meta는 ChatGPT와 같은 제품을 출시하지 않는 것인가?”에 대해 얀 르쿤은 “두 회사가 그러한 물건을 내놓았을 때 잃을게 많다는 것이다.”라 이야기한다.

예를들어 구글 Deepmind의 스패로우는 ChatGPT가 가지고 있지 못한 “출처 인용 기능”을 갖췄다. ChatGPT는 실제로 모든 물음에 대답할 때 인용이나 근거를 제시하지 않아 인간이 정확한 정보인지 아닌지 판단할 수 있는 근거가 없다.

만일 구글이 검증되지 않은 정보를 대답하는 설익은 Generative AI를 출시하였을 때, 가짜 뉴스와 정보에 온상이 된다면 구글은 비난을 피할 수 없게 된다. OpenAI와 같은 스타트업과는 시장에서의 위치와 입장이 다르다는 것이다.

총평

ChatGPT는 혁신적인 기술이기 보다는 적절한 시점에 사용자가 쉽게 사용할 수 있도록 제공하여 많은 사용자가 AI 발전을 실감하게 만들었다. 앞에서 이야기한 IBM의 Deep Blue, Watson, Google의 AlphaGo는 일반적인 사용자가 직접 사용할 수 있는 서비스가 아니었기 때문에 ChatGPT 만큼의 AI가 우리의 삶을 어떻게 바꿀지에 대한 비전을 보여주기엔 화제성이나 비전이 부족하였다.

OpenAI가 곧 ChatGPT를 유료화한다고 한다. ChatGPT가 앞서 언급했던 문제점을 어떻게 해결하였는지 궁금하다. 유료화를 시작하는 순간 그동안 우호적인 사용자들이 ChatGPT의 결과물에 대한 환호가 순식간에 비난으로 바뀌는 것도 가능하기 때문에 유료화 이후의 ChatGPT가 생성하는 출력들이 얼마나 사실과 가까울지, 혐오와 가짜뉴스를 어떻게 걸러낼지에 따라 ChatGPT의 성공과 실패를 가를 것으로 예상된다.