Kalam News

中 DeepSeek 쇼크, 미국과 글로벌 AI 업계 강타

오늘(1월27일) 하루 세계 최고 뉴스는 단연 중국 인공지능, AI 업체 DeepSeek였다.

해당업체가 만들어내 공개한 AI 모델 DeepSeek R1이 현재 세계 최고인 ChatGPT와 거의 맞먹는 성능을 그 1/20도 안되는 저렴한 비용으로 선보이며 실리콘 밸리와 월가에 엄청난 충격을 안겨주고 있고 오늘 NY 주식시장 AI 관련 주가는 폭락했다.

그동안 중국이 AI 관련한 기술력 부문에서 미국보다 최소한 10년 이상 뒤진 것으로 여겨졌는 데 훨씬 저렴한 비용으로 대등한 성능을 보이는 혁신에 성공함으로써 AI 업계 미래가 대혼돈에 휩싸이게된 상황이다.

주형석 기자입니다.

DeepSeek의 등장은 미래에 AI를 개발하는 데 점점 더 많은 힘과 에너지가 필요할 수밖에 없을 것이라는 그동안 널리 퍼진 믿음에 반론을 제기할 수있게 됐다.

그래서 DeepSeek의 혁신에 대한 기대감이 커지고 투자자들이 이제 미국 경쟁사와 하드웨어 공급업체에 미치는 영향을 조금씩 이해하기 시작하면서 글로벌 기술 주가가 폭락했다.

DeepSeek은 AI 기반 양적 헤지펀드 High-Flyer의 수장인 량원펑 회장이 2023년에 설립한 스타트업 기업이다.

이 회사는 오픈소스인 AI 모델을 개발했는데, 오픈소스라는 것은 개발자 커뮤니티 전체가 무료로 소프트웨어를 검사하고 개선할 수 있다는 것을 의미한다.

DeepSeek의 모바일 앱은 이 달(1월) 초에 출시된 후 미국 iPhone 다운로드 차트에서 압도적으로 1위를 차지했다.

이 DeepSeek 앱은 OpenAI의 ChatGPT와 같은 다른 챗봇과 근본적으로 가장 구별되는 특징이 하나 있다.

바로 프롬프트에 응답하기 전에 자신의 추론 과정을 표현하는 것이다.

DeepSeek은 자신들이 개발해 출시한 R1 릴리스가 OpenAI의 최신 릴리스와 동등한 성능을 제공할 수있으며, 이 기술을 사용해 챗봇을 개발하고자 하는 개인에게 오픈소스를 통해 라이선스를 부여했다고 주장하고 있다.

이 때문에 실제로 DeepSeek R1의 성능이 어느 정도인지 OpenAI나 Meta AI와 비교하면 어떤지 궁금해하는 사람들이 많다.

DeepSeek에서 자세히 설명하지는 않았지만 지금까지 알려진 것으로는 DeepSeek의 모델 훈련과 개발 비용이 OpenAI나 Meta Platforms Inc.의 최고 제품에 필요한 금액의 일부에 불과한 것으로 보인다.

일부 언론 보도에서는 ChatGPT에 들어가는 비용의 1/20도 되지 않는 약 600만달러 정도의 비용으로 DeepSeek R1이 개발된 것으로 전해지고 있다.

그렇게 적은 비용으로 개발하는 데도 모델의 효율성이 훨씬 더 뛰어나 Nvidia Corp.와 같은 회사에서 최신의 가장 강력한 AI 가속기를 인수하기 위해 막대한 자본을 지출해야 할 필요성에 의문이 제기되고 있는 실정이다.

이러다 보니 DeepSeek이 대표하는 것과 같은 획기적인 진전을 막기 위해 중국으로의 첨단 반도체 수출 제한에 대한 관심도 커지고 있다.

미국은 AI를 미래 산업의 핵심으로 여기고 있고 그 AI에 대한 패권을 놓치지 않겠다는 의지가 매우 강하다.

그래서 도널드 트럼프 대통령도 AI 글로벌 패권 유지를 위해서 이른바 ‘스타게이트’ 프로젝트를 발표하면서 크게 기세를 올렸지만 DeepSeek R1 등장으로 AI 미래에 대한 불투명성이 커지고 말았다.

DeepSeek은 R1이 수학 과제를 위한 AIME 2024, 일반 지식을 위한 MMLU, 질문과 답변 성능을 위한 AlpacaEval 2.0과 같은 여러 주요 벤치마크 부문에서 경쟁 모델과 비슷하거나 더 뛰어나다며 앞으로 있을 경쟁에 자신감을 나타내고 있다.

또한 Chatbot Arena라는 UC Berkeley 계열 리더보드에서도 상위권에 올랐다.

현재 미국은 중국에 GPU 반도체와 같은 하이엔드 기술의 수출을 금지하여 중국의 AI 발전을 저지하기 위해 온갖 제한들을 가하고 있다.

그만큼 AI는 미중 기술 우위 경쟁에서 핵심 전선으로 꼽히고 있다.

하지만 DeepSeek의 진전은 중국 AI 엔지니어들이 이런 미국 측의 제한을 우회해 갈 수있음을 보여준 결과이고 제한된 리소스로 더 큰 효율성에 집중하고 있음을 시사하고 있어 충격적이다.

DeepSeek이 미국의 이러한 각종 제한을 뚫고서 얼마나 많은 고급 AI 훈련 하드웨어에 접근할 수 있었는지는 불분명하지만, DeepSeek은 무역 제한이 중국의 발전을 방해하는 데 그렇게 효과적이지 않았다는 것을 보여주고 있어 미국 측이 이제 어떻게 대응할지 관심이 모아지고 있다.