전세계 AI업계 충격에 빠졌다…딥시크 뭐길래

중국 딥시크가 뒤흔든 세계 AI 패권전쟁, 우리가 가야 할 길은㊤ 

 

딥시크는 중국의 저장상 항저우에 본사를 둔 인공지능(AI) 전문 스타트업으로 2023년 5월 설립됐다딥시크는 지난 12월 대형언어모델(LLM, 텍스트 데이터에 특화된 생성형 AI)인 딥시크 V3’을 발표했고이어 1월에는 딥시크 V3를 미세 조정해 추론형 모델(복잡한 문제 해결과 논리적 사고에 특화된 AI)인 딥시크 R1’을 공개했다.

 

 

중국의 스타트업이 내놓은 AI가 전세계를 충격에 빠뜨린 이유는 무엇일까대형언어모델을 개발하려면 방대한 양의 텍스트 데이터를 처리하고 연산해야 한다이러한 연산을 처리하려면 고성능 반도체 칩이 필요하다이 때문에 거대 자본을 투입할 수 있는 미국의 빅테크 기업이 시장을 주도해 왔다그런데 딥시크는 대형언어모델인 V3를 개발하는데 비교적 저사양 반도체 칩을 사용했다.

 

미국은 AI 시장경쟁에서 주도권을 잃지 않기 위해 중국에 고성능 반도체 칩 수출을 통제하고 있다이에 딥시크가 V3의 모델 훈련에 사용한 반도체 칩은 엔비디아의 GPU인 H800으로, 2022년 8월에 개발돼 상대적으로 구형 제품이다엔비디아의 플래그십 GPU로 손꼽히는 H100보다 훨씬 성능이 떨어진다이뿐만이 아니다딥시크가 V3 훈련에 쓴 비용은 5576000달러(약 87억원)로 알려졌다오픈AI의 챗GPT 개발비용은 1400억원으로 추정되는데 이와 비교하면 20분의 1수준이다특히 딥시크의 추론형 모델인 ‘R1’은 오픈AI가 지난해 9월 공개한 ‘o1’과 비슷한 수준을 보여 화제가 됐다어떻게 적은 비용으로 이같은 성과를 낼 수 있었을까?

 

딥시크는 주어진 제약 아래 다양한 방법을 시도했다기존 AI와는 달리사람이 아닌 AI가 스스로 강화 학습을 하도록 해서 비용을 줄였다강화 학습이란 컴퓨터에 특정 환경을 제공하고, AI가 시행착오를 통해 스스로 배우며 발전하도록 하는 방식을 뜻한다강화 학습은 강아지 훈련과 비슷하다강아지도 올바른 행동을 하면 간식 등 보상을 주고잘못된 행동을 하면 무시하거나 벌을 준다이런 시행착오를 거치면 강아지는 어떤 행동을 하면 좋고 나쁜지 습득한다. AI도 좋은 답변은 높은 보상(일종의 평가 점수), 부적절한 답변은 낮은 보상을 받으며 점차 성능이 개선돼 최적의 답변을 찾아낼 수 있다보통 대형언어모델(LLM)은 대량의 텍스트 데이터를 학습하는 지도 학습을 기반으로 만든다강화 학습이 텍스트 생성 모델에서 쓰이지 않았던 것은 아니지만딥시크는 강화 학습을 주요 방식으로 사용했으므로 기존과는 다소 접근이 달랐던 셈이다.

 

또한 딥시크는 전문가 혼합(MoE, Mixture of Experts)’ 기법을 활용해 효율을 높이면서도 비용을 낮춘 것으로 알려졌다일반적인 AI 모델은 하나의 거대한 신경망이 모든 질문에 답을 하는 방식이다반면 MoE는 여러 개의 작은 신경망(전문가)을 따로 두고각각의 신경망이 특정한 역할을 수행하도록 하는 방식이다. AI는 질문을 받았을 때 그 질문에 가장 적합한 전문가 몇 개만 골라 활성화한다이렇게 하면 불필요한 연산을 줄이고 보다 효율적으로 AI를 운영할 수 있다.

 

 

딥시크의 행보가 더욱 매서운 이유는 딥시크가 자사의 AI 모델을 오픈소스로 내놓았다는 것이다오픈소스란 전세계 누구나 소스 코드를 자유롭게 수정하고 활용할 수 있도록 일반에 공개한 소프트웨어를 뜻한다많은 기업과 개인이 AI 기술을 학술적상업적 용도로 손쉽게 활용할 수 있고이 과정에서 AI를 더욱 효율적인 모델로 발전시킬 수 있다.

 

딥시크 AI는 공식 웹사이트(https://www.deepseek.com또는 애플 앱스토어 또는 구글 플레이에서 ‘DeepSeek’ 앱을 내려받아 사용할 수 있다GPT와 같이 질문을 입력하면 답변을 받아볼 수 있다화면 하단에 있는 딥씽크(R1)’ 버튼을 누르면 R1 모드가 활성화돼 질문에 관한 답변을 추론하는 과정을 보여주며체계적이고 밀도 있는 답변을 얻을 수 있다.

 

다만 종종 질문을 했는데 ‘The Server is busy. Please try again later.’라고 답할 수도 있다현재 사용자가 많아 서버가 포화됐거나 질문을 많이 했을 경우 이같은 답변이 나올 수 있다이럴 때는 잠시 후 질문하면 다시 답변을 받을 수 있다다만 중국과 관련해 민감한 질문을 했을 경우에도 이같은 방식으로 회피한다실제로 중국에서는 왜 인스타그램을 사용할 수 없어?’, ‘동북공정에 대해 알려줘와 같은 질문에 딥시크는 답변을 내놓지 않았다.

 

딥시크의 문제점은 또 있다다른 AI 서비스 대비 사용자의 개인정보를 광범위하게 수집하고수집한 정보를 중국 서버에 보관한다고 약관에 명시해 보안 우려를 낳고 있다이에 호주이탈리아대만은 딥시크 사용을 금지했으며 다른 나라도 딥시크에 대한 규제를 검토하고 있다우리나라도 내부 보안이 중요한 외교·통상 분야 정부 부처일부 공기업금융사가 딥시크의 업무 목적 사용을 금지하는 조치를 내렸다한편오픈AI는 딥시크가 챗GPT에서 대량의 데이터를 추출무단으로 도용해 AI를 개발했다는 의혹을 제기하며 조사에 착수한 상황이다중기이코노미 안수영 기자

 

<저작권자 ⓒ 중기이코노미. 무단전재 및 재배포 금지>