• 최종편집 2025-02-10(월)
  • 로그인
  • 회원가입
  • 지면보기
  • 전체기사보기
 
brain .jpg
이미지 그래픽이다.(그래픽=저널인뉴스)

 

중국의 AI 스타트업 딥시크가 개발한 언어 모델 V3와 추론 모델 R1이 오픈AI, 메타, 앤스로픽 등 글로벌 AI 선도 기업의 모델을 성능에서 능가하며 주목받고 있다. 


딥시크는 2022년 12월 대규모 언어 모델 V3를 공개했고 2025년 1월 20일에는 추론 특화 모델 R1을 발표했다. 


딥시크는 자체 기술 보고서에서 V3가 22개의 평가 테스트 중 13개 부문에서 경쟁 모델보다 우수한 성능을 보였다고 밝혔다.


딥시크 V3는 500개의 선별된 수학 문제를 푸는 테스트(MATH-500)에서 90.2%의 정확도를 기록하며 오픈AI GPT-4o와 메타 라마 3.1의 80%를 넘어섰다. 


다중 언어 코드 생성 평가(HumanEval-Mul)에서도 82.6%의 정확도를 보이며 GPT-4o(80.5%)와 라마 3.1(77.2%)을 앞질렀다. 


대규모 멀티태스크 언어 이해 능력을 평가하는 테스트(MMLU)에서는 89.1%의 정확도로 클로드 3.5 소네트(88.9%)를 넘어섰다. 


수치 추론과 정보 추출 능력을 평가하는 DROP 테스트에서는 91.6%의 정확도를 기록했고 중국어 기반 테스트(C-Eval)에서도 다른 모델이 10점대를 기록한 것과 달리 43.2%의 높은 점수를 받았다.


추론에 특화된 모델 딥시크-R1은 미국 수학경시대회(AIME) 2024 벤치마크 테스트에서 79.8%의 정확도로 오픈AI 추론 모델 o1(79.2%)을 앞질렀다. 


500개의 수학 문제 테스트에서는 97.3%의 정확도를 기록했고 복잡한 다중 질문 테스트(FRAMES)에서도 82%로 o1(76.9%)을 능가했다.


스케일AI의 알렉산더 왕 CEO는 딥시크의 성능이 미국의 최고 AI 모델과 동등하거나 그 이상이라고 평가했다. 


마이크로소프트의 사티아 나델라 CEO도 딥시크의 모델이 추론 연산에서 효과적이며 슈퍼컴퓨팅 효율성이 뛰어나다고 평가했다.


딥시크의 이러한 성과는 AI 분야에서 중국의 기술력이 글로벌 시장에서 점차 중요한 위치를 차지하고 있음을 보여준다. 


특히 딥시크의 모델이 수학적 추론, 다중 언어 이해, 복잡한 문제 해결 능력에서 두각을 나타내며 AI 산업의 경쟁 구도에 지각변동을 일으킬 가능성이 높다.

태그

전체댓글 0

  • 84545
비밀번호 :
메일보내기닫기
기사제목
중국 AI 스타트업 딥시크, 글로벌 경쟁 모델 능가
보내는 분 이메일
받는 분 이메일