DeepSeek R1 완전 분석: MoE + GRPO로 600만 달러에 o1급 추론 달성한 방법

TL;DR DeepSeek R1 모델과 MoE 아키텍처가 AI 비용 효율성의 패러다임을 전환했다. 기반 모델 V3를 600만 달러 미만으로 훈련하고, R1이 추론 특화 레이어를 추가해 GPT-4 수준의 수학·코딩 성능을 달성했다. 오픈소스 기반의 로컬 추론 확장을 가능하게 하며, 하드웨어 의존적이던 AI 개발 패러다임의 ‘스푸트니크 모멘트’다. 배경: AI 산업의 스푸트니크 모멘트 2023년 5월 설립된 DeepSeek는 기존 실리콘 밸리의 자본 … 더 읽기