메타는 왜 모델이 아닌 '데이터 엔진'에 인력을 쏟나?
2026년 6월 16일 · 원문 보기
배경: 모델 경쟁의 다음 전장은 '데이터'
2025년 이후 글로벌 빅테크의 AI 경쟁은 '누가 더 큰 모델을 만드느냐'에서 '누가 모델을 더 잘 굴리느냐'로 무게중심이 빠르게 이동하고 있다. 파라미터 규모만으로는 더 이상 결정적 우위를 만들기 어렵다는 인식이 퍼지면서, 빅테크들은 모델 자체보다 모델을 둘러싼 인프라, 즉 고품질 데이터와 평가·튜닝 파이프라인에 자원을 집중하기 시작했다.
이런 흐름 속에서 메타가 첨단 모델 개발을 맡은 슈퍼인텔리전스 랩(MSL)을 지원하기 위한 별도의 응용 AI 엔지니어링 조직을 신설한 것은 상징적이다. 연구 조직과 별개로 '제품화·데이터 공급'을 전담하는 팀을 둔다는 것은, 메타가 AI 경쟁의 승부처를 모델 그 자체가 아니라 그 주변 생태계로 보고 있다는 신호다.
핵심 내용: 50명 단위의 수평적 '데이터 엔진' 조직
월스트리트저널(WSJ)이 내부 메모를 인용해 보도한 바에 따르면, 메타는 최대 50명 규모의 팀 여러 개로 구성된 새로운 AI 조직을 만들었다. 이 조직은 메타의 가상·증강현실 부문인 리얼리티 랩스를 이끄는 마허 사바 부사장이 총괄하며, 앤드루 보스워스 최고기술책임자(CTO)에게 직접 보고하는 체계로 운영된다.
주목할 점은 조직 구조다. 한 명의 매니저에게 최대 50명이 보고하는 '수평적(flat) 구조'를 채택했다. 중간 관리 계층을 최소화해 의사결정 속도를 높이고, 엔지니어 한 명 한 명이 실무에 집중하도록 설계한 것이다. 빠르게 변하는 AI 분야에서 관료제의 비효율을 걷어내려는 의도가 읽힌다.
'데이터 엔진'이란 무엇인가
메모에서 강조된 '데이터 엔진(data engine)'은 단순히 데이터를 모으는 작업이 아니다. 모델 학습용 데이터를 수집·정제하고, 모델 출력을 사람이 평가하며, 그 피드백을 다시 학습에 반영하는 순환 시스템 전체를 뜻한다. 모델을 한 번 만드는 것이 아니라, 계속 개선되도록 만드는 '발전소' 역할을 하는 셈이다. 이 조직이 MSL과 긴밀히 협력하는 이유가 바로 여기에 있다.
글로벌 관점에서 본 의미
메타의 이번 행보는 업계 전반의 패턴과 맞닿아 있다. 오픈AI와 구글 딥마인드, 앤스로픽 같은 선두 기업들도 이미 모델 연구팀과 별개로 데이터 큐레이션, 휴먼 피드백(RLHF), 평가 전담 조직을 대규모로 운영하고 있다. 모델 성능의 차이가 점점 '학습 데이터의 질'과 '평가 체계의 정교함'에서 갈리고 있기 때문이다.
또 하나 눈여겨볼 대목은 메타가 이 조직을 리얼리티 랩스 책임자에게 맡겼다는 점이다. 이는 AI가 더 이상 연구실의 산물이 아니라, 스마트 글래스·메타버스 같은 실제 제품에 녹아드는 '응용 기술'로 다뤄지고 있음을 보여준다. 연구와 제품의 경계가 허물어지고, AI 엔지니어링이 곧 제품 엔지니어링이 되는 시대로 접어든 것이다.
한국 AI 산업에 주는 시사점
한국 기업에게 이 사례는 두 가지 질문을 던진다. 첫째, '모델을 직접 만들 것인가, 잘 활용할 것인가'다. 거대 파운데이션 모델 경쟁에서 글로벌 빅테크와 정면으로 맞붙기는 현실적으로 어렵다. 그러나 양질의 한국어 데이터를 확보하고 이를 정제·평가하는 '데이터 엔진'을 갖춘다면, 특정 산업·언어 영역에서는 충분히 경쟁력을 가질 수 있다.
둘째, '조직 구조의 민첩성'이다. 메타가 중간 관리 계층을 줄인 수평 구조를 택한 것은 AI 분야의 속도전을 의식한 결과다. 의사결정이 여러 결재 단계를 거치는 전통적 대기업 구조로는 빠른 실험과 반복이 어렵다. 한국 기업들도 AI 조직만큼은 별도의 빠른 의사결정 체계를 마련할 필요가 있다.
결국 메타의 메시지는 분명하다. AI 경쟁의 본질은 '더 큰 모델'이 아니라 '모델을 끊임없이 개선하는 시스템'에 있다는 것이다. 데이터와 평가, 그리고 그것을 빠르게 돌리는 조직—이 세 가지를 갖춘 곳이 다음 라운드의 승자가 될 것이다.