2026 피지컬AI 대폭발: LLM 다음 초거대 시장 개막

13–20 minutes

·

·

[티타임즈TV]
“LLM과 비교할 수 없는 규모 시장이 열린다” (강정수 박사)

2026년 ‘피지컬AI’가 진짜 화두가 되는 이유: LLM 다음 판이 ‘현실 세계’로 열리는 중

오늘 글에는 이런 핵심이 들어 있어요.

1) 왜 “LLM으로는 한계”라는 말이 이제 설득력을 얻는지

2) 피지컬AI·월드모델이 열 시장 규모(TAM)가 왜 비교 불가인지

3) 빅테크(테슬라·구글·메타·베조스)와 중국이 각각 어디에 베팅하는지

4) “결국 승부는 데이터와 추론칩”이라는 구조가 왜 중요한지

5) 국내 기업/투자 관점에서 진짜 체크해야 할 포인트가 뭔지

1) 뉴스 브리핑: 지금 무슨 일이 벌어지고 있나

한 줄 요약

LLM이 “디지털 세계의 대리인”이라면, 피지컬AI는 “현실 세계의 노동과 생산을 대체/증폭”시키는 판이라서, 시장 크기와 파급력이 급이 다릅니다.

핵심 흐름(원문 기반 재정리)

LLM은 텍스트/이미지/영상 생성까지 와서 디지털 업무를 빠르게 대체 중입니다.

그런데 LLM은 현실에서 “만져본 적도, 냄새 맡아본 적도, 넘어져본 적도” 없어요.

즉 “다음 토큰(단어/프레임) 예측”만으로는 현실 행동의 안정성과 신뢰도에 벽이 생깁니다.

이 벽을 넘는 키워드가 피지컬AI(몸 가진 AI)와 월드모델(현실을 시뮬레이션으로 이해/예측하는 엔진)입니다.

2) 피지컬AI vs 월드모델: 같은 말 같지만 역할이 다르다

월드모델(World Model)

현실의 물리 법칙을 포함해 “세상이 어떻게 굴러가는지”를 시뮬레이션/예측하는 기반 모델입니다.

원문 비유대로 말하면 ‘언리얼 엔진’ 같은 엔진에 가깝습니다.

피지컬AI(Physical AI)

월드모델을 바탕으로 실제 세계에서 “인지→계획→행동”을 수행하는 에이전트/로봇/자율주행 시스템입니다.

엔진 위에 올라가는 ‘게임(서비스)’ 쪽에 더 가깝죠.

왜 이 구분이 중요하냐

월드모델은 데이터를 증폭(합성 데이터)시키고 실패비용을 낮추는 핵심 인프라가 됩니다.

피지컬AI는 안전 문제 때문에 “성공률”이 곧 상용화의 문턱입니다.

3) LLM과 피지컬AI의 결정적 차이: “다음 단어” vs “다음 행동”

LLM

다음 단어/문장/이미지 프레임을 예측합니다.

틀리면 보통은 ‘환각’이나 ‘품질 저하’로 끝납니다.

피지컬AI

다음 “행동”을 예측합니다.

틀리면 커피 쏟음 수준이 아니라, 사람 부상/장비 파손/사망까지 이어질 수 있습니다.

그래서 피지컬AI가 느릴 수밖에 없는 이유

성공률 20~40%는 ‘연구 데모’로는 그럴듯해도, 현실 배치에선 위험합니다.

유튜브에 보이는 로봇 영상은 대부분 “수십 번 중 성공 샷만 편집”일 확률이 높습니다.

4) 시장 규모(TAM)가 LLM과 비교 불가라는 말의 진짜 의미

LLM의 주 무대

문서/코딩/콘텐츠/커머스/챗 기반 서비스 등 디지털 경제 중심입니다.

피지컬AI의 주 무대

제조, 물류, 농업, 건설, 가사, 간병/의료 보조, 자원 채굴 등 ‘현실 노동’ 전체입니다.

여기는 공급망 자체가 바뀌고, 생산성 쇼크가 발생하면 물가/임금/성장률까지 흔듭니다.

결국 거시경제(글로벌 공급망, 인플레이션, 생산성) 레벨에서 영향이 커집니다.

5) 빅테크 ‘영웅’들이 몰리는 이유: 돈이 아니라 “판의 구조” 때문

공통 결론

피지컬AI는 한 번 성공하면 방어력이 생깁니다.

이유는 데이터, 칩, 배치 환경, 안전 인증이 쌓일수록 후발주자가 따라오기 어렵기 때문입니다.

즉 네트워크 효과보다 더 강한 “현실 운영 데이터의 복리”가 작동합니다.

주요 플레이어 구도(원문 기반)

1) 테슬라

FSD에서 쌓은 데이터를 월드모델로 증폭하고, 로봇(옵티머스)로 확장하려는 풀스택 전략입니다.

하드웨어(카메라 위치 등)와 소프트웨어를 결합해 최적화합니다.

추론칩도 AI4→AI5(예정)→AI6(계획)처럼 로드맵을 깔아두는 중입니다.

2) 구글

Gemini Robotics 등 “행동하기 전에 추론한다(계획)”를 전면에 둡니다.

다만 성공률이 낮고(원문 언급 20~40% 수준), 안전 신뢰도가 최대 장벽입니다.

3) 메타 + 얀 르쿤 라인

“LLM만으로 AGI는 불가능” 쪽에 강하게 서 있고, 월드모델/피지컬AI 결합이 필수라고 봅니다.

핵심은 ‘언어’가 아니라 ‘현실 세계 이해’로 지능의 바닥을 넓히는 접근입니다.

4) 제프 베조스(프로젝트 프로메테우스)

로봇 자체보다 “브레인(두뇌)”을 만드는 쪽에 집중합니다.

흥미로운 건 중간 단계 수익 모델로 ‘초대형 디지털 트윈’을 먼저 겁니다.

블루오리진(우주)과 자동차 부품 설계/소재 개발로 바로 비용을 아끼고 성과를 만드는 구조죠.

이건 단순 연구가 아니라, 산업용 시뮬레이션 시장을 선점하는 전략입니다.

5) 중국

겉으로는 “로봇 몸(하드웨어)” 데모가 폭발적으로 나옵니다.

국가 전략으로 스타트업을 대량 육성 후 구조조정해 소수만 남기는 방식(전기차 때 하던 패턴)입니다.

다만 쇼맨십 데모가 곧 브레인의 신뢰도를 보장하진 않습니다.

6) 기술 인프라 2대 축: ‘추론칩’과 ‘데이터’가 승패를 가른다

(1) 추론칩이 핵심인 이유

피지컬AI는 주변 상황(빛, 마찰, 장애물, 소리, 기울기, 내 손의 위치 등)을 실시간으로 계산해야 합니다.

이건 데이터센터 학습(Training)만이 아니라, 현장 추론(Inference)이 고성능이어야 한다는 뜻입니다.

그래서 “로봇/차량마다 고성능 추론칩이 붙는다”는 구조가 만들어집니다.

결국 반도체 산업과 AI 인프라 경쟁이 더 직접적으로 연결됩니다.

이 구간은 금리와 무관하게 CAPEX가 계속 붙는 영역이라, 시장은 AI 투자 사이클을 ‘장기 인프라 투자’로 보기 시작합니다.

(2) 데이터가 더 큰 병목인 이유

피지컬AI는 LLM보다 데이터가 훨씬 더 필요합니다.

그런데 현실 데이터는 구하기가 어렵고, 위험하고, 환경이 제각각이라 일반화가 어렵습니다.

그래서 월드모델/시뮬레이터로 합성 데이터를 만들지만, “원재료(실제 데이터)”가 적으면 증폭해도 한계가 있습니다.

7) 데이터 산업이 따로 커진다: “합성 데이터 공급망”이 본게임

원문에서 특히 중요한 대목

피지컬AI 경쟁은 로봇 하드웨어만이 아니라, 훈련 데이터를 만드는 생태계가 함께 커진다는 겁니다.

대표 축

엔비디아 Omniverse 같은 시뮬레이션/디지털 트윈 플랫폼이 중심축 역할을 합니다.

데이터 전환을 시작한 회사들(원문 언급)

Decart: 생성 기반/합성 데이터로 피지컬AI 훈련용 데이터 공급 쪽으로 성격 전환

Runway: 영상 생성 기술을 피지컬AI 훈련 데이터 공급 비즈니스로 확장

Niantic: 위치 기반/현장 이미지 데이터 기반으로 공간 데이터 자산화

테슬라의 ‘유튜브 학습’이 무서운 이유

관찰 학습(Observational Learning)이 3인칭 영상까지 제대로 풀리면 데이터 병목이 크게 풀립니다.

이게 “성공하면 스타트업 다 죽을 수 있다”는 말의 핵심이고, 데이터 소스 자체를 갈아엎는 게임 체인저입니다.

8) 다른 뉴스/유튜브에서 잘 말 안 하는 ‘진짜 중요한 포인트’만 따로 정리

포인트 A: 피지컬AI의 첫 수익은 ‘로봇 판매’가 아닐 가능성이 크다

베조스 사례처럼 “부품 설계/소재 개발/디지털 트윈 기반 비용 절감”이 먼저 돈이 됩니다.

즉 로봇 대중화 이전에 B2B 시뮬레이션이 현금흐름을 만들 수 있습니다.

포인트 B: 성공률(신뢰도) 문제는 모델 성능이 아니라 ‘산업 안전’ 문제다

피지컬AI는 규제, 보험, 책임소재가 붙는 순간 확 속도가 느려집니다.

따라서 “데모 영상”보다 “현장 배치 후 무사고 시간”이 진짜 KPI가 됩니다.

포인트 C: 한국이 놓치기 쉬운 함정은 ‘하드웨어 집착’이다

액추에이터, 배터리, 센서도 중요하지만 그것만으로는 승부가 안 납니다.

브레인(인지·계획·행동)과 데이터/시뮬레이션 파이프라인이 없으면 글로벌 표준에 종속될 가능성이 큽니다.

포인트 D: 거시경제 관점에서 피지컬AI는 ‘생산성 쇼크’와 연결된다

피지컬AI가 물류/제조에서 실사용되면 인건비 구조가 바뀌고, 공급망 병목이 줄고, 인플레이션 압력이 구조적으로 바뀔 수 있습니다.

이건 단순 기술 트렌드가 아니라 글로벌 공급망 재편의 도구가 됩니다.

포인트 E: 투자 관점에서 “로봇 관련주”와 “피지컬AI 수혜”는 다를 수 있다

단순 로봇 부품 테마와 달리, 실제 가치가 생기는 곳은 추론칩, 시뮬레이션, 데이터 파이프라인, 안전/검증, 운영 소프트웨어입니다.

테마가 아니라 밸류체인을 기준으로 봐야 합니다.

9) 2026 체크리스트: 이렇게 보면 흐름이 한 번에 잡힌다

체크 1

상용화의 신호는 “더 화려한 데모”가 아니라, 제한된 공간(물류창고/공장)에서의 장시간 무사고 운영입니다.

체크 2

추론칩 단가 하락과 탑재 확산이 실제 CAPEX 지표로 찍히는지 봐야 합니다.

체크 3

합성 데이터 기업과 시뮬레이션 플랫폼이 ‘로봇 기업’보다 먼저 커질 수도 있습니다.

체크 4

미국은 브레인 중심, 중국은 바디 중심으로 보이지만, 결국 결합이 되는 순간 승부가 납니다.

체크 5

한국은 AI 인프라와 데이터센터, 그리고 산업 현장 데이터 확보 전략이 없으면 “부품 공급국”으로 고착될 수 있습니다.

< Summary >

피지컬AI는 LLM이 못 하는 ‘현실 세계의 행동’을 다루기 때문에 시장 규모가 훨씬 크고, 안전 신뢰도가 상용화의 문턱이다.

월드모델은 현실을 시뮬레이션으로 이해하고 합성 데이터를 만들어주는 엔진이고, 피지컬AI는 그 위에서 움직이는 실행체다.

승부는 로봇 몸체보다 추론칩과 데이터(특히 합성 데이터 파이프라인)에 더 크게 걸려 있다.

테슬라·구글·메타·베조스가 각기 다른 방식으로 뛰어들고 있고, 중국은 국가 전략으로 대량 육성 후 구조조정 모델을 반복 중이다.

한국은 하드웨어만으로는 부족하고, 데이터/시뮬레이션/브레인 경쟁에 참여하지 못하면 글로벌 플랫폼에 종속될 가능성이 높다.

[관련글…]


[지식인사이드]
[제임스 카메론 인터뷰] 터미네이터 만든 거장, 영화에 AI를 ‘1초도’ 쓰지 않겠다 선언한 이유

제임스 카메론 “영화에 생성형 AI, 1초도 안 쓴다” 선언이 진짜 무서운 이유(그리고 이게 콘텐츠 산업·경제에 던지는 신호)

오늘 글엔 딱 세 가지가 들어있어요.

첫째, 제임스 카메론이 “AI를 1초도 쓰지 않겠다”고 말한 핵심 논리(‘기술 혐오’가 아니라, 제작 생태계 방어라는 관점).

둘째, 숏폼 시대에 187분짜리 영화를 고집한 이유가 ‘극장 산업 회복’이 아니라 ‘소비 방식의 통제권’ 싸움이라는 포인트.

셋째, 다른 인터뷰/리뷰에서 잘 안 짚는 “AI가 싸게 만들어주는 영화”가 결국 산업 전체 비용 구조와 일자리, 그리고 IP 가치에 어떤 충격을 주는지까지 정리.

1) 뉴스 요약: 인터뷰에서 나온 핵심 발언만 뽑아보면

① “기술이 아니라 연기가 시작점이다”

카메론은 사람들이 아바타를 두고 “저 기술이 뭔가요?”라고 묻지만, 본질은 “연기(acting)”라고 못 박아요.

퍼포먼스 캡처(performance capture)는 기술을 ‘추가’하는 게 아니라, 배우의 연기를 방해하는 요소를 ‘치우는’ 도구에 가깝다고 설명합니다.

즉, 관객이 ‘진짜같다’고 느끼는 건 렌더링 이전에 배우의 감정과 리듬이 먼저라는 주장입니다.

② 세계관 제작은 ‘문화+디자인+수천 명의 아티스트’로 굴러간다

판도라의 문화는 특정 원주민 문화를 그대로 가져오지 않고, 여러 문화적 모티프를 섞어(그의 표현대로 “블렌더에 넣듯”) 독자적 문양과 기술을 만든다고 해요.

의상도 CG라서 대충 만드는 게 아니라, 실제로 제작해 움직임과 무게감을 테스트하고 다시 CG로 옮깁니다.

③ “생성형 AI는 영화에 1초도 쓰지 않았다”

카메론은 AI를 한 덩어리로 보지 않아요.

‘초지능(ASI)’은 위험한 별도 이슈(터미네이터의 스카이넷과 연결되는 논점)로 분리하고,

‘생성형 AI’는 창작·미술·배우를 대체할 수 있어 더 산업 내부적으로 위험하다고 봅니다.

④ 제일 우려하는 건 ‘젊은 감독의 성장 경로가 끊긴다’는 점

“돈 없이도 영화 찍을 수 있다”는 장점이 오히려 독이 될 수 있다고 말해요.

배우 없이, 연기와 현장 경험 없이 ‘싸게 만든 영화’가 늘면, 감독이 성장하는 필수 단계(배우와의 작업, 감정 설계)가 사라진다는 거죠.

⑤ 숏폼 시대에 긴 영화를 만든 이유: “극장이야말로 ‘클러터(잡음)’를 제거하는 선택”

짧은 영상이 늘었다고 집중력이 사라진 게 아니라, 15초/30초 광고는 예전부터 있었다고 반박합니다.

오히려 지금은 스트리밍으로 ‘보는 방식을 내가 통제’할 수 있는 시대라,

반대로 영화관은 “내 통제권을 잠깐 내려놓고 완전 몰입하는 경험”을 주기 때문에 더 강력하다고 주장합니다.

⑥ 편집의 본질: “덜어내는 용기”

좋은 장면을 30분이나 잘라냈다고 합니다.

잘라낸 이유는 “더 큰 목적(오케스트레이션된 경험)”을 위해서예요.

조각처럼 깎아내야 최종 형태가 나온다는 비유를 씁니다.

2) 한 단계 더 해석: 카메론의 ‘반(反) 생성형 AI’는 기술 논쟁이 아니라 “산업 구조” 얘기다

여기서부터가 경제 관점으로 재밌는 포인트예요.

카메론이 진짜로 막고 싶은 건 ‘AI 툴’ 자체가 아니라, AI가 만드는 제작 생태계의 재편입니다.

① 생성형 AI가 바꾸는 건 “제작비”가 아니라 “제작의 기준선”

AI로 영화가 싸게 만들어지면, 표면적으로는 효율이죠.

근데 기준선이 내려가면(“이 정도 퀄리티면 되지?”), 산업 전체가 ‘저비용 대량생산’ 방향으로 빨려 들어갈 수 있어요.

이때 제일 먼저 무너지는 건 신인 감독의 현장 경험, 배우 중심의 제작 문화, 스태프 일자리 구조입니다.

② ‘배우 없는 영화’가 늘면, IP(지식재산)도 약해질 가능성이 크다

카메론이 계속 “acting”을 말하는 이유는 단순 감성 문제가 아니에요.

강한 프랜차이즈 IP는 대개 “캐릭터에 대한 애착”이 기반인데, 그 애착은 연기·관계·서사의 축적에서 나오거든요.

AI가 만든 ‘무난한 영상’은 많아질 수 있어도, 장기적으로 수익을 만드는 IP는 오히려 희귀해질 수 있습니다.

③ 이건 콘텐츠 산업의 ‘공급 과잉’ 국면을 앞당긴다

AI로 공급이 폭증하면, 플랫폼은 더 강해지고 제작자는 더 경쟁이 심해집니다.

이 구도는 결국 플랫폼 중심의 수익 배분으로 가기 쉬워요.

카메론 같은 거장이 “인간 창작을 고집한다”는 건, 창작자 협상력 자체를 지키려는 메시지로도 읽힙니다.

④ 거시적으로 보면: 콘텐츠는 ‘경기침체’에도 버티는 소비지만, 제작 생태계는 다르다

소비는 남아도, 제작 현장의 임금·인력 구조는 AI로 흔들릴 수 있어요.

이게 결국 노동시장과 연결되고, 산업 정책(저작권/초상권/학습 데이터 규제)까지 번집니다.

요즘 글로벌 경제 전망에서 “AI 생산성”만 보지 말고, 분배 충격을 같이 봐야 하는 이유가 여기 있어요.

3) 카메론이 말한 AI를 2종류로 나눈 게 중요한 이유(투자·정책 관점)

① ‘초지능(ASI)’ vs ‘생성형 AI’ 분리

대부분 콘텐츠 업계 대화는 “생성형 AI로 일자리가 줄어든다”에 몰려있는데,

카메론은 ASI를 별도 위험으로 분리해요.

이 분리는 정책적으로도 중요합니다.

ASI는 안전·통제·군사/사이버 안보까지 연결되고,

생성형 AI는 저작권, 학습 데이터, 초상권, 노동 대체 같은 산업 규제로 이어지니까요.

② 생성형 AI의 ‘도구로서의 가능성’은 열어뒀다

“전부 나쁘다”가 아니라, 워크플로 도구로는 역할이 있을 수 있다고 했어요.

다만 시작점은 배우·각본이어야 한다는 조건을 붙였죠.

이건 현장에서 많이 나오는 현실적 합의와도 비슷합니다.

AI는 프리비주얼(사전 시각화), 콘셉트 변형, 반복 작업 가속에는 유리하지만, 핵심 감정 설계는 인간이 쥐어야 한다는 흐름이요.

4) 숏폼 시대에 187분 영화가 갖는 경제적 의미: “극장=고관여(high engagement) 상품”

① 스트리밍은 ‘사용자 통제’, 극장은 ‘몰입을 위한 포기’

카메론은 극장을 “클러터를 제거하는 선택”이라고 표현합니다.

이건 콘텐츠 소비의 질을 완전히 다른 상품으로 본 거예요.

② 관객이 극장에서 사는 건 ‘시간’이 아니라 ‘환경’

큰 스크린, 사운드, 중단 없는 흐름.

이게 제공하는 건 단순 시청이 아니라 ‘경험의 패키징’입니다.

경험재는 한 번 만족하면 입소문과 반복 소비(재관람, 굿즈, 후속작)로 이어져서 수익성이 커져요.

③ 여기서 AI가 위협하는 건 “제작비”보다 “경험의 희소성”

AI가 영상 공급을 폭증시키면, 관객의 시간은 더 희소해집니다.

그럼 오히려 극장은 더 강한 ‘이벤트성’이 필요해지고,

카메론 같은 초대형 프랜차이즈가 유리해질 가능성도 커요.

5) 다른 유튜브/뉴스에서 잘 안 짚는 ‘가장 중요한 내용’만 따로 정리

1) “AI로 싸게 만든 영화”는 신인에게 기회가 아니라 함정일 수 있다

대부분은 “진입장벽 낮아진다”만 말하는데, 카메론은 성장 경로가 끊길 수 있다고 봅니다.

현장, 배우, 협업, 편집의 감각이 빠진 창작자는 시장에서 오래 못 버틴다는 경고예요.

2) ‘연기’는 예술론이 아니라, IP의 경제성(수익 지속성) 문제다

배우/캐릭터 애착이 약하면 팬덤이 약해지고, 팬덤이 약하면 프랜차이즈가 짧아집니다.

AI 생성 영상이 넘쳐날수록, 오히려 인간 연기가 들어간 강한 캐릭터 IP가 더 프리미엄이 될 수 있어요.

3) 카메론의 메시지는 “기술 선택”이 아니라 “협상력 선택”이다

생성형 AI를 적극 도입하면, 제작사는 단기 비용 절감은 얻을 수 있지만,

장기적으로는 창작자·배우·스태프의 가치가 플랫폼/툴 쪽으로 이전될 위험이 있습니다.

즉, 이건 단순 트렌드가 아니라 ‘산업 권력 이동’ 얘기예요.

4) 이 이슈는 AI 트렌드만이 아니라 글로벌 매크로(정책/규제) 이슈로 번진다

저작권·학습데이터 규제, 초상권 계약, 노동 대체에 대한 사회적 합의가 늦으면,

콘텐츠 산업은 불확실성이 커지고 투자가 위축될 수 있어요.

결국 시장 변동성까지 키우는 요인입니다.

6) 경제·AI 트렌드 관점에서 앞으로 체크할 포인트

① AI 규제와 저작권 판결 흐름

학습 데이터의 합법성, 배우 목소리/얼굴의 사용 권리, 스튜디오의 계약 관행이 핵심 변수가 됩니다.

② 극장과 스트리밍의 역할 재정의

대작은 극장 이벤트화, 중소형은 스트리밍 최적화로 갈 가능성이 커요.

생성형 AI는 중간 지대를 더 얇게 만들 수 있습니다.

③ 제작 파이프라인에서 AI의 ‘합법적’ 도입 구간

컨셉아트, 프리비주얼, 로케이션 스카우팅 대체, 번역/자막, 마케팅 소재 제작 등은 빠르게 표준화될 수 있어요.

반면 대본·연기·배우 대체는 사회적 반발과 계약 리스크가 큽니다.

④ 글로벌 경제 전망 측면: “AI 생산성” 뒤에 숨은 분배 충격

AI가 효율을 올려도, 그 과실이 누구에게 가는지에 따라 산업의 지속가능성이 달라집니다.

이건 앞으로 금리, 인플레이션, 경기침체 같은 거시 변수만큼이나 ‘정책 리스크’로 시장에 반영될 가능성이 있어요.

※ 본문에는 경제·산업 SEO 관점에서 ‘글로벌 경제 전망’, ‘금리’, ‘인플레이션’, ‘경기침체’, ‘주식시장 변동성’ 같은 핵심 키워드를 자연스럽게 포함해 정리했습니다.

< Summary >

제임스 카메론의 “생성형 AI를 1초도 안 쓴다”는 선언은 기술 거부가 아니라, 배우·현장·협업을 중심으로 한 제작 생태계를 지키겠다는 산업 구조 선언입니다.

그는 AI를 초지능(안보·통제 이슈)과 생성형 AI(창작·노동 대체 이슈)로 분리했고, 생성형 AI가 신인 감독의 성장 경로를 망칠 수 있다고 경고했습니다.

숏폼 시대에도 긴 영화를 고집한 건 극장이 ‘몰입 환경’이라는 고관여 상품이기 때문이며, AI로 콘텐츠 공급이 과잉될수록 인간 연기 기반의 강한 IP가 더 프리미엄이 될 수 있습니다.

[관련글…]


[AI Revolution]
Manus Just Dropped Its Most Powerful AI Yet

Manus 1.6 ‘Max’ 등장 + Nvidia의 Slurm 인수까지… “AI 에이전트가 진짜 일을 끝내는 시대”가 열렸습니다

이번 글에는 딱 3가지 핵심이 들어있어요.

1) Manus 1.6 Max가 왜 “데모용 에이전트”를 넘어 “실무형 에이전트”로 평가받는지

2) 모바일 앱 개발 + Design View가 제품 개발/디자인 워크플로우를 어떻게 바꾸는지

3) Nvidia가 Slurm(스케줄러)을 인수하고 Nemotron 3를 내놓으면서, 왜 AI 인프라 전쟁의 ‘운영체제 자리’를 선점하려는지

그리고 마지막에는, 다른 뉴스/유튜브에서 상대적으로 덜 말하는데 사실 제일 중요한 포인트(“에이전트 경제의 병목이 어디로 이동하는가”)를 따로 정리해둘게요.


1) [속보 정리] Manus 1.6: “끝까지 해내는” 에이전트로 업데이트

1-1. 핵심 업데이트 3가지(회사 발표 기준)

① Manus 1.6 Max(플래그십 에이전트)

계획(Planning)과 추론(Reasoning) 중심으로 코어 아키텍처를 재정비해서, 작업을 중간에 멈추거나 사람 손을 자주 타는 문제를 줄이는 데 초점이 맞춰졌습니다.

② 모바일 앱 개발 지원(웹에서 모바일로 확장)

이전에는 웹 기반 프로젝트 중심이었다면, 이제는 “요구사항 → 개발 → 결과물”까지 모바일 앱을 엔드투엔드로 만들 수 있는 방향으로 확장됐어요.

③ Design View(비주얼 작업의 인터랙티브 레이어)

텍스트 프롬프트로만 이미지 수정하는 방식에서 벗어나, 캔버스에서 클릭/포인트로 부분 수정, 텍스트 삽입/변경, 합성까지 가능해지는 UI를 추가했습니다.

1-2. 이번 업데이트의 진짜 목적: “원샷 성공률(One-shot success)”

AI 에이전트가 데모에서는 그럴듯해도, 실무에서는 결국 사람이 계속 수정해줘야 하잖아요.

Manus 1.6 Max는 그 간극을 줄이는 데 집중했고, 회사 설명상 “작업을 처음부터 끝까지 사람 개입을 최소화한 채 완료”하는 비율을 끌어올리는 방향입니다.

추가로, 더블 블라인드 UX 테스트에서 만족도가 19.2% 이상 증가했다고 언급했는데요.

여기서 중요한 건 “더 똑똑해졌다”보다, 툴을 덜 망가뜨리고(workflow break 감소), 결과의 신뢰도가 올라갔다는 메시지예요.

1-3. Wide Research(병렬 리서치)의 업그레이드 포인트

Manus의 Wide Research는 여러 서브 에이전트를 동시에 돌려서 다른 관점으로 자료를 모으고 정리하는 방식인데,

이번엔 그 서브 에이전트들까지 모두 Max 아키텍처로 강화됐다고 합니다.

즉 “메인만 똑똑하고, 병렬 작업자들은 약한 구조”에서 생기는 품질 구멍을 줄이는 방향이에요.

1-4. 스프레드시트/재무 모델링 쪽이 강해진 이유(실무 관점)

업데이트 설명에서 스프레드시트 워크플로우(복잡한 재무 모델, 데이터 분석, 리포트 자동화)가 강조됩니다.

이건 단순 기능 자랑이 아니라, 기업 내부에서 AI 자동화를 막는 대표 병목이 “엑셀/시트 기반 프로세스”인 경우가 많기 때문이에요.

실제로 많은 조직이 디지털 전환을 한다고 해도, 마지막은 시트에서 끝나거든요.

여기서 에이전트가 안정적으로 계산/다단계 로직/대용량 테이블을 처리하면 생산성이 확 튀게 됩니다.

1-5. 웹 개발 고도화: “코드 생성”이 아니라 “UI/사용성”을 건드린다

이번 업데이트에서 눈에 띄는 표현이 “UI aesthetics, functional layouts, smoother interactive experiences” 같은 문장입니다.

이게 왜 중요하냐면, 사내 도구나 고객용 MVP는 결국 사용성이 구리면 안 쓰게 되거든요.

“작동은 하는데 쓰기 싫은 내부 툴”이 제일 흔한 실패 케이스인데, 에이전트가 그 부분을 보완하려는 흐름이 보여요.

1-6. 모바일 앱 개발 지원의 의미: ‘제품 실험’의 단가가 내려간다

웹만 되는 에이전트는 결국 반쪽짜리입니다.

요즘 서비스는 모바일이 메인 인터페이스인 경우가 많고, 내부적으로도 모바일 현장/영업/물류 앱 수요가 크거든요.

Manus가 모바일 개발까지 엔드투엔드로 들어오면, 스타트업은 MVP 실험 비용이 내려가고, 기업은 내부 앱을 더 빠르게 찍어낼 수 있는 방향으로 갑니다.

1-7. Design View가 가져오는 변화: “프롬프트 반복 지옥”에서 탈출

이미지 생성/편집을 프롬프트만으로 하다 보면, 원하는 로컬 수정이 잘 안 돼서 계속 문장으로 설득해야 하잖아요.

Design View는 그걸 “UI에서 직접 집어서 고치기”로 바꾸는 시도입니다.

결국 디자인 툴의 조작감 + 생성형 모델의 생산성을 결합하려는 방향이고, 이게 성공하면 실무 디자인/마케팅 제작 속도가 확 달라질 수 있어요.


2) [속보 정리] Nvidia: Slurm 인수 + Nemotron 3 공개, AI 인프라 ‘운영체제’ 포지션 강화

2-1. Nvidia가 SchedMD(=Slurm 개발사)를 인수한 의미

Slurm은 대규모 클러스터에서 “누가 GPU/CPU를 언제 얼마나 쓰는지”를 결정하는 워크로드 매니저/스케줄러입니다.

AI 학습/추론이 커질수록, GPU 성능만큼 중요한 게 오케스트레이션(자원 배분/잡 스케줄링/큐 관리)이에요.

Nvidia는 “Slurm을 오픈소스/벤더 뉴트럴로 유지”한다고 밝혔습니다.

이 말은 겉으로는 안심 포인트지만, 전략적으로 보면 Nvidia가 AI 인프라의 사실상 표준 워크플로우를 더 깊게 장악하는 그림이기도 합니다.

정리하면, 이제 Nvidia는 단순 칩 회사가 아니라

GPU(하드웨어) + 스케줄링(클러스터 운영) + 모델(에이전트용 오픈모델)까지 “풀스택 AI 인프라”로 계속 확장 중입니다.

2-2. Nemotron 3: ‘에이전트에 최적화된’ 오픈 모델 라인업

Nvidia가 공개한 Nemotron 3는 “정확한 AI 에이전트를 만들기 위한 효율적인 오픈 모델 패밀리”를 표방합니다.

Nemotron 3 Nano

작고 빠른 모델.

특정 업무 자동화(분류, 요약, 간단한 의사결정)처럼 비용 대비 효율이 중요한 영역에 맞습니다.

Nemotron 3 Super

멀티 에이전트 환경에서 여러 모델/에이전트가 협업할 때를 겨냥.

기업형 워크플로우에서 “역할 분리형 에이전트 조직”이 늘어나는 흐름과 맞닿아 있어요.

Nemotron 3 Ultra

더 복잡한 추론과 범용성이 필요한 고난도 작업용.

2-3. Nvidia의 큰 그림: Physical AI(로보틱스/자율주행/현실세계 에이전트)

Nvidia는 최근 오픈 전략을 동시에 강화하고 있습니다.

자율주행 연구용 비전-언어-추론 모델, 그리고 물리 세계 시뮬레이션/월드모델 워크플로우까지 “현실에서 움직이는 AI” 쪽으로 메시지가 계속 이어져요.

이 영역은 특히

대규모 GPU 클러스터 + 안정적인 스케줄링 + 효율 모델 조합이 필수입니다.

Slurm 인수와 Nemotron 3 공개는 따로가 아니라, “현실세계 에이전트 시대의 인프라 선점”이라는 한 묶음으로 보는 게 자연스럽습니다.


3) 시장/경제 관점 해설: 왜 이 뉴스가 글로벌 경제에 중요하냐

3-1. AI 자동화의 병목이 “모델”에서 “운영”으로 이동 중

에이전트가 똑똑해지는 것만으로는 자동화가 크게 확장되지 않습니다.

실무에서 진짜 문제는

1) 실패했을 때 복구 비용

2) 워크플로우가 깨지는 빈도

3) 여러 작업을 동시에 돌릴 때 자원 충돌

이런 “운영 비용”이에요.

Manus는 작업 완주율(원샷 성공)을 끌어올려 운영비를 낮추려 하고,

Nvidia는 클러스터 운영의 표준(스케줄링) + 에이전트용 모델로 운영 레이어를 장악하려는 겁니다.

3-2. 기업 IT 예산의 재배치: ‘사람을 뽑을 돈’이 ‘AI 운영비’로 간다

AI 에이전트가 실제로 일을 끝내기 시작하면, 기업은 단순히 툴 구독을 늘리는 게 아니라

컴퓨팅 파워클라우드 비용, 그리고 내부 운영 체계를 재설계해야 합니다.

이 과정에서 흔히 나타나는 변화는

“프로덕트/데이터 인력 증원” 일부가

“에이전트 운영(관측/평가/권한/감사) + 인프라” 지출로 옮겨가는 흐름입니다.

3-3. 투자/산업 구조: AI 인프라는 ‘규모의 경제’가 더 강해진다

AI 에이전트가 멀티로 돌아가고, 로보틱스/물리 AI로 확장될수록

결국 승부는 대규모 인프라를 얼마나 효율적으로 굴리느냐로 갑니다.

여기서 스케줄러/오케스트레이션은 “있으면 좋은 기능”이 아니라, 원가/성능을 결정하는 코어가 돼요.

즉, 이 뉴스는 단순 제품 업데이트가 아니라

AI 공급망의 지배력(하드웨어-소프트웨어-모델)의 재편과 연결됩니다.


4) 다른 뉴스/유튜브에서 상대적으로 덜 말하는데, 제일 중요한 포인트

4-1. “에이전트 시대의 킬러는 앱이 아니라 ‘스케줄링/관측’이다”

대부분은 “Manus가 더 똑똑해졌다”, “Nvidia가 Slurm 샀다”에서 끝나는데요.

진짜 본질은 이거예요.

에이전트가 1개가 아니라 10개, 100개로 늘어날 때

업무는 폭발적으로 빨라지지만, 동시에

실패/충돌/비용 폭탄도 같이 커집니다.

그래서 다음 경쟁의 중심은

“누가 더 좋은 데모를 만드냐”가 아니라

누가 더 안정적으로 대규모 에이전트를 운영하냐(스케줄링, 리소스 배분, 가드레일, 관측 가능성)로 이동합니다.

4-2. Manus와 Nvidia가 각자 다른 층을 잡고 있는데, 퍼즐이 맞물린다

Manus는 “업무 수행 레이어(프론트의 생산성)”를 밀고,

Nvidia는 “돌아가게 만드는 레이어(백엔드의 운영성)”를 선점합니다.

이 두 축이 결합되면, 기업 입장에서는

“에이전트 도입”이 실험 단계를 넘어

전사 운영 모델(Operating Model) 변화로 넘어가게 됩니다.


5) 실무 적용 체크리스트(바로 써먹는 관점)

5-1. Manus 1.6을 테스트할 때 봐야 할 KPI

원샷 성공률: 같은 작업을 몇 번 리트라이하는지

중간 개입 횟수: 사람이 수정/지시하는 빈도

스프레드시트 신뢰도: 계산 오류/참조 오류/누락 빈도

웹/모바일 산출물 완성도: “동작”이 아니라 “사용성”

Design View 반복 효율: 프롬프트 반복 대비 수정 속도

5-2. Nvidia-Slurm 이슈를 기업이 주목해야 하는 이유

사내 GPU/클러스터가 있거나, 향후 온프레미스/하이브리드로 갈 가능성이 있으면

스케줄러는 단순 IT툴이 아니라 비용 구조를 결정합니다.

특히 멀티 에이전트, 대규모 추론이 늘어나면

“GPU를 더 사느냐” 전에

기존 GPU를 더 효율적으로 쓰는 운영 체계가 먼저 이슈가 됩니다.


< Summary >

Manus 1.6 Max는 계획/추론을 강화해 엔드투엔드 작업 완주율과 신뢰도를 끌어올리며, 모바일 앱 개발과 Design View로 실무 범위를 넓혔습니다.

Nvidia는 Slurm 개발사(SchedMD) 인수로 대규모 AI 워크로드 운영 레이어를 장악하고, Nemotron 3 오픈 모델로 에이전트 구축까지 밀어붙이고 있습니다.

결국 경쟁의 핵심은 “더 똑똑한 데모”가 아니라 “대규모 에이전트를 안정적으로 운영하는 인프라/스케줄링/관측”으로 이동 중입니다.


[관련글…]


[티타임즈TV] ““LLM과 비교할 수 없는 규모 시장이 열린다” (강정수 박사)“ 2026년 ‘피지컬AI’가 진짜 화두가 되는 이유: LLM 다음 판이 ‘현실 세계’로 열리는 중 오늘 글에는 이런 핵심이 들어 있어요. 1) 왜 “LLM으로는 한계”라는 말이 이제 설득력을 얻는지 2) 피지컬AI·월드모델이 열 시장 규모(TAM)가 왜 비교 불가인지 3) 빅테크(테슬라·구글·메타·베조스)와 중국이 각각 어디에 베팅하는지 4) “결국 승부는 데이터와…

Feature is an AI Magazine. We offer weekly reflections, reviews, and news on art, literature, and music.

Please subscribe to our newsletter to let us know whenever we publish new content. We send no spam, and you can unsubscribe at any time.