[경제 읽어주는 남자(김광석TV)]
“CPU 출시 일정 발표 없는 엔비디아… “AI 거품론 정말 위험해지는 지점은?” GPT5 논란부터 구글·그록 반격 신호 | 경읽남과 토론합시다 | 김덕진 소장 2편“
AI 거품론 임계점과 2026 경제전망: GPT-5 체감 논란, 구글·클로드·그록의 반격, 엔비디아 CPU 공백의 의미
이번 글에는 세 가지가 정확히 들어있다.
- 실제 데이터로 본 AI 거품의 ‘터질 수 있는 지점’ 체크리스트와 대응 전략이 담겨 있다.
- GPT-5 기대 대비 체감 성능 논란, 구글·클로드·그록의 반격이 시장에 주는 신호를 정리했다.
- 엔비디아 CPU 출시 일정 공백이 의미하는 바와 전력·메모리·SSD까지 확장된 인프라 사이클을 짚어준다.
뉴스 한눈에: 핵심 브리핑
- 거품론의 뿌리.
프런티어 모델의 성능 체감 개선 폭 둔화와 데이터 부족, 비용 대비 효용 논쟁이 맞물렸다. - 반격의 서막.
사용자 체감 기준에서 구글 Gemini 라인업, Anthropic Claude, xAI Grok가 다변화 판을 만들고 있다. - 돈 버는 길이 열렸다.
오픈AI는 채팅 내 결제·쇼핑, 파트너 앱 내재화로 커머스·광고형 수익을 열고 있다. - 하드웨어의 진실.
엔비디아 실적은 영업이익 동행 상승으로 실체를 보여준다.
하지만 CPU 로드맵 가시성 공백과 전력·플래시 메모리 병목이 새 리스크다. - 경제전망 포인트.
글로벌 경기 둔화 구간에서 AI CAPEX는 지속되지만 금리·전력가격·규제의 변수가 커진다. - 투자 관전 포인트.
‘학습’에서 ‘추론’으로 비용 중심이 이동하며 SSD·NVMe·전력 인프라·냉각 등으로 밸류체인이 넓어진다.
생성형 AI 성능: ‘빅 점프’에서 ‘깊은 추론’으로 축 이동
- 기대 대비 체감.
대버전 넘버 교체에 비해 사용자 체감 향상이 제한적이라는 인식이 퍼지며 정체 논란이 커졌다. - 데이터 한계.
웹 크롤 데이터의 추가 이득이 줄며 모델 성능 기울기가 완만해졌다. - 대응 전략.
체인-오브-소트 같은 ‘생각 늘리기’로 추론깊이를 올리고, 더 많은 GPU로 더 오래 계산하는 쪽으로 무게가 이동했다. - 효율 반격.
오픈소스·경량 모델·딥시크류의 비용 효율 접근이 빠르게 상향 평준화하며 프런티어 대비 가성비 격차를 좁힌다. - 시장 해석.
‘초거대 단일 모델 독주’에서 ‘업무·도메인별 맞춤 조합’으로 구조가 분화되고 있다.
플랫폼 전쟁: 오픈AI 슈퍼앱화, 구글·클로드·그록의 차별화
- 오픈AI.
채팅 내 결제·쇼핑 기능이 열리며 커머스·광고형 수익화를 실험 중이다.
여행·결제·리테일 파트너가 채팅 안으로 들어오고, 앱스토어형 생태계가 형성되고 있다.
롱텀 메모리로 개인 맞춤 추천·상거래 전환율을 높이는 흐름이 뚜렷하다. - 구글 Gemini.
이미지·영상·멀티모달에서 체감이 커졌고, 부분 수정 기반의 정교한 편집과 YouTube·사진·지도 데이터 결합이 강점이다.
데이터·동영상 자산 결합으로 크리에이티브 워크플로를 잠식하며 어도비 등 전통 툴과 정면승부 중이다. - Claude(Anthropic).
B2B·API 품질·안전성에서 선호가 높고, 엔터프라이즈 도입 속도에 강점을 보인다. - Grok(xAI).
X 데이터 결합으로 시의성·소셜 톤에 특화했고, 테슬라·전력·데이터센터 역량을 동원해 속도전으로 추격한다. - 사용자 평가 시사점.
커뮤니티 기반 랭킹에서는 특정 서비스가 상위권을 번갈아 차지하며 다극 체제를 굳혀 가는 중이다.
하드웨어·인프라: 엔비디아의 강세, CPU 공백, 그리고 전력·스토리지 전쟁
- 엔비디아 실적의 의미.
주가 급등만이 아니라 매출·영업이익 동행 상승이 확인되며 실체를 동반한 사이클로 평가된다.
‘엔비디아 실적’은 거품 논쟁에서 가장 단단한 하드 데이터다. - CPU 출시 일정 공백.
GPU는 분기마다 로드맵이 촘촘한데, CPU 관련 공개 일정·스펙 업데이트는 제한적이라는 점이 시장 변동성 요인이다.
ARM 서버·커스텀 CPU로의 분화가 가속되면 시스템 밸런싱·원가 구조에 변수가 된다. - 학습에서 추론으로.
대형 서비스의 비용 중심축이 학습 CAPEX에서 추론 OPEX로 이동 중이다.
이는 데이터센터 전력, 냉각, 네트워킹, SSD·플래시·HBM 수요를 전방위로 자극한다. - 롱텀 메모리와 스토리지.
개인화·상태 유지 에이전트가 늘면서 NVMe SSD, 키-밸류 캐시, 벡터DB, 메모리 디저그리게이션 수요가 급증한다. - 전력이 최대 병목.
PUE 개선, 액체냉각, 변전 인프라, PPA(전력구매계약) 확보가 곧 경쟁력이며, 전력단가가 AI 서비스 단가를 좌우한다.
경제전망: 글로벌 경기·금리·규제 시나리오와 AI 사이클
- 글로벌 경기.
제조·무역 회복은 완만하고, 서비스·디지털 CAPEX가 상대적 강세를 보인다. - 금리.
고금리 장기화 시 추론 OPEX 압박이 커지지만, 수익모델이 자리 잡으면 AI 현금흐름은 국채대비 매력도를 유지할 수 있다.
완화 국면이면 데이터센터·전력 인프라 투자 재개가 가속된다. - 규제.
안전성·저작권·데이터 국지화 규제가 도입되며 현지화 CAPEX가 늘고, 지역별 멀티 모델 채택이 보편화된다. - 실물 데이터.
데이터센터 신규 증설과 SSD·HBM 발주, 전력 설비투자가 선행지표로 유효하다.
이 흐름이 꺾이지 않는 한, 거품보다는 구조적 성장의 무게가 더 크다.
AI 투자전략: 밸류체인 바스켓과 리스크 관리
- 바스켓 구성.
GPU·가속기.
전력·변전·냉각.
네트워킹(NVLink/InfiniBand/400G 이상).
HBM·DRAM·NAND·SSD 컨트롤러.
스토리지 소프트웨어(NVMe-oF, 벡터DB).
플랫폼·에이전트·슈퍼앱(커머스·광고 전환).
보안·거버넌스·저작권 도구. - 리스크.
전력·전기요금 급등, 공급망 병목(HBM, 패키징), CPU 로드맵 변동성, 규제 강화, 수요전환 지연, 환율 변동. - 체크포인트.
엔비디아 실적의 질, 전력 PPA 체결 추이, SSD·HBM 출하, 사용자 체류시간·결제 전환율, API 매출/토큰당 비용, 글로벌 금리 레짐. - 포지셔닝.
추론 OPEX 민감도 낮은 영역과 전력·스토리지 인프라에 코어 비중을 두고, 프런티어 모델 단일 베팅은 피한다.
경제전망과 금리 시나리오에 따라 CAPEX 민감 섹터 비중을 탄력 조절한다.
기업 도입 가이드: 90일 실행 로드맵
- 0~30일.
업무별 고부하 작업 식별, 보안·컴플라이언스 경계 설정, 파일럿 유스케이스 3건 선정. - 31~60일.
경량 모델+도메인 프롬프트+RAG로 PoC, 추론비·전환율·품질 KPI 계측, 벤더 잠금 최소화 설계. - 61~90일.
롱텀 메모리·개인화 적용, 결제·커머스 연계, 벡터DB·캐시 튜닝, 보안·로깅·감사체계 확정, 내부 교육.
거품이 진짜 위험해지는 지점: 경보 체크리스트 7
- 대형 모델 신제품의 사용자 체감 개선이 연속 2분기 이상 미미해진다.
- 추론 단가 하락 속도가 사용자당 매출 상승 속도를 앞지른다.
- 전력·HBM·SSD 공급 병목으로 신규 서비스 론칭이 지연된다.
- CPU 로드맵 불확실성으로 시스템 밸런싱 비용이 급등한다.
- 플랫폼 내 결제·커머스 전환율이 기대치 대비 낮아 광고 의존도가 역전된다.
- 규제 리스크로 데이터 이동·학습이 제한돼 지역별 서비스가 분절된다.
- 엔비디아 실적에서 영업이익·현금흐름이 매출 성장 대비 둔화한다.
다른 데서 잘 안 다루는 핵심 포인트
- 상태 유지 에이전트의 확산은 ‘토큰’보다 ‘스토리지 IOPS’가 병목이 될 가능성이 크다.
NVMe-oF, SSD 컨트롤러, 플래시 최적화 파일시스템이 수혜를 받는다. - AI 단가의 진짜 승부는 ‘달러당 토큰’보다 ‘와트당 추론’이다.
전력 효율 메트릭을 공시하는 기업이 프리미엄을 받을 것이다. - 롱텀 메모리는 개인정보·선호·맥락을 수익화하는 기반이다.
퍼스트파티 데이터 우위 기업이 커머스 전환율을 과점화한다. - 학습 CAPEX 둔화 이후에도 추론 OPEX는 구조적으로 확대된다.
구독이 아닌 광고·커머스 전환 수익이 이를 상쇄할 수 있다. - CPU 공백 이슈는 ‘GPU 독점’이 아니라 ‘시스템 TCO 불확실성’의 문제다.
ARM·커스텀 CPU·DPUs가 결합된 이기종 구조가 표준이 될 것이다.
결론: 지금은 ‘구조적 성장 속 선택적 거품’ 구간
AI는 플랫폼 다극화, 커머스 내재화, 전력·스토리지 중심의 인프라 확장으로 실물 기반이 두꺼워지고 있다.
다만 성능 체감 둔화와 전력·메모리 병목, CPU 로드맵 공백이 밸류에이션 변동성을 키운다.
경제전망 상 글로벌 경기와 금리 경로가 완화로 기울면 CAPEX는 재가속될 수 있고, 고금리 지속 시에는 추론 효율·전환율이 성패를 가른다.
투자는 프런티어 단일 종목이 아니라 밸류체인 바스켓과 리스크 시나리오 관리로 접근하자.
- 거품론의 핵심은 성능 체감 둔화·데이터 한계·비용 대비 효용이다.
- 구글·클로드·그록의 부상과 오픈AI의 커머스·앱스토어화로 수익모델이 열리고 있다.
- 엔비디아 실적은 실체를 보여주지만 CPU 일정 공백·전력·스토리지 병목이 새 리스크다.
- 글로벌 경기·금리 경로에 따라 AI CAPEX/추론 OPEX의 속도가 달라진다.
- 투자 포인트는 전력·스토리지·네트워킹 등 인프라와 플랫폼 전환율, ‘와트당 추론’ 효율이다.
[관련글…]
[Jun’s economy lab]
“AI 버블에 대한 생각 (ft. AI버블이 온다)“
AI 버블 논쟁, 지금 무엇을 봐야 하나: 엔비디아, 오픈AI 유닛 이코노믹스, 전력 제약, 그리고 투자전략
AI 버블인지 아닌지, 결론을 미루지 말고 이번 글에서 끝내자.
AI 데이터센터 전력 제약과 원가 구조, 엔비디아 현금흐름 체크포인트, 오픈AI 같은 모델 사업의 유닛 이코노믹스, 예측형 AI의 기술적 한계, 그리고 증시에서 바로 쓸 투자전략까지 모두 담았다.
글로벌 경제전망, 인플레이션, 금리, 증시, 투자전략 관점에서 핵심만 뽑아 재정리했다.
뉴스 브리핑: 지금 시장에서 벌어지는 일
AI 버블론이 급부상하며 AI 관련주 변동성이 확대됐다.
일각에서 AI 버블 붕괴 경고가 나오자 단기 급락 후 반등이 반복되는 흐름이 관찰됐다.
오픈AI의 높은 적자 소식과 투자 의존 구조가 화두가 됐다.
엔비디아를 둘러싼 매출채권 회수 지연, 재고, 회계 추정(감가상각 기간) 이슈 등이 제기됐지만 회사는 항목별로 반박했다는 보도가 이어졌다.
투자자 심리는 3년 전처럼 일방적 낙관에서 점차 분화되는 국면으로 진입했다.
핵심 쟁점 1: “버블 vs 펀더멘털”을 가르는 7가지 신호
1) 수요의 질: 투자자금 → 고객매출로의 선순환이 작동하는가.
2) 유닛 이코노믹스: 1k 토큰당 매출이 1k 토큰당 비용(연산+전력+스토리지+네트워크)을 상회하는가.
3) 활용률(Utilization): 훈련(Training)보다 추론(Inference) 사용량이 실사용으로 채워지고 있는가.
4) 가격 탄력성: 모델 가격 인상에도 유지율이 높은가, 아니면 급격한 다운셀/오픈소스 전환이 일어나는가.
5) 전력/부지 제약: 전력계약(PPA), PUE, 송전망 증설이 실제 투자 속도를 따라가는가.
6) 중고 GPU 시장: 중고 가격 하락 가속은 과잉투자 신호이고, 타이트한 프리미엄은 수요 견조 신호다.
7) 규제/보안: 데이터 거버넌스, 모델 책임성 규제가 본격화될 때 비용이 급증하지 않는가.
핵심 쟁점 2: 엔비디아 논쟁, 어디를 봐야 설득력이 생기나
매출채권과 재고는 사이클 정점에서 항상 도마 위에 오른다.
핵심은 현금전환주기(CCC)가 나빠지는지, 고객 선금·장기계약이 늘며 방어되는지다.
데이터센터 고객의 최종 매출 성장과 동일 선상에서 살펴야 한다.
감가상각 기간 논쟁은 회계 추정보다 잔존가치와 중고 거래가격이 더 실물적 지표다.
만약 중고 H100/B100급 카드의 청산가격이 제조원가 대비 급락한다면 사이클 피크 신호로 해석될 수 있다.
네트워킹(InfiniBand, 이더넷)과 HBM 공급망 병목이 풀리는 속도도 고정비 회수에 직결된다.
핵심 쟁점 3: 오픈AI·모델 사업 유닛 이코노믹스, 계산법으로 보자
매출(1k 토큰당) = 요금 단가 × 사용량.
비용(1k 토큰당) = 연산비용(GPU 감가+자본비용) + 전력비용(kWh 단가×PUE) + 스토리지/네트워크 + RAG/검색 비용 + 품질관리/모더레이션.
손익분기점은 활용률과 모델 효율(토큰당 FLOPs), 전력단가가 결정한다.
Inference 비중이 커질수록 단가 인하 압력과 캐시 히트(지식 재활용) 최적화가 중요해진다.
멀티모달이 널리 퍼질수록 대역폭·전력비용이 급증하므로 가격 책정이 다시 중요해진다.
오픈소스·경량화(퀀타이제이션, 디스틸레이션)가 빨라질수록 ‘규모의 경제’가 약해지고 고객은 자체 추론 또는 엣지로 이동한다.
핵심 쟁점 4: 예측형 AI의 기술적 한계, 왜 버블 논쟁에 중요할까
생성형 AI의 체감 성능과 달리 예측형 AI는 데이터 편향, 데이터 유출(leakage), 피드백 루프에 취약하다.
히트곡 97% 예측 같은 화제성 연구가 데이터 유출로 반박된 사례처럼, ‘가장 그럴듯한’ 결과가 종종 오류에서 비롯된다.
의료 사례에서처럼 천식 환자 데이터의 처치 프로토콜이 예측모델을 교란해 잘못된 안전판단을 내리기도 한다.
채용·보험·사법 분야 적용은 정확도 저하가 사회적 비용으로 직결되므로 설명가능성(XAI)과 외삽 성능 검증이 필수다.
핵심은 “어떤 집단에 훈련했고, 어디에 적용하는가”와 “사람이 알고리즘을 어떻게 조작할 수 있는가”다.
보이지 않는 결정요인: 전력, 공급망, 규제
전력은 AI 사이클의 진짜 병목이다.
PPA 가격, PUE, 재생에너지 가용성, 송전망 증설 속도가 데이터센터 증설의 속도제한장치가 된다.
전력단가 상승은 모델 가격과 클라우드 마진에 직접적 압박을 준다.
HBM, CoWoS, 고속 네트워킹 공급이 개선되는지에 따라 랙당 성능과 TCO가 달라진다.
국가별 데이터 보안/주권 규제는 ‘국내용 모델’ 수요를 키우지만 스케일 이코노미를 쪼갠다.
투자전략: 시나리오별 포지셔닝 로드맵
시나리오 A(펀더멘털 정착): 추론 매출이 가시화되고 가격 인하에도 총매출이 확대된다.
데이터센터 운영사, 고효율 전력·냉각, 네트워킹, 메모리 업체 비중 확대.
시나리오 B(속도조절): 전력·규제·오픈소스 확산으로 Capex 둔화.
소프트웨어 효율화(컴파일러, 스케줄러, RAG 플랫폼), 엣지 AI, 산업특화 애플리케이션으로 분산.
시나리오 C(버블 수축): 중고 GPU 가격 급락, 활용률 저하, 대형 고객의 지출 절감.
현금흐름 탄탄한 인프라 REIT, 전력 유틸리티, 비용 절감형 AI 도구(ROI 즉시 측정 가능)로 방어.
체크리스트: 시장이 정말 좋아지거나 나빠질 때 먼저 움직이는 지표
– 중고 H/HX/B급 GPU 실거래가와 재고 회전.
– Hyperscaler의 추론 매출 공개 비중 및 고객 리텐션.
– PPA 체결 단가, PUE 트렌드, 지역별 전력 공급 계획.
– 엔드유저 가격 변동 후 60~90일 유지율.
– 국별 AI 규제(투명성·책임성) 시행 일정과 컴플라이언스 비용 가이드.
산업별 파급: 누가 구조적 수혜/리스크에 서 있나
수혜: 전력 유틸리티·송전, 고효율 냉각, HBM/첨단패키징, 고속 네트워킹, 모델 효율화 소프트웨어.
경합: 범용 LLM 플랫폼 vs 산업특화 소형모델, 클라우드 추론 vs 엣지 추론.
리스크: 과잉용량 데이터센터, 설명가능성 요구 높은 규제 산업, 화려하지만 ROI 불분명한 B2C 생성형 서비스.
경제 맥락: 금리·인플레이션·증시와 AI 사이클
금리 고점부근에서의 Capex 확장은 자본비용을 상승시켜 ROI 허들을 높인다.
에너지 관련 인플레이션은 데이터센터 OPEX를 자극해 가격 인상 압력으로 전가된다.
글로벌 경제전망 둔화 시에는 ‘효율을 파는 AI’가 ‘경험을 파는 AI’보다 방어력이 강하다.
증시는 추론 매출의 신뢰성, 전력 제약 해소 속도, 규제 가이드의 명확성에 가장 민감하게 반응할 것이다.
책으로 짚는 본질: ‘AI 버블이 온다’가 던진 질문
프린스턴대 아르빈드 나라야난의 신간은 “우리가 기술이 아닌 환상을 사고 있지 않은가”를 묻는다.
핵심 메시지는 단순하다.
예측형 AI는 멋진 데모보다 적용 맥락의 차이에서 더 자주 실패한다.
정책·경영 의사결정으로 가져오기 전에 외삽 검증, 설명가능성, 인간 감독을 기본값으로 두라.
다른 곳에서 잘 안 말하는 가장 중요한 내용
1) AI의 진짜 가격결정권자는 반도체가 아니라 전력이다.
kWh 단가와 PUE가 떨어져야 토큰 단가가 구조적으로 내려가고, 그때 수요의 진성 여부가 판별된다.
2) 추론 S-커브의 핵심 변수는 “콘텐츠 재사용률”이다.
RAG·캐시가 좋아질수록 동일한 질문에 필요한 신규 계산이 급감한다.
이는 매출 탄력성을 둔화시킬 수 있어 “효율 향상=매출 성장”이 항상 성립하지 않는다.
3) 오픈소스·경량화는 ‘규모의 경제’를 침식한다.
고객이 소형 모델로도 충분한 품질을 얻는 순간, 하이엔드 연산 수요는 꺾인다.
4) 중고 GPU 지표는 모든 논쟁을 숫자로 바꿔준다.
청산가격이 제조원가를 향해 빠르게 수렴하면 과잉투자 신호, 견조하면 수요 실체 신호다.
실전 투자 액션플랜
– 방어선: 현금흐름 우수, 가격결정력 있는 전력·네트워킹·HBM 밸류체인.
– 알파영역: 모델 효율화(컴파일러, 스케줄러, 벡터DB/RAG), 산업특화 애플리케이션, 엣지 AI.
– 리스크 관리: 중고 GPU 가격과 고객 유지율에 트레일링 스탑을 연동.
– 거시 변곡: 금리 하향 신호가 나오면 Capex 민감 섹터 베타 확대, 에너지 인플레 재가열 시 유틸리티·냉각으로 회전.
< Summary >
AI 버블 판단의 핵심은 ‘돈의 선순환’과 ‘유닛 이코노믹스’다.
엔비디아 논쟁은 현금전환, 중고 GPU 가격, 네트워킹·HBM 병목으로 검증하라.
오픈AI 등 모델 사업은 1k 토큰 단가와 전력·효율 변수로 손익이 갈린다.
예측형 AI는 데이터 외삽 실패와 조작 가능성에 취약해 규제 산업 적용 시 비용이 급증한다.
전력이 진짜 병목이며, 오픈소스·경량화가 스케일 이코노미를 잠식한다.
투자전략은 전력·네트워킹·HBM 중심의 방어선과 효율화·엣지 AI의 알파영역 병행이 유리하다.





