구글 제미나이 딥리서치 API 공개로 검색 종말 선언

5–8 minutes

·

·

[https://www.aitimes.com/news/articleView.html?idxno=204767]
|| Google Unleashes Gemini Deep Research API, Search Dies, Agent Research Takes Over

구글 ‘제미나이 딥 리서치’ API 개방: 이제 “검색”이 아니라 “조사(리서치) 자동화”로 시장 판이 바뀝니다

이번 글에서는 그냥 “구글이 AI 리서치툴 성능 올렸다” 수준이 아니라,

① 웹 깊숙한 곳까지 파고드는 자율 리서치(Deep Research) 구조가 어떻게 바뀌었는지,

② 개발자들이 앱에 바로 심을 수 있게 만든 ‘Interactions API’가 왜 게임체인저인지,

③ 구글이 공개한 신규 벤치마크 DeepSearchQA가 “AI 에이전트 시대”의 승부처가 되는 이유,

④ 금융/바이오 등 고정밀 산업에서 바로 돈이 되는 활용 시나리오,

⑤ (중요) 다른 뉴스에서 잘 안 말하는 ‘구글의 장기 전략’과 리스크 포인트

이렇게 한 번에 정리해볼게요.


1) 뉴스 브리핑: 오늘 발표 핵심만 빠르게 정리

[무슨 일이야?]

구글이 ‘제미나이 딥 리서치(Gemini Deep Research)’를 전면 재설계하고, API로 개발자에게 개방했어요.

추론 엔진은 최신 모델인 제미나이 3 프로(Gemini 3 Pro)를 사용합니다.

[왜 중요한데?]

이건 “보고서 작성용 AI”가 아니라, 장시간 세션을 유지하면서 스스로 계획→검색→검증→재검색을 반복하는 ‘리서치 에이전트’를 서비스에 내장할 수 있게 만든 이벤트입니다.

즉, 검색창 중심의 정보 탐색이 에이전트 중심의 자동 조사로 넘어가는 전환점이에요.

[핵심 업데이트 포인트]

1) 웹 검색 성능 대폭 개선: 특정 정보를 찾기 위해 사이트 내부 “깊은 영역”까지 탐색

2) ‘Interactions API’ 공개: 장시간 세션/서버 상태/장기 추론 루프를 백그라운드에서 굴릴 수 있게 지원

3) 오픈소스 벤치마크 ‘DeepSearchQA’ 공개: 현실적인 다단계 웹 리서치 성능 평가에 초점


2) 기능 변화: “리서치 도구”에서 “리서치 인프라”로 레벨업

2-1. 딥 리서치가 하는 일(동작 방식)

제미나이 딥 리서치는 단순히 질문 받고 답하는 챗봇이 아니라,

스스로 조사 계획을 세우고,

검색 쿼리 생성결과 읽기지식 공백 파악재검색을 반복합니다.

여기서 포인트는 “한 번 검색하고 끝”이 아니라, 장기 추론(long-horizon reasoning)을 전제로 설계됐다는 점이에요.

2-2. 왜 ‘환각 최소화’가 핵심이냐

구글은 이 에이전트를 환각(hallucination) 최소화보고서 품질 극대화에 맞춰 특별 훈련했다고 밝혔어요.

기업 입장에선 리서치 자동화에서 제일 무서운 게 “그럴듯한 거짓 보고서”인데, 그 리스크를 정면으로 줄이겠다는 방향성이죠.

2-3. 웹 검색이 “깊게” 좋아졌다는 말의 의미

기사에서 말하는 개선점은 단순히 검색 정확도만이 아니라,

특정 데이터를 찾기 위해 웹사이트 내부 깊숙한 영역까지 탐색할 수 있다는 거예요.

이게 중요해요.

대부분의 실무 정보(규제 문서 원문, 기업 IR 부속자료, 연구 부록 데이터, 공공데이터 상세 페이지)는 “겉페이지”에 없거든요.


3) Interactions API: 개발자에게 열린 ‘에이전트 운영체제’

3-1. 기존 API와 뭐가 달라?

보통의 AI API는 “요청 → 응답” 한 번으로 끝나는 구조가 많죠.

이번 ‘Interactions API’는 정반대입니다.

장시간 세션 유지, 서버 상태 관리, 다단계 계획 수립, 장기 추론 루프의 백그라운드 실행을 지원해요.

3-2. 실무에서 진짜 편해지는 포인트

개발자는 PDF, CSV, 문서, 웹 링크, 데이터셋 등을 한 번에 제공할 수 있고,

에이전트가 “무엇이 부족한지”를 스스로 판단해 재검색하며 메워요.

이게 제대로 돌아가면, 기업의 리서치 파이프라인이 “사람 손”에서 “에이전트 워크플로우”로 바뀝니다.

3-3. 경제/산업 관점에서의 의미

이 지점에서 디지털 전환이 한 단계 올라가요.

이제 기업 경쟁력은 “정보를 얼마나 빨리 찾느냐”보다,

AI 에이전트를 얼마나 안정적으로 운영하고 통제하느냐(거버넌스/보안/감사)로 이동합니다.


4) 실제 사용처: 금융 실사와 바이오가 먼저 돈이 된다

4-1. 금융: 실사(Due Diligence)·시장 분석 자동화

구글에 따르면 이미 금융 실사, 시장 분석 같은 고정밀 분야에서 활용 중이에요.

금융사들은 웹 + 내부 자료 전반에서

시장 신호, 경쟁사 정보, 규제 리스크를 자동으로 수집·정리한다고 합니다.

여기서 실무 포인트는 이거예요.

리서치 비용은 결국 “사람의 시간”인데,

에이전트가 1차 자료 수집과 요약/정리까지 해주면

애널리스트는 ‘해석과 의사결정’에 집중할 수 있죠.

이건 기업 비용 구조 측면에서 생산성을 크게 건드립니다.

4-2. 바이오: 생의학 문헌 분석 → 신약 초기 연구 가속

바이오 쪽은 방대한 논문/리뷰/메타분석/부작용 데이터가 핵심인데,

딥 리서치가 문헌을 대량 분석해 신약 개발 초기 연구를 당긴다고 해요.

요즘 시장에서 바이오가 다시 주목받는 이유 중 하나가 “AI로 R&D 리드타임을 줄일 수 있냐”인데, 이 방향과 정확히 맞물립니다.


5) DeepSearchQA 벤치마크 공개: “정답 맞추기”보다 “재현 가능한 조사”로 간다

5-1. 왜 새로운 벤치마크를 만들었나

구글은 오픈소스 벤치마크 DeepSearchQA를 공개했는데,

기존 테스트가 잡아내지 못한 현실적인 다단계 웹 리서치의 복잡성을 평가하는 데 초점을 맞췄다고 합니다.

5-2. 구성: 17개 분야, 900개 ‘인과 체인(causal chain)’ 과제

단순 퀴즈가 아니라,

원인→결과→추론 과정이 여러 단계로 이어지는 형태라 “조사 능력”을 보기 좋아요.

5-3. 측정 방식이 달라졌다

정답 여부뿐 아니라 답변의 포괄성, 검색 재현율을 측정해요.

이건 기업 입장에서 엄청 중요한 변화예요.

업무에서는 “맞는 말 한 줄”보다, “근거를 얼마나 빠짐없이 모았는지”가 더 중요하거든요.

5-4. 결과: 딥 리서치 66.1%

DeepSearchQA에서 제미나이 딥 리서치가 66.1%를 기록했고,

제미나이 3 프로(56.6%)보다 약 10%p 상승,

오픈AI GPT-5 프로(65.2%)를 넘어섰다고 기사에 나와요.

5-5. 다른 벤치마크도 1위권

HLE(인류의 마지막 시험) 46.4%

BrowseComp 59.2%

비교 대상 중 최고 점수라고 합니다.


6) 경쟁 구도: “벤치마크 1등”은 하루짜리, 하지만 판은 바뀐다

구글 발표 직후 오픈AI가 GPT-5.2를 공개하면서 일부 벤치마크 순위가 뒤바뀌었다는 반응도 있었죠.

업계에서 “벤치마크 우위는 발표 당일만 유효”라는 냉소가 나오는 것도 현실이고요.

그런데 이번 이슈의 본질은 점수 경쟁이 아니라 이거예요.

‘에이전트를 배포하고 운영하는 API/플랫폼 전쟁’이 본게임으로 들어왔다는 것.

즉, 누가 더 똑똑하냐에서 누가 더 많이 “업무 흐름 속에 심기냐”로 이동합니다.

이 흐름은 AI 투자 테마에서도 중요해요.

모델 성능만 보는 게 아니라,

API 생태계/개발자 도구/통합 제품군이 만드는 플랫폼 락인을 봐야 합니다.

이건 결국 금리 변동과 별개로, 빅테크의 현금흐름 기반 CapEx와 기업 IT 지출 재편에도 영향을 줘요.


7) 구글의 다음 수: 검색·파이낸스·노트북LM·제미나이 앱 통합이 진짜 무섭다

구글은 제미나이 딥 리서치를

구글 검색, 구글 파이낸스, 노트북LM, 제미나이 앱에 차례로 통합할 계획이라고 했어요.

이 통합이 의미하는 건 간단합니다.

우리가 검색어 치고 링크 열어보던 방식에서,

AI가 대신 탐색하고 분석해서 “결론+근거 패키지”로 가져오는 방식으로 UX가 바뀐다는 거예요.

특히 구글 파이낸스와 결합하면, 시장 참여자 입장에선

거시 지표, 실적, 규제 이슈를 엮어서 “내 포트폴리오에 어떤 영향이냐”까지 자동 리서치하는 흐름이 가능해져요.

이건 사실상 리테일 투자자/직장인에게도 ‘리서치 접근성’이 확 내려오는 사건입니다.


8) 다른 뉴스에서 잘 안 말하는 “가장 중요한 포인트” (블로그 관점 핵심)

8-1. 구글이 노리는 건 ‘검색 점유율’이 아니라 ‘검증의 표준’이다

사람들이 검색을 덜 하게 되는 시대가 오면, 검색 트래픽 자체는 줄 수 있어요.

그런데 구글은 그걸 겁내기보다,

AI가 리서치할 때 거쳐야 하는 “검증 루프”와 “근거 탐색”의 표준을 자기 플랫폼으로 만들려는 느낌이 강합니다.

딥 리서치 + DeepSearchQA(측정 기준 공개) 조합은,

“에이전트 리서치는 이렇게 평가해야 한다”라는 룰 세팅이기도 하거든요.

8-2. Interactions API는 ‘AI 에이전트의 백엔드’ 시장을 연다

대부분 사람들은 모델 성능만 보는데, 실무는 다릅니다.

장시간 작업, 상태 관리, 실패 복구, 재시도, 로그/감사 추적 같은 게 없으면 기업 도입이 막혀요.

이번 API는 그 “더러운 실무”를 플랫폼 레벨에서 떠안겠다는 선언이라서 파급이 큽니다.

8-3. 벤치마크 수치보다 ‘Thinking Time’ 최적화가 수익 모델이 된다

구글이 “더 많은 생각 시간(thinking time)이 실제 성능 향상으로 이어지는지”를 분석할 수 있다고 했죠.

이건 곧 과금 모델과 직결됩니다.

에이전트가 더 오래 생각할수록 비용이 늘고,

기업은 “정확도 vs 비용”의 최적점을 찾아야 해요.

앞으로 AI 도입 예산은 소프트웨어 구독이 아니라,

리서치 작업량(추론 시간/검색 호출/검증 루프)에 기반한 변동비 비중이 커질 가능성이 큽니다.

8-4. 리스크: ‘깊은 웹 탐색’이 늘수록 데이터/저작권/규제 이슈도 커진다

웹사이트 내부 깊게 들어가서 데이터를 모으는 능력은,

반대로 말하면 서비스 운영 측면에서

저작권/로봇 배제 정책/데이터 사용권/개인정보/규제 준수 이슈가 더 자주 터질 수 있어요.

기업이 딥 리서치를 도입할 때는 기술보다 먼저

데이터 거버넌스(어디까지 수집 가능한가), 감사 로그, 출처 관리가 같이 가야 합니다.


9) 실무 적용 가이드: “우리 회사/내 업무”에 어떻게 붙일까

9-1. 바로 효과 나오는 업무 Top 5

1) 경쟁사/산업 동향 모니터링: 매주 자동 리서치 보고서

2) 규제/컴플라이언스 체크: 정책 변경 감지 + 영향 요약

3) 투자/사업 타당성 검토: 시장 규모, 고객군, 리스크 체인 정리

4) 기술 스카우팅: 논문/특허/오픈소스 트렌드 맵핑

5) 내부 문서+외부 자료 결합 리서치: 사내 지식과 시장 근거를 한 문서로 연결

9-2. 도입할 때 체크리스트

– 출처 표기/근거 링크를 결과물에 강제할 수 있는가

– 재검색/재검증 루프의 최대 횟수(비용)를 통제할 수 있는가

– 내부 문서(PDF/CSV)와 외부 웹을 섞을 때 권한/보안이 분리되는가

– 결과물에 “불확실성/공백”을 명시하도록 정책화할 수 있는가


10) 거시 관점 한 줄 결론: AI 에이전트가 ‘정보 비용’을 떨어뜨리고, 산업 의사결정 속도를 올린다

이번 업데이트는 “AI가 더 똑똑해졌다”보다,

정보 탐색·검증·보고서 생성의 단가를 낮춰서 의사결정의 속도를 끌어올리는 사건에 가깝습니다.

이 흐름이 커지면, 기업 현장에서는

리서치/기획/전략/IR/법무/RA까지 업무 재설계가 들어갈 거고요.

시장에서는 AI 인프라와 플랫폼의 락인이 더 강해지면서, 빅테크 중심의 AI 투자 내러티브도 더 단단해질 가능성이 큽니다.


< Summary >

구글이 ‘제미나이 딥 리서치’를 전면 개편해 API로 개방하면서, AI가 스스로 계획하고 웹을 깊게 탐색·검증하는 “리서치 자동화” 시대를 본격화했다.

핵심은 장시간 세션과 백그라운드 추론 루프를 지원하는 Interactions API이며, 금융 실사·시장 분석·바이오 문헌 분석처럼 고정밀 업무에서 바로 가치가 난다.

DeepSearchQA 벤치마크 공개는 “정답”보다 “재현 가능한 조사”를 표준으로 만들려는 시도이고, 앞으로 경쟁의 본질은 모델 점수보다 에이전트 운영 플랫폼과 통합 생태계로 이동한다.


[관련글…]

*출처: https://www.aitimes.com/news/articleView.html?idxno=204767


[https://www.aitimes.com/news/articleView.html?idxno=204767] “ || Google Unleashes Gemini Deep Research API, Search Dies, Agent Research Takes Over“ 구글 ‘제미나이 딥 리서치’ API 개방: 이제 “검색”이 아니라 “조사(리서치) 자동화”로 시장 판이 바뀝니다 이번 글에서는 그냥 “구글이 AI 리서치툴 성능 올렸다” 수준이 아니라, ① 웹 깊숙한 곳까지 파고드는 자율 리서치(Deep Research) 구조가 어떻게 바뀌었는지, ② 개발자들이 앱에 바로 심을…

Feature is an AI Magazine. We offer weekly reflections, reviews, and news on art, literature, and music.

Please subscribe to our newsletter to let us know whenever we publish new content. We send no spam, and you can unsubscribe at any time.