
같은 콘텐츠를 두고 ChatGPT는 우리 브랜드를 인용한다. 그런데 Perplexity에서 같은 질문을 입력하면 답변에 우리 이름이 빠져 있다. Gemini는 또 다른 결과를 내놓는다. 분명 RAG라는 같은 구조를 쓴다고 알고 있는데, 왜 결과는 갈릴까.
"AI 검색 = 동일한 RAG 구조"라는 일반론은 마케팅 전략을 짤 때 가장 위험한 단순화 중 하나다. 세 플랫폼은 데이터 소스, 권위 평가 방식, 인용 표시 방식이 모두 다르고, 그 차이가 우리 콘텐츠가 답변에 등장할지 말지를 결정한다. 단일 채널 최적화로는 세 플랫폼 모두에서 인용을 받기 어렵다.
이 글은 ChatGPT·Perplexity·Gemini 세 AI 검색 플랫폼이 RAG 안에서 어떻게 다르게 작동하는지, 그리고 마케터가 각 플랫폼에 맞춰 무엇을 다르게 해야 하는지를 정리한 가이드다.
세 플랫폼이 공유하는 공통 구조 — RAG의 4단계
플랫폼별 차이를 보기 전, 공통 구조를 먼저 확인하자. ChatGPT, Perplexity, Gemini 모두 RAG(Retrieval-Augmented Generation) 메커니즘을 핵심에 둔다.
사용자 질문을 의미 벡터로 변환
대규모 문서 데이터베이스에서 의미적으로 유사한 문서 검색
후보 문서들을 LLM에 전달
LLM이 답변을 생성하면서 출처를 인용
문제는 2단계의 "문서 데이터베이스"가 플랫폼마다 다르다는 점이다. 어떤 문서 풀에서 후보를 뽑느냐가 인용 결과를 결정한다. SIGKDD 2024 연구에 따르면 검색 시스템이 후보로 선택하지 못한 콘텐츠는 LLM 단계에서 인용될 기회 자체가 없다.
ChatGPT Search — Bing 인덱스 + OpenAI 자체 크롤러 조합형
ChatGPT의 웹 검색 기능은 단일 인덱스 기반이 아니다. Microsoft Bing 인덱스와 OpenAI 자체 크롤러를 조합해 RAG 후보 문서로 사용한다. OpenAI는 두 종류의 크롤러를 운영하는데, 모델 학습용 GPTBot과 실시간 검색 결과 표시용 OAI-SearchBot이 분리되어 있다. 두 크롤러 모두 robots.txt 단계에서 차단 여부가 갈린다.
이 구조의 마케팅적 함의는 명확하다. Bing에 인덱싱되지 않은 사이트는 ChatGPT Search 답변에 등장할 확률이 떨어지고, OpenAI 크롤러를 robots.txt에서 차단한 사이트는 OAI-SearchBot이 새 콘텐츠를 인지조차 못한다. 한국 마케터들이 종종 놓치는 지점이다. 구글에는 색인됐지만 Bing에는 안 된 콘텐츠가 적지 않고, robots.txt에 OpenAI 크롤러를 의도하지 않게 차단한 경우도 있다.
따라서 ChatGPT Search 노출 진입 조건은 두 가지다 — Bing Webmaster Tools에 사이트맵 등록 + URL Inspection 색인 요청, 그리고 robots.txt에서 GPTBot·OAI-SearchBot·ChatGPT-User 차단 여부 점검.
ChatGPT의 또 다른 특징은 권위 누적형 인용 패턴이다. 답변에서 인용되는 출처는 단발성 노출보다 다수 권위 채널에서 누적적으로 언급된 브랜드일 가능성이 높다. SIGKDD 2024 논문이 강조한 "여러 출처에서 정보를 종합한다"는 생성형 엔진 특성이 가장 강하게 작용하는 플랫폼이다.
OpenAI 공식 발표 기준 ChatGPT 주간 활성 사용자(WAU)는 2025년 들어 빠르게 늘어 수억 명 규모에 도달했다. 한국 마케터 입장에서 무시할 수 없는 트래픽이다.
Perplexity AI — 실시간 웹 검색 기반의 출처 명시형
Perplexity의 작동 방식은 ChatGPT와 다르다. 실시간 웹 검색을 매 질문마다 실행하고, 답변에 출처 URL을 명시적으로 표시한다. 답변 옆에 "1, 2, 3" 형식의 번호 인용이 붙고, 클릭하면 원문 페이지로 이동한다.
이 구조에서 마케터가 노릴 수 있는 지점이 명확하다. 사용자는 답변과 함께 출처를 확인하므로, 출처로 클릭되는 콘텐츠는 트래픽까지 함께 발생한다. ChatGPT의 답변형 노출과는 결이 다른 가치다.
Perplexity가 후보 문서를 고르는 기준은 실시간 웹 신선도와 출처 권위의 조합이다. 발행한 지 오래된 글보다 최근 업데이트된 글이 우선될 가능성이 높고, 권위 도메인의 콘텐츠가 더 자주 출처로 선택된다. SIGKDD 2024 연구가 측정한 'Cite Sources' 기법의 효과(Word Count Visibility 기준 +115.1%)가 특히 두드러지는 플랫폼이다.
Perplexity 측 발표에 따르면 월간 쿼리 약 7.8억 회(2025년 5월 기준)에 전년 대비 800% 수준의 성장률을 기록했다. 빠르게 마케팅 채널로 자리 잡고 있음을 보여주는 수치다.
Google Gemini — Google 검색 데이터 기반의 SEO 연속형
Gemini의 RAG 검색 풀은 Google 검색 인덱스 + Knowledge Graph다. 즉 기존 SEO에서 쌓아온 권위가 Gemini 답변에도 그대로 영향을 미친다.
세 플랫폼 중 SEO와 GEO의 연속성이 가장 강한 플랫폼이다. 구글 검색 결과 1페이지에 안정적으로 노출되는 콘텐츠는 Gemini 답변에도 인용될 가능성이 높다. 백링크, 도메인 권위, E-E-A-T 같은 전통 SEO 신호가 Gemini의 후보 문서 선정에 직접 작용한다.
다만 Gemini도 단순 SEO 1순위 = 인용이 아니다. SIGKDD 연구의 결론을 그대로 적용하면, 같은 SEO 권위를 가진 두 콘텐츠 중 수치·외부 권위 출처·인용문이 풍부한 글이 답변에 등장할 확률이 더 높다. SEO 자산 위에 GEO 레이어를 추가로 쌓아야 한다는 의미다.
세 플랫폼별 최적화 전략 — 공통과 차이
세 플랫폼이 RAG라는 공통 구조 위에 다른 데이터 소스를 가지고 있으므로, 마케터의 최적화 전략도 공통 + 차별화 두 층으로 나뉜다.
공통 레이어 (세 플랫폼 모두 적용)
콘텐츠 첫 100자 안에 핵심 답변 배치
SIGKDD 2024 검증 효과 요소 (Cite Sources +115.1%, Quotation Addition +99.7%, Statistics Addition +97.9% 등)
외부 채널 다수에서 자연스러운 브랜드 언급 누적
플랫폼별 차별화 레이어
ChatGPT 강화: Bing Webmaster Tools 사이트맵 + URL 색인 요청 + robots.txt에서 GPTBot·OAI-SearchBot·ChatGPT-User Allow 점검, 권위 미디어/뉴스 멀티 채널 노출 누적
Perplexity 강화: 콘텐츠 신선도 유지 (정기 업데이트), 출처 권위가 명확한 도메인에서의 발행
Gemini 강화: 기존 SEO 자산 활용 (구글 검색 1페이지 진입 + GSC 색인 관리), 백링크·E-E-A-T 신호 강화
단일 채널 vs 멀티 플랫폼 — 데이터가 말하는 결론
세 플랫폼을 동시에 타겟하는 전략이 단일 채널 집중 전략보다 효과적인 이유는 RAG 메커니즘 자체에 있다. SIGKDD 2024 논문은 생성형 엔진이 "여러 출처에서 정보를 종합한다(synthesizing information from multiple sources)"고 명시하며, 같은 콘텐츠라도 외부 채널에서 반복 언급된 브랜드가 답변 후보로 더 자주 선택된다는 점을 시사한다.
이 메커니즘의 마케팅적 의미는 단순하다. 자체 사이트 한 곳에서 완벽한 콘텐츠를 만드는 것보다, 콘텐츠를 여러 독립 채널에 퍼뜨리는 것이 AI 인용 측면에서 더 효율적이다. 미디어, 산업 매체, 커뮤니티, 전문 블로그 등 채널의 성격이 서로 다를수록 효과가 누적된다.
마케터 체크리스트 — 플랫폼별 점검 5가지
자사 콘텐츠가 세 플랫폼 모두에서 인용 후보로 잡히고 있는지 다음 5가지로 점검할 수 있다.
Bing 색인 + OpenAI 크롤러 허용 — Bing Webmaster Tools 등록 + robots.txt에서 GPTBot·OAI-SearchBot·ChatGPT-User Allow (ChatGPT 진입 조건)
Google 색인 + 1페이지 진입 — GSC에서 핵심 키워드로 검색 시 1페이지에 노출되는가 (Gemini 진입 조건)
콘텐츠 신선도 — 주요 글의 업데이트 주기가 정기적인가 (Perplexity 우선 조건)
외부 권위 채널 노출 — 자사 사이트 외 여러 독립 채널에서 브랜드가 자연스럽게 언급되는가
콘텐츠 내부 GEO 요소 — 핵심 콘텐츠에 SIGKDD 2024 검증 효과 요소(Cite Sources +115.1%, Quotation Addition +99.7%, Statistics Addition +97.9% 등)가 적용되어 있는가
세 플랫폼은 같은 RAG 구조를 공유하지만 데이터 소스가 다르므로, 마케팅 전략도 공통 + 차별화 두 층 구조로 짜야 한다. 단일 채널 집중은 한 플랫폼에 강하지만 다른 두 플랫폼에서 노출 기회를 놓친다.
다음은 멀티소스 권위(Multi-Source Authority)를 만드는 외부 채널 4단계 배포 전략을 다룰 예정이다.
참고 문헌
Aggarwal, P. et al. (2024). GEO: Generative Engine Optimization. ACM SIGKDD 2024. arXiv:2311.09735
AWS. What is Retrieval-Augmented Generation (RAG).
Microsoft. Bing Webmaster Tools Documentation.

