같은 질문을 ChatGPT에 던졌는데 옆자리 동료에게는 우리 브랜드가 인용되고 내 화면에는 안 나타난 경험, 있으신가요. 마케팅 모니터링 도구에서는 분명 인용된다고 잡히는데 실제 사용자에게는 보이지 않는 이 이상한 현상은 우연이 아닙니다. AI 검색은 결과 페이지를 재정렬하는 게 아니라 사용자마다 다른 질문을 먼저 만들어내고 그 결과 풀 자체가 사람마다 달라지기 때문인데요. 본 글은 ChatGPT·Perplexity·Gemini·Copilot이 컨텍스트로 쿼리를 어떻게 분기시키는지, 한국 브랜드가 이 변화에서 인용되려면 무엇을 바꿔야 하는지를 질문에 답하는 방식으로 정리합니다.

전통 구글 검색과 AI 검색의 개인화는 무엇이 다른가요?
전통적인 구글 검색은 '다운스트림 개인화'였습니다. 같은 검색어를 던지면 결과 풀은 모두에게 동일했고 누구에게 어떤 결과를 먼저 보여줄지 순위만 달라졌죠. 세션 컨텍스트, 과거 클릭 이력, 코호트 분석 같은 신호들이 모두 순위에만 작용했고 결과 풀 자체는 안정적이었습니다. ChatGPT, Perplexity, Gemini, Copilot은 다릅니다. '업스트림 개인화'로 사용자 컨텍스트가 LLM에 주입되어 아예 다른 검색 쿼리를 생성합니다. 결과 풀 자체가 사람마다 달라지는 거죠. 예를 들어 마라톤 5년차 러너와 입문자가 똑같이 '러닝화 추천해줘'라고 입력하면 AI는 두 사람에게 완전히 다른 하위 질문을 만들어 검색을 돌립니다. 5년차에게는 '카본 플레이트', '서브3 페이스 유지' 같은 질문이, 입문자에게는 '초보 쿠셔닝', '10만원대 입문용' 같은 질문이 생성되는데요. 결정적인 건 두 사용자 모두 자신의 경험 수준이나 예산을 직접 말하지 않았다는 점입니다. AI가 메모리와 행동 기록에서 그 컨텍스트를 추론한 결과죠.
ChatGPT, Perplexity, Gemini, Copilot은 얼마나 다르게 개인화하나요?
플랫폼별 컨텍스트 깊이는 차이가 큽니다. Perplexity는 가장 얕은 단계로 세션 메모리만 활용하고 새 채팅이 시작되면 초기화됩니다. 다만 Pro Search가 분기된 서브쿼리를 가시화해 줘서 한국 콘텐츠 마케터에게는 콘텐츠 갭을 역설계할 무료 GEO 키워드 리서치 도구로 쓸 수 있습니다. ChatGPT와 Claude는 중간 지점인데 ChatGPT 메모리에 '사용자는 비건이며 서울 거주'라고 저장돼 있다면 '근처 맛집' 질문이 자동으로 '서울 비건 레스토랑'으로 재작성됩니다. Claude는 백엔드로 Brave Search를 쓰는데 Claude 인용 결과의 86.7%가 Brave 상위 결과와 겹친다는 데이터가 있어, 한국 시장에서 Claude 가시성을 노린다면 Brave 가시성부터 잡아야 합니다. Gemini는 Personal Intelligence가 활성화되면 Gmail의 마라톤 등록 메일, Photos의 트레일 러닝 사진, YouTube 시청 기록까지 종합해 '30대 후반, 트레일 러닝 6개월차' 같은 프로필을 추론합니다. Copilot은 M365 Graph 전체에 접근해 회의 일정과 이메일 스레드까지 컨텍스트로 쓰는데요. B2B 마케팅을 한다면 이 영역은 무시할 수 없는 상황입니다.
그럼 GEO 전략은 어떻게 바꿔야 하나요?
세 가지가 핵심입니다. 첫째 단일 키워드 1위 전략은 더 이상 작동하지 않습니다. '러닝화 추천' 한 키워드가 사용자별로 수십 개 서브쿼리로 분기되니까요. 잡아야 할 단위는 '러닝화 × 마라톤 × 트레일 × 초보자 × 15만 원대' 같은 컨텍스트 교집합입니다. 광역 한 페이지보다 좁고 깊은 여러 페이지가 훨씬 유리해진 이유죠. 둘째 노출수와 순위 측정은 의미가 거의 없습니다. 안정적인 결과 페이지가 없으니 1위, 3위 같은 개념이 성립하지 않습니다. 대안 지표는 인용 포함률(Citation Inclusion Rate)로, 다양한 사용자 컨텍스트의 팬아웃 쿼리 중 우리 브랜드가 몇 %에 인용되는지를 트래킹하는 방식입니다. 셋째 페르소나 리서치가 다시 일등 시민입니다. 광역 키워드 시대에 후순위였던 페르소나 분석이 GEO 시대에는 콘텐츠 기획의 출발점인데, 우리 타깃이 어떤 플랫폼을 쓰고 어떤 메모리 컨텍스트가 누적돼 있을지를 매핑해야 시작이 가능합니다. 실제 사례 하나를 공유하면 지오랭크가 2026년 1분기에 진행한 코스메틱 브랜드 E사 케이스에서 '민감성 피부 스킨케어' 광역 키워드 콘텐츠를 11개 컨텍스트 교집합 페이지로 재구성했더니 8주 만에 ChatGPT 인용율이 7%에서 26%까지 올라갔습니다. '민감성 + 임신·수유기' 컨텍스트만 따로 보면 44%, '민감성 + 여드름성'은 38%까지 갔는데, 광역 키워드 1개의 1위보다 11개 좁은 컨텍스트의 인용율을 동시에 끌어올리는 게 매출 기여도가 훨씬 컸습니다.
우리 브랜드가 당장 무엇부터 해야 하나요?
다섯 단계 프레임워크입니다. 1단계는 시맨틱 명확성 구축으로 핵심 엔티티와 제품 관계를 JSON-LD로 명시합니다. Organization, Product, Service 스키마는 기본이고 관계까지 sameAs와 partOf로 연결해 두는 게 효과적이죠. 2단계는 컨텍스트 교집합 매핑으로 타깃 페르소나의 컨텍스트 차원을 분해해 매트릭스를 그립니다. 의류 브랜드라면 체형 × 연령 × 직업 × 라이프스타일 × 예산 5차원 중 의미 있는 30~50개 교집합을 콘텐츠 후보로 정의하는 방식입니다. 3단계는 니치 우선 전략으로 '러닝화 종합 가이드 1만 자'보다 '초보 마라토너용 15만 원대 트레일 러닝화 가이드 3천 자'가 더 잘 인용됩니다. 광역 커버리지는 큰 미디어가 가져가고 우리는 깊은 니치를 점령하는 게 맞죠. 4단계는 엔티티 일관성 확보로 웹사이트·소셜·외부 인용 매체 모든 채널에서 브랜드 포지셔닝이 일관돼야 합니다. AI는 여러 출처를 교차 참조해 엔티티를 정의하기 때문에 채널별 포지셔닝이 다르면 엔티티 정의가 흐려지죠. 5단계는 페르소나별 가시성 시뮬레이션으로 분기별 핵심 페르소나 3~5개를 정의하고 각 페르소나 계정으로 동일 질문을 던져 우리 브랜드가 어느 페르소나 답변에 등장하는지 매핑합니다. 매월 정기 측정하면 어떤 컨텍스트에 강하고 약한지가 가시화됩니다. 주의할 점은 개인정보보호위원회가 2025년 12월 AI 챗봇 개인 컨텍스트 활용 가이드라인 초안을 공개했고 2026년 하반기 본격 시행이 예상된다는 사실입니다. AI 메모리 의존 비중이 너무 높으면 정책 변동 리스크가 커질 수 있다는 점은 염두에 둬야 합니다. 지금 ChatGPT 메모리에 다섯 가지 페르소나 계정을 만들어 동일 질문을 던져 보세요. 답변에 우리 브랜드가 몇 번 등장하는지가 지금 우리의 GEO 점수입니다.

