AI에 인용되는 GEO 콘텐츠가 갖춘 5가지 공통점

같은 주제로 다섯 편을 발행했는데 ChatGPT는 한 편만 인용한다. 비슷한 분량, 비슷한 키워드, 비슷한 정보량인데 결과는 갈린다. 그 한 편이 가진 차이는 무엇일까.

마케터들이 "콘텐츠를 잘 쓰면 AI도 결국 인용해 줄 것"이라고 막연히 생각하는 시기는 지났다. AI 검색은 콘텐츠를 평가하는 자체 기준을 가지고 있고, 그 기준은 SIGKDD 2024에 발표된 GEO 연구(Aggarwal et al., Princeton·Georgia Tech·IIT Delhi·Allen AI Institute 공동)에서 1만 개 쿼리 분석을 통해 구체적으로 수치화됐다.

이 글에서는 데이터로 검증된 AI 인용 콘텐츠의 5가지 공통점을 정리한다. 단순한 가설이 아니라 실측된 가시성 향상률 기반이다.

1. 수치·통계 데이터 인용 — 가시성 +41%

AI는 주장이 아니라 근거를 신뢰한다. 같은 정보라도 "효과적이다"라고 추상적으로 쓴 콘텐츠와 "ACM SIGKDD 2024 연구 결과 가시성 41% 상승"처럼 구체 수치를 인용한 콘텐츠는 AI 답변에 등장하는 빈도가 다르다.

SIGKDD 2024 연구는 콘텐츠에 통계·수치 데이터를 추가한 경우 AI 가시성이 평균 41% 상승하는 것을 확인했다. AI가 답변을 생성할 때 사용자에게 제공할 수 있는 "검증 가능한 정보"를 우선시하기 때문이다. 추상적 형용사보다 구체 숫자가 답변의 신뢰도를 높여주고, 사용자도 출처를 그대로 받아들이기 쉽다.

실무 적용은 단순하다. "많은 기업이 도입했다" 대신 "2025년 1분기 기준 X 산업 상위 100개 기업 중 N곳이 도입했다"로 바꾼다. 출처가 있는 수치를 본문에 자연스럽게 배치한다.

2. 외부 권위 출처 인용 — 가시성 +115%

같은 연구에서 가장 큰 효과를 보인 요소다. 외부 권위 출처를 본문에 인용한 경우 하위 콘텐츠 기준으로 가시성이 115% 상승했다. 다섯 가지 요소 중 단일 효과 기준 가장 강력한 신호다.

권위 출처란 정부 공인 통계, 학술 논문, 산업 협회 리포트, 표준 문서, 검증된 매체의 보도 등이다. 한 편의 글 안에 외부 권위 출처가 두세 군데 자연스럽게 배치되어 있으면, AI는 이 콘텐츠를 단순한 의견이 아니라 검증된 정보의 종합으로 인식한다.

흥미로운 점은 외부 출처 인용이 자사 사이트의 "권위"를 빌리는 것보다 효과적이라는 것이다. 자사 도메인에서 자기 주장을 반복하는 것보다, 외부 권위 출처를 인용하면서 자사 인사이트를 덧붙이는 구조가 AI 답변에 더 잘 들어간다.

3. 인용문(Quotation) 삽입 — 가시성 +28%

세 번째로 검증된 요소는 인용문 삽입이다. 본문 안에 다른 전문가, 보고서, 인터뷰의 직접 인용문(블록 인용)을 넣는 경우 가시성이 28% 상승한다.

인용문이 효과를 내는 이유는 두 가지다. 첫째, AI는 인용 부호로 둘러싸인 텍스트를 "원문 그대로 가져와도 안전한 정보"로 인식한다. 답변 생성 시 그대로 발췌해 사용하기 쉽다. 둘째, 인용문은 콘텐츠의 다층 구조를 만든다. 단일 저자의 주장이 아니라, 여러 권위 있는 화자의 목소리가 모인 콘텐츠라는 신호다.

실무에서는 학술 논문의 결론 한 문장, 산업 보고서의 핵심 수치 한 줄, 업계 전문가 인터뷰의 직접 발언 등을 블록 인용 형태로 넣으면 된다. 출처와 함께 명시하는 것이 필수다.

4. 핵심 답변의 앞 배치 — AI는 서론을 기다리지 않는다

네 번째 요소는 SIGKDD 연구의 명시적 수치는 없지만, AI 검색 메커니즘 분석에서 반복적으로 확인된다. 콘텐츠 첫 100~200자 안에 질문에 대한 핵심 답변이 있어야 한다.

이유는 RAG(Retrieval-Augmented Generation) 메커니즘에 있다. AI는 사용자 질문과 의미적으로 유사한 문서를 벡터 검색으로 찾고, 그중 답변에 사용할 부분을 LLM에 넘긴다. 이 과정에서 콘텐츠의 앞부분이 가장 큰 가중치를 받는다. 글의 후반에 핵심 답변을 배치하면 AI가 그 부분에 도달하기 전에 다른 콘텐츠를 우선 선택할 가능성이 높다.

서론으로 분위기를 풀고 본론을 뒤에 배치하는 전통적 글쓰기 구조는 SEO 시대까지는 통했지만, GEO 시대에는 역효과다. 글 첫 단락에 질문 + 핵심 답변 1~2문장을 명확히 정리한 "Quick Answer" 박스를 넣는 것이 표준 패턴이 되고 있다.

5. Schema 구조화 데이터 적용

다섯 번째는 기술적 요소다. schema.org 표기를 본문에 추가해 AI가 콘텐츠 구조를 명시적으로 이해할 수 있게 만드는 작업이다.

대표적 schema 유형은 다음과 같다. 일반 정보 글에는 Article 또는 BlogPosting, Q&A 섹션에는 FAQPage, 제품 비교 글에는 Product + Offer + AggregateRating, 의료 정보에는 MedicalWebPage. 각 schema는 JSON-LD 형식으로 페이지 head 또는 본문에 삽입한다.

Schema가 효과를 내는 메커니즘은 AI의 콘텐츠 파싱 단계에 있다. 단순 HTML 텍스트만 있는 페이지보다 schema 표기가 박힌 페이지는 AI가 "이 부분이 질문, 이 부분이 답변, 이 부분이 가격, 이 부분이 평점"이라고 정확히 분리할 수 있다. 답변을 만들 때 정확한 부분만 발췌해 인용할 가능성이 높아진다.

함께 작용하는 다섯 번째 외부 요소: 멀티소스 권위

위 다섯 가지가 콘텐츠 내부 요소라면, 외부에서 함께 작동하는 마지막 변수가 있다. 멀티소스 권위(Multi-Source Authority) 다.

같은 SIGKDD 2024 연구에서 검증된 결과로, 4개 이상의 독립 채널에서 언급된 브랜드는 자체 사이트만 있는 브랜드보다 ChatGPT에서 평균 2.8배 더 자주 인용된다. Previsible의 2025 AI Traffic Report에서도 콘텐츠를 다양한 플랫폼에 배포한 경우 자체 사이트 단독 게재 대비 AI 인용이 최대 325% 증가하는 것으로 보고됐다.

즉 위 5가지 요소를 자사 콘텐츠 한 편에 모두 적용했다고 끝난 게 아니다. 그 콘텐츠가 외부 미디어, 산업 리포트, 커뮤니티, 뉴스 등 여러 독립 채널에서 자연스럽게 언급되고 있어야 AI 인용이 누적된다.

AI가 인용하지 않는 콘텐츠 — Anti-Pattern

같은 연구에서 가시성을 떨어뜨리는 요소도 확인됐다. 가장 대표적인 것은 키워드 반복 삽입이다. 동일 키워드를 인위적으로 반복한 경우 가시성이 기준 대비 10% 떨어졌다. 전통 SEO에서 통하던 키워드 밀도 전략이 GEO에서는 역효과다.

또 다른 함정은 "AI 친화적"이라는 명목으로 콘텐츠 구조를 단조롭게 만드는 것. 모든 단락에 헤더만 박고 풀어쓴 설명이 없는 콘텐츠는 AI가 답변 후보로 잘 선택하지 않는다. 구조화는 필요하지만, 자연스러운 서술과 결합되어야 한다.

마케터 체크리스트 — 지금 점검할 5가지

원리를 이해했다면 자사 콘텐츠 한 편을 골라 다음 5가지를 점검해보자.

수치 데이터 — 본문에 출처 있는 통계·숫자가 최소 2~3건 인용되어 있는가

외부 권위 출처 — 정부 통계, 학술 논문, 산업 보고서 등이 본문에 인용되어 있는가

인용문 — 블록 인용 형식의 직접 인용이 한두 군데 들어가 있는가

핵심 답변 앞 배치 — 첫 100자 안에 질문에 대한 명확한 답이 있는가

Schema — Article, FAQPage, Product 등 적절한 schema.org 표기가 적용되어 있는가

다섯 가지를 모두 충족하면 가시성 누적 효과는 단순 합산이 아니다. SIGKDD 연구는 다중 적용 시 효과가 곱하기로 작용할 가능성을 시사한다(개별 효과 +41%, +115%, +28% 등을 단순 합산하면 100%를 훨씬 넘는다).

GEO 시대의 콘텐츠는 "잘 쓰는 것"으로 충분하지 않다. 데이터로 검증된 인용 메커니즘을 정확히 이해하고, 콘텐츠 내부와 외부 모두에서 그 신호를 누적하는 작업이다.

다음 칼럼에서는 AI 검색 플랫폼별 인용 메커니즘 — ChatGPT·Perplexity·Gemini 각각의 RAG 차이를 다룰 예정이다.

참고 문헌

Aggarwal, A. et al. (2024). GEO: Generative Engine Optimization. ACM SIGKDD 2024.

Previsible (2025). 2025 AI Traffic Report.

AWS. What is Retrieval-Augmented Generation (RAG).

로딩 중...