AI 답변에서 제외되는 콘텐츠 — 마케터가 자주 빠지는 5가지 함정

지난 4편에서 GEO 콘텐츠가 갖춰야 할 5가지 핵심 요소와 멀티소스 권위를 만드는 4단계 채널 배포 전략을 정리했다. 이번 편은 그 반대다. AI 답변에서 제외되는 콘텐츠는 어떤 패턴을 갖고 있는가.

문제는 단순하지 않다. 마케터가 SEO 시대에 "잘 통한다"고 배운 기법 중 일부가 GEO 시대에는 역효과를 낸다. SIGKDD 2024 GEO 연구는 검증된 가시성 향상 기법뿐 아니라 가시성을 떨어뜨리는 패턴도 함께 측정했다. 여기에 RAG·크롤러 진입 조건까지 더하면 마케터가 피해야 할 함정 5가지가 명확해진다.

이 글은 그 5가지 Anti-Pattern을 정리한 가이드다. 각 패턴마다 왜 역효과를 내는지 메커니즘과 함께 본다.

1.키워드 반복 삽입 (Keyword Stuffing)

전통 SEO 시대에 "콘텐츠 안에 핵심 키워드를 자주 박아라"는 조언은 표준이었다. 검색 엔진의 키워드 매칭 알고리즘이 키워드 빈도를 핵심 신호로 사용했기 때문이다.

GEO 시대에는 정반대다. SIGKDD 2024 연구는 동일 키워드를 인위적으로 반복 삽입한 콘텐츠의 가시성이 무최적화 콘텐츠 대비 약 8.3% 하락한 것을 확인했다(Table 1, Word Count Visibility). 9가지 GEO 기법 중 유일하게 음(-) 효과를 낸 기법이다.

이유는 RAG 메커니즘에 있다. AI는 의미 벡터로 콘텐츠를 분석하고 답변에 사용할 출처를 고른다. 같은 키워드가 반복되면 의미 다양성이 떨어지고, AI는 이를 "정보 밀도가 낮은 콘텐츠"로 인식한다. SEO에서 통하던 키워드 밀도 전략이 GEO에서 정면 역효과를 내는 것이다.

대안은 단순하다. 같은 의미를 다양한 표현·동의어·관련 개념으로 풀어내는 것. AI는 키워드 일치보다 의미 일치를 본다.

2.핵심 답변을 글 후반에 배치하는 구조

마케터가 흔히 쓰는 글 구조는 서론·본론·결론이다. 서론에서 분위기를 풀고, 본론에서 정보를 전개하고, 결론에서 핵심을 정리한다. SEO 시대까지는 이 구조가 작동했다. 사용자가 글을 끝까지 읽기 때문이다.

GEO 시대에는 이 구조가 함정이다. AI는 RAG 단계에서 콘텐츠를 의미 벡터로 분석하고, 글 첫 부분에 가장 큰 가중치를 둔다. 사용자 질문과 의미적으로 유사한 문장이 글 앞부분에 있으면 AI가 그 문장을 답변 출처로 우선 선택한다.

핵심 답변이 글 후반 결론에 있는 콘텐츠는 RAG 검색 단계에서 후보 문서로 선택될 확률이 떨어진다. AI는 글의 끝까지 기다리지 않는다.

대안은 콘텐츠 첫 100~200자 안에 사용자 질문에 대한 명확한 답을 1~2문장으로 정리하는 것이다. Quick Answer 박스 패턴이 표준 형태가 되고 있는 이유다.

3.자사 단일 채널에서만 메시지 노출

GEO 시리즈 4편에서 다룬 멀티소스 권위의 정반대 패턴이다. 자사 사이트 한 곳에서만 자기 브랜드를 외치는 콘텐츠 전략은 AI 인용 측면에서 약하다.

SIGKDD 2024 논문은 생성형 엔진의 작동 방식을 "synthesizing information from multiple sources"로 정의한다. AI는 단일 출처보다 여러 도메인에서 일관되게 등장하는 정보를 신뢰 신호로 받아들인다. 자사 사이트 한 곳에서만 등장하는 브랜드는 AI 입장에서 "검증되지 않은 단일 주장"이다.

문제는 마케터가 자주 빠지는 함정 — 자사 콘텐츠 품질을 높이는 것에만 집중하고 외부 채널 분산은 후순위로 미루는 것이다. 자사 콘텐츠 품질 + 외부 채널 누적은 곱하기로 작동하지 동시에 가야 한다.

대안은 4편에서 다룬 4단계 외부 채널 배포 — 권위 미디어, 산업 매체, 커뮤니티·뉴스에 같은 메시지의 변형을 분산시키는 작업이다.

4.Schema 구조화 데이터 미적용

이 함정은 콘텐츠 자체의 품질과 무관하게 작동한다. 글이 좋아도 schema가 없으면 AI가 콘텐츠 구조를 정확히 해석하지 못한다.

schema.org는 HTML 페이지에 "이 부분이 질문, 이 부분이 답변, 이 부분이 가격, 이 부분이 평점"이라는 의미 라벨을 붙이는 표준이다. JSON-LD 형식으로 페이지 head 또는 본문에 삽입한다. AI는 schema가 박힌 페이지에서 정확한 부분만 발췌해 답변에 인용할 수 있다.

schema 없는 콘텐츠는 AI가 텍스트 전체를 통째로 해석해야 하므로, 답변에 인용될 부분을 정확히 골라내기 어렵다. 결과적으로 답변 후보에서 밀린다.

문제는 schema 적용이 기술적 작업이라 콘텐츠 마케터가 직접 처리하기 어렵다는 점이다. 그래서 자주 누락된다. 그러나 GEO 시대에는 schema 적용이 콘텐츠 발행 작업의 일부로 통합되어야 한다.

대안은 글 유형별 표준 schema를 사용하는 것이다. Q&A 섹션엔 FAQPage, 일반 정보엔 Article, 제품 비교엔 Product + Offer + AggregateRating, 의료 정보엔 MedicalWebPage 등 schema.org 표준 유형이 있다.

5.AI 크롤러를 robots.txt에서 차단

가장 단순하면서도 자주 발견되는 함정이다. 사이트 robots.txt에서 AI 크롤러를 차단한 경우 ChatGPT Search·Perplexity·Gemini 답변에 콘텐츠가 등장할 기회 자체가 없다.

OpenAI는 두 종류의 크롤러를 운영한다. 모델 학습용 GPTBot과 실시간 검색용 OAI-SearchBot이다. 이 외에 ChatGPT-User, ClaudeBot, PerplexityBot, Google-Extended 같은 AI 크롤러들이 있다. robots.txt에서 이들 중 일부 또는 전부를 Disallow로 차단하면 해당 AI는 사이트 콘텐츠를 인식하지 못한다.

차단이 의도적인 경우도 있지만, 의도하지 않게 차단된 경우가 더 흔하다. 옛날에 만든 robots.txt를 그대로 둔 채 AI 크롤러 등장 시점에 업데이트하지 않은 케이스, 또는 보안 정책상 모든 봇을 차단한 케이스 등이다.

대안은 robots.txt 점검이다. AI 노출을 원하는 사이트라면 다음 크롤러를 명시적으로 Allow하는 것이 표준이 되고 있다 — GPTBot, OAI-SearchBot, ChatGPT-User, ClaudeBot, PerplexityBot, Google-Extended, Bingbot.

다섯 가지 함정의 공통 메커니즘

각 Anti-Pattern은 표면적으로 다르지만, 공통 메커니즘이 있다. GEO 시대에는 SEO 시대와 다른 평가 기준이 작동한다는 점이다.

SEO는 검색 엔진의 키워드 매칭 + 페이지 권위(백링크) 알고리즘이 핵심이었다. GEO는 RAG 메커니즘 + 의미 벡터 검색 + 멀티소스 권위가 핵심이다. 두 평가 기준이 부분적으로 다르고, 일부 영역에서는 정면 충돌한다.

마케터가 "SEO 잘 하면 GEO도 자동"이라고 생각하면 이런 함정에 빠진다. 키워드 반복(SEO에서 통함, GEO에서 역효과), 결론 후반 배치(SEO에서 무관, GEO에서 약함), 자사 도메인 권위 집중(SEO 강점, GEO에서 단일 출처), schema 적용 안 함(SEO에서 큰 영향 없음, GEO에서 결정적), AI 크롤러 차단(SEO와 무관, GEO에서 진입 차단).

GEO 시대의 마케터는 SEO 자산 위에 GEO 레이어를 추가로 쌓아야 하는데, 이 추가 작업을 안 하면 5가지 함정 중 어느 하나에 걸린다.

마케터 점검 체크리스트 — 5가지 함정 자가 진단

자사 콘텐츠가 5가지 함정에 빠져 있는지 다음으로 점검할 수 있다.

키워드 밀도 점검 — 핵심 키워드가 글에 몇 번 등장하는가. 100자당 1번 이하면 자연스러운 수준, 100자당 2번 이상이면 키워드 스터핑 의심.

첫 100자 점검 — 글 첫 100자 안에 사용자 질문에 대한 명확한 답이 있는가. 서론으로만 채워져 있으면 RAG 후보 선정에서 밀린다.

외부 채널 노출 점검 — 자사 사이트 외 권위 미디어·산업 매체·커뮤니티에서 자사 브랜드가 자연스럽게 언급되고 있는가. 자사 도메인에서만 등장하면 멀티소스 권위 부재.

schema 적용 점검 — 핵심 콘텐츠에 FAQPage·Article·Product 등 schema.org 표기가 적용되어 있는가. 아니면 AI가 콘텐츠 구조를 정확히 해석하지 못한다.

robots.txt 점검 — AI 크롤러(GPTBot·OAI-SearchBot·PerplexityBot 등)를 의도하지 않게 차단하고 있지 않은가.

다섯 가지를 모두 점검해 함정을 제거하는 것만으로도 AI 답변 인용 빈도가 누적적으로 상승한다. 함정 하나를 그대로 두면 다른 네 가지를 잘 해도 전체 효과가 떨어진다.

다음 칼럼에서는 시리즈를 정리하면서 AI 검색에 진짜 인용되는 GEO 업체를 고르는 5가지 기준을 다룰 예정이다. 마케터가 GEO 외주를 맡길 때 어떤 기준으로 검증해야 하는지 정리한 가이드다.

참고 문헌

Aggarwal, P. et al. (2024). GEO: Generative Engine Optimization. ACM SIGKDD 2024. arXiv:2311.09735

AWS. What is Retrieval-Augmented Generation (RAG).

OpenAI. ChatGPT Search Help Center.

로딩 중...