"AI 검색 최적화는 그냥 SEO입니다." 2026년 5월 구글 검색 센트럴이 내놓은 새 가이드의 핵심 메시지인데요. 같은 달 iPullRank의 마이크 킹은 이 메시지를 정면 반박했습니다. 단순한 의견 차이가 아니라, ChatGPT·Perplexity·Claude·Gemini가 동시에 인용을 결정하는 멀티플랫폼 시대에 한국 기업이 어떤 전략을 따라야 하는지를 가르는 분기점이에요. 다섯 개의 질문으로 풀어 봅니다.

인포그래픽

구글이 "그냥 SEO"라고 말한 게 왜 위험한가요?

표면적으로는 친절한 말입니다. 새로운 학습 비용을 줄여 주고 기존 SEO 인력 그대로 가도 된다고 안심시켜 주니까요. 그런데 현장에서 만들어내는 결과는 정반대예요. 지오랭크가 만난 한 커머스 기업은 이 가이드를 그대로 받아 GEO 업무를 SEO팀에 그대로 얹었습니다. 예산도, 인원도, KPI 추가도 없이요. 6개월 뒤 그 팀은 번아웃을 호소했고 AI 검색 인용 지표는 측정조차 시작되지 못했죠. 게으름 때문이 아닙니다. 전통 SEO와 GEO는 도구·언어·측정 방식이 모두 다른데요. SEO가 페이지 단위로 키워드 도구와 GSC를 쓰며 순위·CTR·트래픽을 본다면, GEO는 패시지·청크 단위로 벡터 유사도와 임베딩 분석을 활용해 인용률·답변 포함률·SOV를 추적합니다. 인프라 지식도 크롤러·인덱스에서 RAG·에이전트·임베딩 모델로 옮겨갔어요. 같은 사람이 같은 도구로 다룰 수 있는 영역이 아닙니다. GEO는 별도 직무·KPI·예산 라인으로 다뤄야 한다는 게 지오랭크의 결론입니다.

llms.txt는 정말 안 만들어도 되나요?

구글은 "우리는 llms.txt를 읽지 않으니 필요 없다"고 말합니다. 함정은 "우리"라는 단어인데요. 검색 인용을 결정하는 주체가 더 이상 구글만이 아니라는 사실을 슬쩍 가린 표현이에요. Anthropic의 Claude는 명시적으로 llms.txt를 지원하고, Perplexity도 사이트별 가이드 파일을 참조한다는 정황 증거가 여러 곳에서 보고됐습니다. 즉 llms.txt를 만들지 않는 결정은 "구글 외 플랫폼에서의 통제권을 자발적으로 포기"하는 것과 같아요. llms.txt가 하는 역할은 네 가지입니다. AI 크롤러에게 어떤 페이지가 핵심 자료인지 우선순위를 알리고, 오래된·테스트 페이지가 잘못 인용되는 것을 막고, 사용 허용/거부 신호를 주고, 사이트 구조를 메타데이터로 정리합니다. 지오랭크가 운영하는 50개 이상 GEO 클라이언트 중 llms.txt를 도입한 사이트는 ChatGPT 인용 정확도가 평균 32% 더 높았어요. "엉뚱한 페이지가 인용되는 빈도가 줄었다"는 의미인데, 브랜드 리스크 관점에서 이게 더 중요합니다.

청킹은 정말 신경 쓸 필요가 없나요?

구글은 "콘텐츠를 인위적으로 청킹할 필요 없다"고 말합니다. 절반의 진실이에요. 우리가 청킹하지 않아도 검색 시스템이 알아서 청킹을 합니다. 그 결과물이 우리 의도와 맞을 보장은 없죠. 벡터 검색은 사용자 질의를 임베딩으로 변환하고 문서 안의 각 청크와 거리를 계산해 가장 가까운 청크를 인용 후보로 올립니다. 청크가 200~400단어 단위로 의미에 맞게 잘려 있으면 의도한 답이 인용될 확률이 높지만, 1,000단어가 통째로 처리되면 잡음이 섞여 거리 계산이 흐려져요. 청킹 친화적 구조의 다섯 가지 신호는 이렇습니다. 단락 하나에 주장 하나(첫 문장에 결론), 정의·통계·예시 분리, 짧고 검색 의도가 명확한 H2, 비교는 표·절차는 리스트, 청크 하나만 떼어내도 의미가 통하게. 한 의료기기 브랜드는 단락 구조만 이렇게 정렬한 결과 Perplexity 인용 빈도가 4개월 만에 2.7배 늘었습니다. 콘텐츠 양은 1자도 늘리지 않았어요. 다만 과적용은 위험합니다. 한 페이지를 100개 단락으로 쪼갠 사례에서는 이탈률이 38% 올랐어요. 200~400단어, 페이지당 8~15개가 안전선입니다.

AI를 위한 재작성은 자연스러움을 해치지 않나요?

구글은 "AI 검색을 의식한 변형은 불필요, 자연스럽게 쓰라"고 말합니다. 키워드 스터핑을 막으려는 의도라면 옳지만, "AI가 우리 콘텐츠를 어떻게 처리할지 인식하는" 글쓰기까지 거부할 이유는 없어요. 핵심은 두 가지인데요. 엔티티 살리언스 — 페이지가 다루는 핵심 엔티티가 명확히 드러나야 AI가 "이 페이지는 X에 관한 글"이라고 분류합니다. 그리고 명시성 — "많은 사람" 대신 "월간 1,200만 명"처럼 구체적 수치, "최근" 대신 "2026년 5월" 같은 명확한 시점이 벡터 거리를 좁힙니다. "최근 많은 기업이 AI 검색에 관심을 두고 있습니다"와 "2026년 5월 기준 국내 매출 1,000억 이상 기업의 47%가 GEO 전담 예산을 편성했습니다"는 임베딩 공간에서 위치가 완전히 다른 문장입니다. 후자가 인용될 확률이 훨씬 높죠. 그렇다고 모든 문장을 통계로만 채우면 사람이 떠납니다. 지오랭크가 권하는 한국어 GEO 문장 비율은 정의·요약 15%, 통계·수치 20%, 사례·서사 30%, 설명·전개 30%, 의견·관점 5%. 이 비율을 맞추면 같은 주제·같은 분량의 콘텐츠도 인용률이 1.8~3.2배까지 차이가 났어요.

그럼 지금 가장 먼저 손대야 하는 건 뭔가요?

측정과 우선순위 두 가지입니다. 2026년 1분기 글로벌 AI 검색 트래픽은 ChatGPT 58.1%·Perplexity 14.7%·Gemini 11.3%·Copilot 9.8%·Claude 4.2%로 분산되어 있고, 사용자는 평균 2.4개 도구를 병행합니다. 그런데 각 플랫폼은 도메인 권위·패시지 구조·llms.txt·스키마 마크업을 다른 가중치로 평가해요. 그래서 자기 산업의 사용자가 가장 많이 쓰는 두 플랫폼에 80% 자원을 집중하는 게 효율적입니다. 이커머스라면 ChatGPT+Perplexity, 전문직이라면 ChatGPT+Claude, 글로벌 B2B라면 Perplexity+Copilot이 자주 추천되는 조합이에요. 한국어 GEO에서는 한 가지 더 있습니다. 띄어쓰기 변형, 줄임말, 외래어 표기(챗GPT vs ChatGPT)를 한 페이지 안에서 섞으면 엔티티 인식률이 떨어집니다. 결론을 단락 마지막에만 두면 청크 인용 시 결론이 잘리고요. 90일 로드맵으로 보면 — 0~30일에 트래픽 소스 측정과 llms.txt 배포·핵심 10개 페이지 패시지화, 31~60일에 엔티티 정렬·표/리스트 재구성·내부 링크 강화, 61~90일에 멀티플랫폼 인용 모니터링과 콘텐츠 재작성 KPI 도입. 이 흐름만 잡아도 인용 정확도 +30%, 인용 빈도 +50%가 통상적인 결과로 나옵니다. 구글 가이드는 베이스라인으로, GEO 가이드는 확장 레이어로. 이게 멀티플랫폼 시대의 정답입니다.