대부분의 GEO 업체는 키워드 도구로 뽑은 200~500개 키워드로 진단을 끝낸 뒤 콘텐츠 작성에 들어갑니다. 그 정도 데이터가 6개월짜리 콘텐츠 전략의 방향을 결정하고, 마케터의 감과 경쟁사 한두 곳의 메타태그가 더해지면 그 6개월은 사실상 추측 위에 세워집니다. 발행 후 3개월이 지나서야 안 먹힌다는 사실을 알게 되는 패턴이 반복되는 이유인데요. 저희 지오랭크는 시작이 다릅니다. 프로젝트 착수 후 첫 1주 동안 콘텐츠는 단 한 글자도 쓰지 않습니다. 대신 네이버 플레이스와 구글 비즈니스 후기, 경쟁사 리뷰 같은 시장 빅데이터를 최대 250만 건 모읍니다. 빅데이터 플랫폼에서 출발해 GEO로 확장한 팀이라서 리뷰 데이터 수집과 토픽 모델링이 GEO 진단의 기본 입력값이라고 봅니다. 1주의 진단을 거치면 잘못된 콘텐츠 12편을 발행하는 비용을 사전에 막을 수 있습니다.

인포그래픽

피부과 K사: 전국 2,000개 후기 250만 건이 보여준 빈 슬롯

K피부과는 서울·경기 8개 분점을 가진 중견 피부과로 사전 진단 없이 GEO를 6개월 운영했지만 ChatGPT와 Perplexity 어디에도 인용이 잡히지 않은 상태에서 저희에게 의뢰가 들어왔습니다. 저희가 첫 1주에 한 일은 단순했습니다. 전국 약 2,000개 피부과의 네이버 플레이스 리뷰와 구글 비즈니스 리뷰 약 250만 건을 분산 크롤러로 수집했고, 정제 후 토픽 모델링에서 92개의 군집이 나왔습니다. 그 중 재방문 결정 요인 군집이 K사의 강점과 정확히 일치했는데요. 동시에 ChatGPT, Perplexity, Gemini, Claude 네 모델에 피부과 추천 질의를 던져 AI 답변 토픽을 매핑했더니, 리프팅 가격 토픽은 이미 인용 점유율이 포화 상태였지만 10년 단위 재방문율 토픽은 인용 점유율이 약 4%에 불과해 시장은 묻고 있지만 AI가 답하지 못하는 빈 슬롯이라는 점이 드러났습니다. K사의 자체 데이터를 다시 보니 8년 평균 재방문율이 약 38%였는데도 콘텐츠로 정리된 적이 한 번도 없었습니다. 이 인사이트가 GEO 콘텐츠 12편의 핵심 축이 되었고, 발행 8주차에 ChatGPT 답변 내 인용 1건 확보, 12주차에 Perplexity 동일 질의 인용 점유율 18% 달성, 본원 예약 페이지 GEO 채널 유입은 월 약 320건에서 1,140건으로 늘었습니다. 첫 2주차에 토픽 모델링 결과가 너무 일반적이라 정제 파이프라인을 한 번 더 짠 적이 있었고 분점별 재방문율 편차 때문에 평균값만 쓸 수 없어 분점 단위 검증을 한 번 더 거치는 시행착오도 있었지만, 1주의 데이터 진단이 있었기에 잘못된 콘텐츠 12편을 발행하는 사고는 막을 수 있었습니다.

커머스 E사: 자사 리뷰는 일부러 빼고 경쟁사 20만 건만 본 이유

E뷰티 브랜드는 베스트셀러가 정체기에 들어간 상태로 의뢰했고, 저희는 자사 리뷰를 일부러 분석에서 제외했습니다. 자사 시각이 들어가면 자사 강점이 과대 평가되기 때문에 외부 시각만으로 시장을 정의해야 했고, 네이버 스마트스토어와 쿠팡 상위 경쟁사 12종의 리뷰 약 20만 건만 수집했습니다. 경쟁사 부정 리뷰 상위 토픽 3개가 포장 파손, 용기 누액, 재구매 망설임이었는데요. E사는 이미 에어캡 3중 포장과 누액 시 100% 재배송 정책을 운영하고 있는데도 자사 콘텐츠 어디에도 한 문장 노출이 없었습니다. 강점을 가지고 있으면서 시장이 그 강점을 인식할 통로를 만들지 않은 셈이었습니다. GEO 콘텐츠 8편에 이 두 차별점을 청크 단위로 일관되게 배치한 결과 6주 뒤 Perplexity의 비교 질의에서 인용 점유율 22%, ChatGPT 답변 내 E사 멘션 빈도가 0건에서 주당 약 14건으로 증가, 자사몰 신규 방문자 비율은 전월 대비 1.7배, 장바구니 전환율도 1.4배로 올라왔습니다. 한 가지 한계도 있었는데 경쟁사 신상품이 추가될 때마다 진단 일부를 재실행해야 해서 분기마다 약 2일의 재진단 비용이 발생합니다. 그래도 데이터 진단이 강점을 발굴해 줬다는 점에서 이 케이스의 의미는 분명했습니다.

왜 250만 건이고, 왜 1주가 최소 단위인가

가장 많이 받는 질문이 왜 그렇게 많이 모으느냐인데요. 적은 표본은 마케터의 편향을 그대로 반영합니다. 1만 건 단위로는 상위 10%의 목소리만 보이고 정작 의사결정에 영향을 미치는 부정 리뷰와 중립 리뷰가 묻힙니다. 토픽 모델링에서 의미 있는 군집은 보통 80개 이상이 나와야 비어 있는 슬롯이 드러나는데 그 임계점이 보통 200만 건 부근입니다. 지역별 차이도 큽니다. 리프팅 한 단어를 봐도 서울 강남권에서는 다운타임 길이가 부정 토픽 1순위지만 부산권에서는 재방문 부담이 1순위로 나옵니다. 진단 프로세스는 정해져 있습니다. Day 1~2는 산업과 경쟁권 정의 및 분산 크롤러 셋업, Day 3~5는 광고성 리뷰 제거와 한국어 형태소 분석, Day 6은 임베딩 벡터 클러스터링과 ChatGPT·Perplexity·Gemini·Claude 네 모델 답변 토픽 매핑, Day 7은 시장 토픽과 AI 답변 토픽을 교차한 우선순위 매트릭스 작성입니다. 시장 수요는 높은데 AI 인용 점유율이 낮은 영역이 첫 공략 대상이 되는 구조인데요. 타 업체가 90일 잡는 진단 기간을 저희는 10일로 줄였고 2달 안에 50% 이상의 인용 가시성을 확보합니다. 데이터 기반 GEO의 핵심은 더 잘 쓰는 게 아니라 어디에 쓸지를 먼저 아는 작업이라는 점입니다. 빈 슬롯의 위치는 감이 아니라 250만 개의 리뷰가 알려줍니다.