이제 Claude Opus 4.6과 Sonnet 4.6의 100만 토큰 컨텍스트 창을 제공합니다. 추가 비용은 없이 900K 토큰 요청도 9K 요청과 동일한 단가가 적용된다고 합니다. 뭐가 좋아졌는지 파악해봤습니다.
———
압축이 왜 문제였나
큰 작업을 하다 보면 어느 순간 대화가 리셋됩니다. 한도에 가까워지면 내용을 자동 요약하고 그 요약본을 새 창의 시작점으로 씁니다. 손실 압축이죠. Datadog, 데이터베이스, 소스코드를 뒤지다 보면 10만 토큰이 금방 소진되고 압축이 시작됩니다. 그러면 디버깅을 처음부터 다시 하게 되죠.
압축을 줄이면 오히려 토큰이 줄어들 수도 있다
컨텍스트를 500K로 늘린 한 팀은 오히려 총 토큰 사용량이 줄었다고 합니다. 압축 > 재파악 > 재탐색 사이클 자체가 추가 토큰을 소모했기 때문인데요. 오히려 압축이 비용을 아끼는 게 아니라 비용을 만들고 있었던 거죠.
그래도 작업에 따라 다르다
맥락을 길게 유지할수록 토큰은 누적됩니다. 제가 하는 짧고 단순한 작업이라면 여전히 /compact가 유리할것 같습니다. 1M 컨텍스트가 필요한 건 코드베이스 전체 탐색, 긴 디버깅 세션처럼 복잡한 장시간 작업입니다. 이런 작업일수록 압축 비용이 맥락 유지 비용보다 더 커질 수 있죠. 저는 아직 이런 경우는 없는 것 같습니다.
———
에이전트가 장시간 독립적으로 동작할수록 중간에 맥락을 잃지 않는 것이 핵심이지만, 적절하게 잘 활용해야 효율적인 사용이 가능할 것 같네요. 무지막지하게 토큰을 날릴 수도 있습니다🤣
해시태그#Claude 해시태그#AI
이미지 출처 : Claude blog


