Categories: IT/개발

Claude Code MCP Tool Search: 토큰 85% 절약하는 동적 도구 로딩 완벽 가이드

“MCP 서버 4개 연결했더니 토큰이 67,000개나 사라졌어요.”

Reddit의 한 개발자가 올린 글입니다. Claude Code를 쓰는 개발자라면 한 번쯤 겪어봤을 상황이죠.

MCP(Model Context Protocol)는 Claude Code의 핵심 기능입니다. GitHub, Docker, 데이터베이스 등 외부 도구를 연결해서 AI의 능력을 확장할 수 있거든요. 문제는 이 도구들이 **컨텍스트 윈도우를 잡아먹는다**는 겁니다.

오늘은 이 문제를 해결하는 **MCP Tool Search** 기능을 파헤쳐보겠습니다.

문제: MCP가 컨텍스트를 잡아먹는다

숫자로 보는 현실

Claude Code에 MCP 서버를 연결하면 어떤 일이 벌어질까요?

MCP 서버 도구 수 소비 토큰
Docker MCP 135개 125,964 토큰
GitHub MCP 93개 ~55,000 토큰
Omnisearch (기존) 20개 ~14,100 토큰

Docker MCP 서버 **하나**만 연결해도 125,000 토큰이 사라집니다. Claude Code의 컨텍스트 윈도우가 200K 토큰이라고 치면, 서버 하나에 **62.5%**가 날아가는 거예요.

⚠️ 실제 사례: Scott Spence의 경험

개발자 Scott Spence는 MCP 도구를 모두 활성화했을 때 143K/200K 토큰(72%)을 사용하고 있었습니다. MCP 도구만 82K 토큰(41%)을 차지했고, 실제로 작업에 쓸 수 있는 공간은 12K 토큰(5.8%)밖에 남지 않았습니다.

왜 이런 일이 생기나?

기존 방식에서는 MCP 서버를 연결하면 **모든 도구 정의**가 컨텍스트에 사전 로드됩니다:

  • 도구 이름
  • 설명
  • JSON 스키마
  • 파라미터, 타입, 제약 조건

50개, 100개, 135개 도구에 이걸 곱하면? 토큰이 순식간에 증발합니다.

더 큰 문제는 **성능 저하**입니다. 도구가 너무 많으면:

  • 도구 선택 정확도 하락
  • 파라미터 환각(hallucination) 증가
  • 주의(attention) 분산
  • 응답 지연 증가

해결책: MCP Tool Search

2026년 1월 14일, Anthropic의 Thariq Shihipar가 트위터에서 발표했습니다:

💡 공식 발표

“MCP 서버는 50개 이상의 도구를 가질 수 있고, 이는 많은 컨텍스트를 차지합니다. Tool Search는 Claude Code가 도구를 동적으로 컨텍스트에 로드할 수 있게 해줍니다.”

작동 원리: 5단계 프로세스

MCP Tool Search는 **지연 로딩(Lazy Loading)** 패턴을 도구에 적용한 것입니다.

단계 동작 설명
1 감지 도구 정의가 컨텍스트의 10% 초과하는지 확인
2 지연 임계값 초과 시 도구를 defer_loading: true로 표시
3 검색 도구 주입 모든 정의 대신 MCPSearch 도구 제공
4 온디맨드 발견 Claude가 필요할 때 키워드로 도구 검색
5 선택적 로딩 쿼리당 3-5개 관련 도구만 로드

핵심은 **”필요할 때만 로드”**입니다. 모든 도구 정의를 미리 올리는 대신, Claude가 실제로 필요한 도구만 그때그때 검색해서 가져옵니다.

성능 개선: 숫자로 증명

지표 기존 Tool Search 적용 개선율
토큰 사용량 (50+ 도구) ~77K ~8.7K -85%
가용 컨텍스트 122,800 토큰 191,300 토큰 +56%
Opus 4 정확도 49% 74% +25%p
Opus 4.5 정확도 79.5% 88.1% +8.6%p

Anthopic 엔지니어링 팀의 내부 테스트 결과, 대규모 도구 라이브러리에서 정확도가 크게 향상되었습니다.

설정 방법: 3가지 옵션

1. 기본값 (자동 모드)

Claude Code **2.1.7 버전부터 기본 활성화**되어 있습니다. 별도 설정 없이도 작동합니다.

✅ 자동 활성화 조건

MCP 도구 정의가 컨텍스트 윈도우의 10%를 초과하면 자동으로 Tool Search가 활성화됩니다. 도구가 적으면 기존 방식대로 작동합니다.

2. 환경 변수로 제어

# 기본값: 컨텍스트 10% 초과 시 활성화
ENABLE_TOOL_SEARCH=auto claude

# 커스텀 임계값: 5% 초과 시 활성화 (더 적극적)
ENABLE_TOOL_SEARCH=auto:5 claude

# 항상 활성화 (도구 수 상관없이)
ENABLE_TOOL_SEARCH=true claude

# 비활성화 (기존 방식으로 전체 로드)
ENABLE_TOOL_SEARCH=false claude

3. settings.json 설정

영구적으로 설정하려면:

{
  "env": {
    "ENABLE_TOOL_SEARCH": "auto:5"
  }
}

옵션 정리

동작 권장 상황
auto 10% 초과 시 활성화 (기본값) 대부분의 경우
auto:N N% 초과 시 활성화 세밀한 제어 필요 시
true 항상 활성화 많은 MCP 서버 사용 시
false 비활성화 도구 수가 적거나 자주 사용되는 경우

주의사항: 모델 호환성

MCP Tool Search는 **`tool_reference` 블록을 지원하는 모델**에서만 작동합니다.

모델 지원 여부
Sonnet 4 이상 ✅ 지원
Opus 4 이상 ✅ 지원
Haiku 모델 ❌ 미지원

Haiku를 사용 중이라면 Tool Search가 작동하지 않으니 주의하세요.

✅ Tool Search 장점

  • 토큰 사용량 85% 절약
  • 더 많은 MCP 서버 연결 가능
  • 도구 선택 정확도 향상
  • 기본 활성화로 설정 불필요

❌ Tool Search 단점

  • Haiku 모델 미지원
  • 도구 검색에 약간의 지연 발생
  • 서버 명령어 최적화 필요
  • 일부 특수 도구 검색 누락 가능

MCP 서버 개발자를 위한 팁

Tool Search가 활성화되면 **서버 명령어(server instructions)** 필드의 중요성이 커집니다. Claude가 도구를 검색할 때 이 설명을 참고하거든요.

💡 좋은 서버 명령어 예시

GitHub 관련 모든 작업 처리: PR 리뷰, 이슈 생성, 코드 변경 사항 조회.
코드 리뷰나 GitHub 인터랙션이 필요할 때 이 서버의 도구를 검색하세요.

핵심은:

  • 서버가 처리하는 작업 카테고리 명시
  • Claude가 언제 검색해야 하는지 안내
  • 주요 기능 나열

버전 히스토리

버전 변경사항
2.0.70 와일드카드 퍼미션 추가 (mcp__server__*)
2.0.74 list_changed 알림 지원 – 서버 재연결 없이 도구 동적 업데이트
2.1.7 Auto mode 기본 활성화 – 10% 초과 시 자동 전환
2.1.9 auto:N 문법 추가 – 임계값 커스터마이징 가능

트러블슈팅: 문제가 생겼다면

⚠️ Tool Search가 작동하지 않는 경우

  • Haiku 모델 사용 중 → Sonnet 4 또는 Opus 4 이상으로 변경
  • 구버전 사용 중claude --version으로 2.1.7 이상인지 확인
  • 수동으로 비활성화됨 → settings.json에서 disallowedTools에 MCPSearch가 있는지 확인

💡 도구가 검색되지 않는 경우

MCP 서버의 server instructions를 개선해보세요. Claude는 이 설명을 참고해서 도구를 검색합니다. 서버가 처리하는 작업 카테고리를 명확히 적어주면 검색 정확도가 올라갑니다.

자주 묻는 질문 (FAQ)

Q. Tool Search를 끄면 성능이 좋아지나요?

아니요, 반대입니다. MCP 도구가 많을수록 Tool Search를 켜두는 게 유리합니다. 끄면 모든 도구가 사전 로드되어 토큰을 많이 소비하고, 오히려 도구 선택 정확도가 떨어집니다.

Q. auto:N에서 N 값은 뭘로 설정하는 게 좋나요?

대부분의 경우 기본값(auto, 10%)이 적절합니다. MCP 서버를 많이 사용한다면 auto:5로 더 적극적으로 활성화할 수 있고, 도구가 적다면 auto:15로 느슨하게 설정할 수 있습니다.

Q. Tool Search가 켜지면 뭔가 달라지나요?

사용자 입장에서는 거의 차이를 못 느낍니다. MCP 도구가 평소처럼 작동하고, Claude가 내부적으로 필요한 도구만 검색해서 로드합니다. 토큰 절약은 자동으로 이루어집니다.

Q. 특정 MCP 서버만 Tool Search에서 제외할 수 있나요?

현재는 전체 활성화/비활성화만 가능합니다. 특정 서버만 제외하려면 해당 서버의 도구를 줄이거나, ENABLE_TOOL_SEARCH=false로 전체를 끄고 수동 관리해야 합니다.

마무리: 컨텍스트 경제의 패러다임 전환

📌 핵심 정리

  • MCP Tool Search는 동적 도구 로딩으로 토큰 85% 절약
  • auto:N 문법으로 임계값 세밀 조정 가능
  • Claude Code 2.1.7부터 기본 활성화
  • Sonnet 4, Opus 4 이상에서만 지원 (Haiku 미지원)

이 기능은 단순한 토큰 절약을 넘어서, **”컨텍스트 경제”의 패러다임을 바꿉니다**.

기존에는 “MCP 서버 3개만 연결할까, 아니면 컨텍스트 절반을 포기할까”라는 트레이드오프가 있었습니다. 이제는 수십 개의 MCP 서버를 연결해도 실제로 필요한 도구만 로드되니까, **희소성 모델에서 접근성 모델**로 전환된 셈이죠.

Claude Code로 개발하고 계시다면, MCP Tool Search는 이미 켜져 있을 겁니다. /context 명령으로 토큰 사용량을 확인해보세요.

jodnrfo2

Share
Published by
jodnrfo2

Recent Posts

Kimi K2.5 완벽 가이드: Agent Swarm부터 Kimi Code vs Claude Code 비교까지 (2026)

Moonshot AI의 Kimi K2.5가 2026년 1월 27일 출시됐습니다. 1조 파라미터 MoE 모델, 100개 서브에이전트 Agent…

4시간 ago

트럼프 ‘약달러 OK’ 발언에 환율 폭락… 1,400원대 진입 임박?

2026년 1월 28일 원달러 환율이 23.7원 급락한 배경을 분석합니다. 트럼프의 약달러 정책, 마러라고 합의 가능성,…

2일 ago

Moltbot: 3일 만에 GitHub 스타 8만 개 찍은 AI 에이전트, 대체 뭐길래?

3일 만에 GitHub 스타 9천에서 8만으로 폭발한 Moltbot. Anthropic 상표권 문제로 Clawdbot에서 이름을 바꾼 이…

2일 ago

2026년 1월, 개발자들이 미쳐가는 Vibe 코딩 도구 TOP 10

Claude Code가 개발자 세상을 뒤집었습니다. Google 엔지니어의 '1년 작업 1시간' 고백부터 무료 Antigravity의 등장까지, 2026년…

5일 ago

AI가 공장 접수한다, 월가 주목 스마트팩토리 관련주 5선

NVIDIA와 협력하는 로크웰, 250% 급등한 테라다인까지. AI가 공장을 접수하는 시대, 월가가 주목하는 스마트팩토리 관련주 5종목을…

1주 ago

CXL이란? AI 메모리 병목을 해결할 차세대 기술 (2026 전망)

CXL(Compute Express Link)이란 무엇인지, AI 시대에 왜 주목받는지 쉽게 설명합니다. DRAM 부족 문제 해결의 핵심…

1주 ago