auto:N 문법으로 임계값 조정 가능합니다“MCP 서버 4개 연결했더니 토큰이 67,000개나 사라졌어요.”
Reddit의 한 개발자가 올린 글입니다. Claude Code를 쓰는 개발자라면 한 번쯤 겪어봤을 상황이죠.
MCP(Model Context Protocol)는 Claude Code의 핵심 기능입니다. GitHub, Docker, 데이터베이스 등 외부 도구를 연결해서 AI의 능력을 확장할 수 있거든요. 문제는 이 도구들이 **컨텍스트 윈도우를 잡아먹는다**는 겁니다.
오늘은 이 문제를 해결하는 **MCP Tool Search** 기능을 파헤쳐보겠습니다.
Claude Code에 MCP 서버를 연결하면 어떤 일이 벌어질까요?
| MCP 서버 | 도구 수 | 소비 토큰 |
|---|---|---|
| Docker MCP | 135개 | 125,964 토큰 |
| GitHub MCP | 93개 | ~55,000 토큰 |
| Omnisearch (기존) | 20개 | ~14,100 토큰 |
Docker MCP 서버 **하나**만 연결해도 125,000 토큰이 사라집니다. Claude Code의 컨텍스트 윈도우가 200K 토큰이라고 치면, 서버 하나에 **62.5%**가 날아가는 거예요.
개발자 Scott Spence는 MCP 도구를 모두 활성화했을 때 143K/200K 토큰(72%)을 사용하고 있었습니다. MCP 도구만 82K 토큰(41%)을 차지했고, 실제로 작업에 쓸 수 있는 공간은 12K 토큰(5.8%)밖에 남지 않았습니다.
기존 방식에서는 MCP 서버를 연결하면 **모든 도구 정의**가 컨텍스트에 사전 로드됩니다:
50개, 100개, 135개 도구에 이걸 곱하면? 토큰이 순식간에 증발합니다.
더 큰 문제는 **성능 저하**입니다. 도구가 너무 많으면:
2026년 1월 14일, Anthropic의 Thariq Shihipar가 트위터에서 발표했습니다:
“MCP 서버는 50개 이상의 도구를 가질 수 있고, 이는 많은 컨텍스트를 차지합니다. Tool Search는 Claude Code가 도구를 동적으로 컨텍스트에 로드할 수 있게 해줍니다.”
MCP Tool Search는 **지연 로딩(Lazy Loading)** 패턴을 도구에 적용한 것입니다.
| 단계 | 동작 | 설명 |
|---|---|---|
| 1 | 감지 | 도구 정의가 컨텍스트의 10% 초과하는지 확인 |
| 2 | 지연 | 임계값 초과 시 도구를 defer_loading: true로 표시 |
| 3 | 검색 도구 주입 | 모든 정의 대신 MCPSearch 도구 제공 |
| 4 | 온디맨드 발견 | Claude가 필요할 때 키워드로 도구 검색 |
| 5 | 선택적 로딩 | 쿼리당 3-5개 관련 도구만 로드 |
핵심은 **”필요할 때만 로드”**입니다. 모든 도구 정의를 미리 올리는 대신, Claude가 실제로 필요한 도구만 그때그때 검색해서 가져옵니다.
| 지표 | 기존 | Tool Search 적용 | 개선율 |
|---|---|---|---|
| 토큰 사용량 (50+ 도구) | ~77K | ~8.7K | -85% |
| 가용 컨텍스트 | 122,800 토큰 | 191,300 토큰 | +56% |
| Opus 4 정확도 | 49% | 74% | +25%p |
| Opus 4.5 정확도 | 79.5% | 88.1% | +8.6%p |
Anthopic 엔지니어링 팀의 내부 테스트 결과, 대규모 도구 라이브러리에서 정확도가 크게 향상되었습니다.
Claude Code **2.1.7 버전부터 기본 활성화**되어 있습니다. 별도 설정 없이도 작동합니다.
MCP 도구 정의가 컨텍스트 윈도우의 10%를 초과하면 자동으로 Tool Search가 활성화됩니다. 도구가 적으면 기존 방식대로 작동합니다.
# 기본값: 컨텍스트 10% 초과 시 활성화
ENABLE_TOOL_SEARCH=auto claude
# 커스텀 임계값: 5% 초과 시 활성화 (더 적극적)
ENABLE_TOOL_SEARCH=auto:5 claude
# 항상 활성화 (도구 수 상관없이)
ENABLE_TOOL_SEARCH=true claude
# 비활성화 (기존 방식으로 전체 로드)
ENABLE_TOOL_SEARCH=false claude 영구적으로 설정하려면:
{
"env": {
"ENABLE_TOOL_SEARCH": "auto:5"
}
} | 값 | 동작 | 권장 상황 |
|---|---|---|
auto | 10% 초과 시 활성화 (기본값) | 대부분의 경우 |
auto:N | N% 초과 시 활성화 | 세밀한 제어 필요 시 |
true | 항상 활성화 | 많은 MCP 서버 사용 시 |
false | 비활성화 | 도구 수가 적거나 자주 사용되는 경우 |
MCP Tool Search는 **`tool_reference` 블록을 지원하는 모델**에서만 작동합니다.
| 모델 | 지원 여부 |
|---|---|
| Sonnet 4 이상 | ✅ 지원 |
| Opus 4 이상 | ✅ 지원 |
| Haiku 모델 | ❌ 미지원 |
Haiku를 사용 중이라면 Tool Search가 작동하지 않으니 주의하세요.
Tool Search가 활성화되면 **서버 명령어(server instructions)** 필드의 중요성이 커집니다. Claude가 도구를 검색할 때 이 설명을 참고하거든요.
GitHub 관련 모든 작업 처리: PR 리뷰, 이슈 생성, 코드 변경 사항 조회. 코드 리뷰나 GitHub 인터랙션이 필요할 때 이 서버의 도구를 검색하세요.
핵심은:
| 버전 | 변경사항 |
|---|---|
| 2.0.70 | 와일드카드 퍼미션 추가 (mcp__server__*) |
| 2.0.74 | list_changed 알림 지원 – 서버 재연결 없이 도구 동적 업데이트 |
| 2.1.7 | Auto mode 기본 활성화 – 10% 초과 시 자동 전환 |
| 2.1.9 | auto:N 문법 추가 – 임계값 커스터마이징 가능 |
claude --version으로 2.1.7 이상인지 확인disallowedTools에 MCPSearch가 있는지 확인MCP 서버의 server instructions를 개선해보세요. Claude는 이 설명을 참고해서 도구를 검색합니다. 서버가 처리하는 작업 카테고리를 명확히 적어주면 검색 정확도가 올라갑니다.
아니요, 반대입니다. MCP 도구가 많을수록 Tool Search를 켜두는 게 유리합니다. 끄면 모든 도구가 사전 로드되어 토큰을 많이 소비하고, 오히려 도구 선택 정확도가 떨어집니다.
대부분의 경우 기본값(auto, 10%)이 적절합니다. MCP 서버를 많이 사용한다면 auto:5로 더 적극적으로 활성화할 수 있고, 도구가 적다면 auto:15로 느슨하게 설정할 수 있습니다.
사용자 입장에서는 거의 차이를 못 느낍니다. MCP 도구가 평소처럼 작동하고, Claude가 내부적으로 필요한 도구만 검색해서 로드합니다. 토큰 절약은 자동으로 이루어집니다.
현재는 전체 활성화/비활성화만 가능합니다. 특정 서버만 제외하려면 해당 서버의 도구를 줄이거나, ENABLE_TOOL_SEARCH=false로 전체를 끄고 수동 관리해야 합니다.
auto:N 문법으로 임계값 세밀 조정 가능이 기능은 단순한 토큰 절약을 넘어서, **”컨텍스트 경제”의 패러다임을 바꿉니다**.
기존에는 “MCP 서버 3개만 연결할까, 아니면 컨텍스트 절반을 포기할까”라는 트레이드오프가 있었습니다. 이제는 수십 개의 MCP 서버를 연결해도 실제로 필요한 도구만 로드되니까, **희소성 모델에서 접근성 모델**로 전환된 셈이죠.
Claude Code로 개발하고 계시다면, MCP Tool Search는 이미 켜져 있을 겁니다. /context 명령으로 토큰 사용량을 확인해보세요.
Moonshot AI의 Kimi K2.5가 2026년 1월 27일 출시됐습니다. 1조 파라미터 MoE 모델, 100개 서브에이전트 Agent…
2026년 1월 28일 원달러 환율이 23.7원 급락한 배경을 분석합니다. 트럼프의 약달러 정책, 마러라고 합의 가능성,…
3일 만에 GitHub 스타 9천에서 8만으로 폭발한 Moltbot. Anthropic 상표권 문제로 Clawdbot에서 이름을 바꾼 이…
Claude Code가 개발자 세상을 뒤집었습니다. Google 엔지니어의 '1년 작업 1시간' 고백부터 무료 Antigravity의 등장까지, 2026년…
NVIDIA와 협력하는 로크웰, 250% 급등한 테라다인까지. AI가 공장을 접수하는 시대, 월가가 주목하는 스마트팩토리 관련주 5종목을…
CXL(Compute Express Link)이란 무엇인지, AI 시대에 왜 주목받는지 쉽게 설명합니다. DRAM 부족 문제 해결의 핵심…