LLM 가격·성능 비교 — Groq gpt-oss-120b vs Claude Opus 4.7 / Sonnet 4.6

작성 2026-05-24 대상 어디살지 프로젝트 기준 공식 가격 + Artificial Analysis 벤치마크

1. 모델 카드

Groq gpt-oss-120b

$0.15 in · $0.60 out · /1M tokens
~540 tok/s
  • OpenAI open-weights · Apache 2.0
  • 128K context · LPU 가속
  • Prompt cache 시 input 50% 할인 ($0.075)

Claude Sonnet 4.6

$3.00 in · $15.00 out · /1M tokens
40 – 60 tok/s
  • 2026-02 release · coding SOTA 가성비
  • 200K context
  • SWE-Bench Verified 79.6%

Claude Opus 4.7

$5.00 in · $25.00 out · /1M tokens
~46 tok/s
  • 2026-04 release · 추론·coding 최상위
  • 1M context · 고해상도 vision
  • 새 tokenizer — 같은 텍스트가 +35% tokens 가능

2. 가격 / 속도 통합

모델 Input $/1M Output $/1M 속도 tok/s Context 라이선스
Groq gpt-oss-120b $0.15 $0.60 ~540 128K Apache 2.0
Claude Sonnet 4.6 $3.00 $15.00 40–60 200K Proprietary
Claude Opus 4.7 $5.00 $25.00 ~46 1M Proprietary

3. Output 속도 (tok/s)

Groq gpt-oss-120b
540
Claude Sonnet 4.6
50
Claude Opus 4.7
46

4. Output 비용 — gpt-oss-120b 대비 배수

Groq gpt-oss-120b
1x
Claude Sonnet 4.6
25x
Claude Opus 4.7
42x

주의 · Opus 4.7 은 신규 tokenizer 로 같은 입력이 최대 +35% tokens 으로 카운트됨 — 실효 비용은 표시가의 1.0–1.35배. 실 비교 시 ~50x 까지 벌어질 수 있음.

5. SWE-Bench Verified

Claude Opus 4.7
87.6%
Claude Sonnet 4.6
79.6%
Groq gpt-oss-120b
~62%

6. 라우팅 추천 — 어디살지 프로젝트

사용처 추천 모델 근거
채팅 streaming UX · 매물 요약 · 단순 분류 Groq gpt-oss-120b 540 tok/s 즉각 체감, 비용 1/25 ~ 1/42
매물 매칭 · function calling · 한국어 톤 안정 Claude Sonnet 4.6 tool-use 안정성·한국어 품질·SWE 79% 균형
계약서 분석 · 복잡 reasoning · 1M context 필요 Claude Opus 4.7 1M context · SWE 87% · 깊은 추론 한정 사용

결론 · 현재 default gemini-2.5-flash 자리의 실질 경쟁자는 Groq gpt-oss-120b (1/2 가격, 5–10배 속도). 고난도 폴백은 Sonnet 4.6 이 ROI 합리적. Opus 4.7 은 tokenizer 인플레로 표시가 1.3x 실비 — 1M context·최상위 추론 한정으로만 의미.