LLM 가격·성능 비교 — Groq gpt-oss-120b vs Claude Opus 4.7 / Sonnet 4.6
1. 모델 카드
Groq gpt-oss-120b
$0.15 in · $0.60 out · /1M tokens
~540 tok/s
- OpenAI open-weights · Apache 2.0
- 128K context · LPU 가속
- Prompt cache 시 input 50% 할인 ($0.075)
Claude Sonnet 4.6
$3.00 in · $15.00 out · /1M tokens
40 – 60 tok/s
- 2026-02 release · coding SOTA 가성비
- 200K context
- SWE-Bench Verified 79.6%
Claude Opus 4.7
$5.00 in · $25.00 out · /1M tokens
~46 tok/s
- 2026-04 release · 추론·coding 최상위
- 1M context · 고해상도 vision
- 새 tokenizer — 같은 텍스트가 +35% tokens 가능
2. 가격 / 속도 통합
| 모델 | Input $/1M | Output $/1M | 속도 tok/s | Context | 라이선스 |
|---|---|---|---|---|---|
| Groq gpt-oss-120b | $0.15 | $0.60 | ~540 | 128K | Apache 2.0 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 40–60 | 200K | Proprietary |
| Claude Opus 4.7 | $5.00 | $25.00 | ~46 | 1M | Proprietary |
3. Output 속도 (tok/s)
4. Output 비용 — gpt-oss-120b 대비 배수
주의 · Opus 4.7 은 신규 tokenizer 로 같은 입력이 최대 +35% tokens 으로 카운트됨 — 실효 비용은 표시가의 1.0–1.35배. 실 비교 시 ~50x 까지 벌어질 수 있음.
5. SWE-Bench Verified
6. 라우팅 추천 — 어디살지 프로젝트
| 사용처 | 추천 모델 | 근거 |
|---|---|---|
| 채팅 streaming UX · 매물 요약 · 단순 분류 | Groq gpt-oss-120b | 540 tok/s 즉각 체감, 비용 1/25 ~ 1/42 |
| 매물 매칭 · function calling · 한국어 톤 안정 | Claude Sonnet 4.6 | tool-use 안정성·한국어 품질·SWE 79% 균형 |
| 계약서 분석 · 복잡 reasoning · 1M context 필요 | Claude Opus 4.7 | 1M context · SWE 87% · 깊은 추론 한정 사용 |
결론 · 현재 default gemini-2.5-flash 자리의 실질 경쟁자는 Groq gpt-oss-120b (1/2 가격, 5–10배 속도). 고난도 폴백은 Sonnet 4.6 이 ROI 합리적. Opus 4.7 은 tokenizer 인플레로 표시가 1.3x 실비 — 1M context·최상위 추론 한정으로만 의미.