LLM 가격·성능 비교 — Groq gpt-oss-120b vs Claude Opus 4.7 / Sonnet 4.6

작성 2026-05-24 대상 어디살지 프로젝트 기준 공식 가격 + Artificial Analysis 벤치마크

1. 모델 카드

Groq `gpt-oss-120b`

$0.15 in · $0.60 out · /1M tokens

~540 tok/s

OpenAI open-weights · Apache 2.0
128K context · LPU 가속
Prompt cache 시 input 50% 할인 ($0.075)

Claude Sonnet 4.6

$3.00 in · $15.00 out · /1M tokens

40 – 60 tok/s

2026-02 release · coding SOTA 가성비
200K context
SWE-Bench Verified 79.6%

Claude Opus 4.7

$5.00 in · $25.00 out · /1M tokens

~46 tok/s

2026-04 release · 추론·coding 최상위
1M context · 고해상도 vision
새 tokenizer — 같은 텍스트가 +35% tokens 가능

2. 가격 / 속도 통합

모델	Input $/1M	Output $/1M	속도 tok/s	Context	라이선스
Groq gpt-oss-120b	$0.15	$0.60	~540	128K	Apache 2.0
Claude Sonnet 4.6	$3.00	$15.00	40–60	200K	Proprietary
Claude Opus 4.7	$5.00	$25.00	~46	1M	Proprietary

3. Output 속도 (tok/s)

Groq gpt-oss-120b

540

Claude Sonnet 4.6

Claude Opus 4.7

4. Output 비용 — gpt-oss-120b 대비 배수

Groq gpt-oss-120b

Claude Sonnet 4.6

25x

Claude Opus 4.7

42x

주의 · Opus 4.7 은 신규 tokenizer 로 같은 입력이 최대 +35% tokens 으로 카운트됨 — 실효 비용은 표시가의 1.0–1.35배. 실 비교 시 ~50x 까지 벌어질 수 있음.

5. SWE-Bench Verified

Claude Opus 4.7

87.6%

Claude Sonnet 4.6

79.6%

Groq gpt-oss-120b

~62%

6. 라우팅 추천 — 어디살지 프로젝트

사용처	추천 모델	근거
채팅 streaming UX · 매물 요약 · 단순 분류	Groq gpt-oss-120b	540 tok/s 즉각 체감, 비용 1/25 ~ 1/42
매물 매칭 · function calling · 한국어 톤 안정	Claude Sonnet 4.6	tool-use 안정성·한국어 품질·SWE 79% 균형
계약서 분석 · 복잡 reasoning · 1M context 필요	Claude Opus 4.7	1M context · SWE 87% · 깊은 추론 한정 사용

결론 · 현재 default gemini-2.5-flash 자리의 실질 경쟁자는 Groq gpt-oss-120b (1/2 가격, 5–10배 속도). 고난도 폴백은 Sonnet 4.6 이 ROI 합리적. Opus 4.7 은 tokenizer 인플레로 표시가 1.3x 실비 — 1M context·최상위 추론 한정으로만 의미.