์˜คํ”ˆํด๋กœ ์˜คํ”ˆ์ฑ„ํŒ…๋ฐฉ ์˜คํ”ˆํด๋กœ ์˜คํ”ˆ์ฑ„ํŒ…๋ฐฉ
ํŒ

๐Ÿ–ฅ๏ธ Mac Studio 512GB RAM โ€” ๋กœ์ปฌ LLM ์ข…ํ•ฉ ๋น„๊ตํ‘œ

๊ด€๋ฆฌ์ž 2026-02-09 08:53 ์กฐํšŒ 46

M3 Ultra (80์ฝ”์–ด GPU, 819GB/s) ๊ธฐ์ค€ ยท GLM / Kimi ์‹œ๋ฆฌ์ฆˆ ํฌํ•จ ยท ๋น„๊ต ๊ธฐ์ค€: Gemini 2.5 Pro (~156 tok/s API)

โš ๏ธ ๊ธฐ์ค€ ์•ˆ๋‚ด
โ€ข ์„ฑ๋Šฅ %: ์ข…ํ•ฉ ๋ฒค์น˜๋งˆํฌ(MMLU, SWE-bench, AIME, GPQA ๋“ฑ) ํ‰๊ท  ๊ธฐ์ค€ ์ถ”์ •์น˜
โ€ข ํ† ํฐ ์†๋„: Q4_K_M ์–‘์žํ™”, ์งง์€ ์ปจํ…์ŠคํŠธ(~4K) ๊ธฐ์ค€. MLX ๋˜๋Š” llama.cpp ์‚ฌ์šฉ
โ€ข ๋ฐ˜์‘์†๋„ %: Gemini 2.5 Pro API(~156 tok/s, TTFT ~1.3s) ๋Œ€๋น„ ์ฒด๊ฐ ๋น„์œจ
โ€ข โ˜… = MoE(ํ˜ผํ•ฉ์ „๋ฌธ๊ฐ€) ๋ชจ๋ธ โ€” ํ™œ์„ฑ ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ์—ฐ์‚ฐํ•˜๋ฏ€๋กœ ํฌ๊ธฐ ๋Œ€๋น„ ๋น ๋ฆ„
โ€ข GLM = Z.AI(Zhipu AI) ์‹œ๋ฆฌ์ฆˆ ยท Kimi = Moonshot AI ์‹œ๋ฆฌ์ฆˆ

์„ฑ๋Šฅ์ˆœ ๋กœ์ปฌ LLM ๋น„๊ต (512GB์— ์˜ฌ๋ฆด ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ)

๋ชจ๋ธ๋ช… ๋ถ„๋ฅ˜ ์„ฑ๋Šฅ
(vs Gemini 2.5 Pro)
ํ•„์š” RAM
(Q4)
์ถœ๋ ฅ์†๋„
(tok/s)
๋ฐ˜์‘์†๋„
(vs Gemini)
512GB
ํƒ‘์žฌ
ํ‰๊ฐ€
๐Ÿ”ด ์ดˆ๋Œ€ํ˜• (600B+ ํŒŒ๋ผ๋ฏธํ„ฐ) โ€” ๋А๋ฆฌ์ง€๋งŒ ์ตœ๊ณ  ์„ฑ๋Šฅ
Kimi K2.5 โ˜…1T ํŒŒ๋ผ๋ฏธํ„ฐ (32B ํ™œ์„ฑ) ยท MoEKIMI ๋ฒ”์šฉ/์—์ด์ „ํŠธ ~93% ~380 GB 8โ€“14 ~7% โœ… ๐Ÿ† ์ตœ๊ฐ• ์˜คํ”ˆ์†Œ์Šค
Kimi K2 Thinking โ˜…1T ํŒŒ๋ผ๋ฏธํ„ฐ (32B ํ™œ์„ฑ) ยท MoEKIMI ์ถ”๋ก ํŠนํ™” ~90% ~380 GB 8โ€“14 ~7% โœ… ๊ฐ•๋ ฅ ์ถ”๋ก 
DeepSeek R1 671B โ˜…671B (37B ํ™œ์„ฑ) ยท MoEMOE ์ถ”๋ก ํŠนํ™” ~88% ~405 GB 17โ€“20 ~12% โœ… ๊ฒ€์ฆ๋œ ์ถ”๋ก 
DeepSeek V3.1 671B โ˜…671B (37B ํ™œ์„ฑ) ยท MoEMOE ๋ฒ”์šฉ ~85% ~405 GB 18โ€“22 ~13% โœ… ๊ณ ํ’ˆ์งˆ ๋ฒ”์šฉ
๐ŸŸ  ๋Œ€ํ˜• (200~400B) โ€” ์„ฑ๋Šฅ๊ณผ ์†๋„์˜ ๊ท ํ˜•
GLM-4.7 358B โ˜…358B ํŒŒ๋ผ๋ฏธํ„ฐ ยท MoE ยท ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌGLM ๋ฒ”์šฉ/์ฝ”๋”ฉ ~84% ~140 GB 15โ€“22 ~12% โœ… GLM ํ”Œ๋ž˜๊ทธ์‹ญ
Qwen3-235B-A22B โ˜…235B (22B ํ™œ์„ฑ) ยท MoEMOE ๋ฒ”์šฉ/์ฝ”๋”ฉ ~80% ~88 GB 25โ€“35 ~20% โœ… โญ ๊ฐ€์„ฑ๋น„ ์ตœ๊ณ 
Llama 4 Maverick 400B โ˜…400B (~17B ํ™œ์„ฑ) ยท MoEMOE ๋ฒ”์šฉ ~77% ~220 GB 20โ€“30 ~17% โœ… Meta ์ตœ์‹ 
๐ŸŸก ์ค‘ํ˜• (60~150B) โ€” ์‹ค์šฉ์  ์„ ํƒ์ง€
Mistral Large 3 123B123B ยท DenseDENSE ๋ฒ”์šฉ ~68% ~72 GB 12โ€“16 ~9% โœ… ์œ ๋Ÿฝ ๋Œ€ํ‘œ
GPT-OSS 120B โ˜…120B (~6B ํ™œ์„ฑ) ยท MoEMOE ๋ฒ”์šฉ ~75% ~65 GB 40โ€“55 ~30% โœ… โญ ๋น ๋ฅด๊ณ  ์šฐ์ˆ˜
Llama 3.3 70B70B ยท DenseDENSE ๋ฒ”์šฉ ~72% ~42 GB 15โ€“22 ~12% โœ… ๊ฒ€์ฆ๋œ ์›Œํฌํ˜ธ์Šค
๐ŸŸข ์ค‘์†Œํ˜• (25~40B) โ€” ๋น ๋ฅธ ์ผ์ƒ ์‚ฌ์šฉ
Qwen3-32B32B ยท DenseDENSE ๋ฒ”์šฉ/์ฝ”๋”ฉ ~70% ~20 GB 30โ€“42 ~25% โœ… โญ ์ผ์ƒ ์ถ”์ฒœ
GLM-4.7 Flash 30B โ˜…30B (3B ํ™œ์„ฑ) ยท MoEGLM ์ฝ”๋”ฉ/์—์ด์ „ํŠธ ~66% ~18 GB 60โ€“90 ~45% โœ… โญโญ OpenClaw ์ตœ์ 
Qwen3-30B-A3B โ˜…30B (3B ํ™œ์„ฑ) ยท MoEMOE ๊ฒฝ๋Ÿ‰ ๋ฒ”์šฉ ~62% ~20 GB 80โ€“110 ~60% โœ… โญโญ ๊ฐ€์žฅ ๋น ๋ฆ„
Gemma 3 27B27B ยท DenseDENSE ๋ฒ”์šฉ/๋น„์ „ ~58% ~17 GB 33โ€“41 ~25% โœ… ๋น„์ „ ๊ฐ•์ 
๐Ÿ“Š ๋น„๊ต ๊ธฐ์ค€ (ํด๋ผ์šฐ๋“œ API)
**Gemini 2.5 Pro (API)**๋น„๊ณต๊ฐœ ยท Google ์„œ๋ฒ„ ์ธํ”„๋ผ ๊ธฐ์ค€ 100% - ~156 100% - ํด๋ผ์šฐ๋“œ ๊ธฐ์ค€

80%+ (S๊ธ‰)

70~79% (A๊ธ‰)

60~69% (B๊ธ‰)

60%โ†“ (C๊ธ‰)

GLMZ.AI

KIMIMoonshot

MOEํ˜ผํ•ฉ์ „๋ฌธ๊ฐ€

OpenClaw ์—ฐ๋™ ์‹œ ์ฒด๊ฐ ๋ฐ˜์‘์†๋„ ์ƒ์„ธ

OpenClaw = ์˜คํ”ˆ์†Œ์Šค AI ์—์ด์ „ํŠธ (Ollama/LM Studio ๊ฒฝ์œ ). ์—์ด์ „ํŠธ ์˜ค๋ฒ„ํ—ค๋“œ(๋„๊ตฌ ํ˜ธ์ถœ, ๋ฉ”๋ชจ๋ฆฌ ๊ฒ€์ƒ‰ ๋“ฑ)๋กœ ์ˆœ์ˆ˜ ์ถ”๋ก  ๋Œ€๋น„ ~30~50% ์ถ”๊ฐ€ ์ง€์—ฐ ๋ฐœ์ƒ.

๋ชจ๋ธ ์ˆœ์ˆ˜ ์†๋„ OpenClaw
์ฒด๊ฐ์†๋„
vs Gemini
(๋ฐ˜์‘ %)
TTFT ํ‰๊ฐ€
Kimi K2.5 โ˜… KIMI ~11 tok/s ~7 tok/s ~5% 8~20์ดˆ ์ตœ๊ณ  ์„ฑ๋Šฅ, ๋งค์šฐ ๋А๋ฆผ
Kimi K2 Thinking โ˜… KIMI ~11 tok/s ~7 tok/s ~5% 8~20์ดˆ ์ถ”๋ก  ์ตœ๊ฐ•, ๋А๋ฆผ
DeepSeek R1 671B โ˜… ~18 tok/s ~12 tok/s ~8% 5~15์ดˆ ๋А๋ฆผ, ๋ณต์žก์ถ”๋ก ๋งŒ
DeepSeek V3.1 671B โ˜… ~20 tok/s ~14 tok/s ~9% 4~12์ดˆ ๊ณ ํ’ˆ์งˆ, ๋А๋ฆผ
GLM-4.7 358B โ˜… GLM ~18 tok/s ~12 tok/s ~8% 4~10์ดˆ ์ฝ”๋”ฉ ๊ฐ•์ , ๋А๋ฆผ
Qwen3-235B โ˜… ~30 tok/s ~20 tok/s ~13% 2~5์ดˆ โญ ๊ฐ€์„ฑ๋น„ ์ตœ๊ณ 
Llama 4 Maverick โ˜… ~25 tok/s ~17 tok/s ~11% 3~8์ดˆ ์–‘ํ˜ธ
GPT-OSS 120B โ˜… ~48 tok/s ~33 tok/s ~22% 1~3์ดˆ โญ ๋น ๋ฅด๊ณ  ์šฐ์ˆ˜
Llama 3.3 70B ~18 tok/s ~12 tok/s ~8% 2~4์ดˆ ๋А๋ฆฌ์ง€๋งŒ ์•ˆ์ •์ 
Qwen3-32B ~36 tok/s ~25 tok/s ~16% 1~2์ดˆ โญ ์ผ์ƒ ์ถ”์ฒœ
GLM-4.7 Flash 30B โ˜… GLM ~75 tok/s ~50 tok/s ~33% <1์ดˆ โญโญ OpenClaw ์ตœ์ 
Qwen3-30B-A3B โ˜… ~100 tok/s ~65 tok/s ~43% <1์ดˆ โญโญ ๊ฐ€์žฅ ๋น ๋ฆ„
Gemma 3 27B ~37 tok/s ~25 tok/s ~16% 1~2์ดˆ ๋น„์ „ ์ž‘์—…์šฉ
Gemini 2.5 Pro (API) ~156 tok/s ~150 tok/s 100% ~1.3์ดˆ ๊ธฐ์ค€ (ํด๋ผ์šฐ๋“œ)

GLM ยท Kimi ์‹œ๋ฆฌ์ฆˆ ์ƒ์„ธ ์ •๋ณด

๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ ํ™œ์„ฑ ํŒŒ๋ผ๋ฏธํ„ฐ ์•„ํ‚คํ…์ฒ˜ ์ปจํ…์ŠคํŠธ Q4 ํฌ๊ธฐ ๋ผ์ด์„ ์Šค ํŠน๊ธฐ
GLM-4.7 358B MoE (๋น„๊ณต๊ฐœ) MoE + ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ 200K ~140 GB MIT ์ฝ”๋”ฉ, "Vibe Coding", ๋น„์ „
GLM-4.7 Flash 30B ~3B MoE (MLA) 128K ~18 GB MIT SWE-bench 59.2%, ์—์ด์ „ํŠธ ํŠนํ™”
Kimi K2.5 1.04T ~32B MoE + ๋น„์ „ 128K+ ~380 GB MIT (์ˆ˜์ •) Agent Swarm, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ, HLE 1์œ„
Kimi K2 (Thinking) 1.04T ~32B MoE 128K ~380 GB MIT (์ˆ˜์ •) ์ถ”๋ก  ํŠนํ™”, GPT-5๊ธ‰ ๋ฒค์น˜๋งˆํฌ
Kimi K2 (Instant) 1.04T ~32B MoE 128K ~380 GB MIT (์ˆ˜์ •) ๋น ๋ฅธ ์‘๋‹ต ๋ชจ๋“œ

๐Ÿ’ก ์ถ”์ฒœ ์กฐํ•ฉ (์—…๋ฐ์ดํŠธ)

๐Ÿ† ์ตœ๊ณ  ์„ฑ๋Šฅ (์†๋„ ํฌ์ƒ) โ†’ Kimi K2.5 (Q4, ~380GB) โ€” ์˜คํ”ˆ์†Œ์Šค ์ตœ๊ฐ•, GPT-5๊ธ‰ ยท ๋А๋ฆฌ์ง€๋งŒ ์••๋„์ 
๐Ÿง  ์ตœ๊ณ  ์ถ”๋ก  โ†’ DeepSeek R1 671B (Q4, ~405GB) โ€” ์ˆ˜ํ•™ยท๋…ผ๋ฆฌ ์ตœ๊ฐ•, ๊ฒ€์ฆ๋œ ๋ชจ๋ธ
โšก ๊ฐ€์„ฑ๋น„ ์ตœ๊ณ  โ†’ Qwen3-235B (Q4, ~88GB) โ€” ์„ฑ๋Šฅ 80%์— 30 tok/s, RAM ์—ฌ์œ 
๐Ÿ’ป ์ฝ”๋”ฉ ์—์ด์ „ํŠธ โ†’ GLM-4.7 Flash (Q8, ~18GB) โ€” SWE-bench 59.2%, ์ดˆ๊ณ ์† 60~90 tok/s, OpenClaw ์ตœ์ 
๐Ÿš€ ์ผ์ƒ ๋งŒ๋Šฅ โ†’ Qwen3-32B (Q8, ~36GB) โ€” ๊ท ํ˜•์žกํžŒ ์„ฑ๋Šฅ, 30+ tok/s
โšก ์ตœ๊ณ ์† โ†’ Qwen3-30B-A3B (Q8, ~20GB) โ€” 100+ tok/s, ์‹ค์‹œ๊ฐ„ ๋Œ€ํ™”๊ฐ
๐Ÿ”€ ๋ฉ€ํ‹ฐ ๋ชจ๋ธ โ†’ GLM-4.7 Flash(18GB) + Qwen3-235B(88GB) + Qwen3-32B(36GB) = ~142GB โ†’ ๋‚˜๋จธ์ง€๋กœ OSยท์•ฑ ์—ฌ์œ 

  • Kimi K2.5/K2๋Š” 1T ํŒŒ๋ผ๋ฏธํ„ฐ(32B ํ™œ์„ฑ) MoE๋กœ Mac Studio 512GB์— Q4๋กœ ๊ฐ„์‹ ํžˆ ํƒ‘์žฌ ๊ฐ€๋Šฅ(~380GB). ์ปจํ…์ŠคํŠธ๋Š” ์ œํ•œ์ .
  • GLM-4.7 Flash๋Š” SWE-bench์—์„œ 30B๊ธ‰ ์ตœ๊ณ  ์„ฑ๋Šฅ(59.2%)์ด๋‚˜, ์ˆœ์ˆ˜ ์ถ”๋ก /์ผ๋ฐ˜ ์ง€์‹์€ Qwen3-32B๋ณด๋‹ค ์•ฝํ•  ์ˆ˜ ์žˆ์Œ.
  • GLM-4.7 Flash๋Š” OpenClaw์—์„œ ํŠนํžˆ ์ข‹์€ ํ‰๊ฐ€ โ€” ์—์ด์ „ํŠธ ๋„๊ตฌ ํ˜ธ์ถœ, ํ•จ์ˆ˜ ์ฝœ๋ง ์„ฑ๋Šฅ์ด ์šฐ์ˆ˜.
  • Kimi K2.5์˜ "Agent Swarm"์€ API ํ™˜๊ฒฝ์—์„œ ์ตœ์ ํ™”๋œ ๊ธฐ๋Šฅ์œผ๋กœ, ๋กœ์ปฌ ๋‹จ๋… ์ถ”๋ก  ์‹œ์—๋Š” ํšจ๊ณผ ์ œํ•œ์ .
  • ๋ชจ๋“  ์ˆ˜์น˜๋Š” ์ปค๋ฎค๋‹ˆํ‹ฐ ๋ฒค์น˜๋งˆํฌยท์‹ค์ธก ๊ธฐ๋ฐ˜ ์ถ”์ •์น˜์ด๋ฉฐ ์–‘์žํ™”ยท์ปจํ…์ŠคํŠธยทํ”„๋ ˆ์ž„์›Œํฌ์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.

๋Œ“๊ธ€ 0

๋“ฑ๋ก๋œ ๋Œ“๊ธ€์ด ์—†์Šต๋‹ˆ๋‹ค.