扫描二维码加入本站交流QQ群:962693412 !!!本站QQ群:962693412...
先说结论如果你要跑70B以上的大模型(比如Llama 3 70B、Qwen 72B),Mac Studio M4 Ultra是唯一选择,因为它192GB统一内存可以完整加载这些模型。Mac Mini M4 Pro最多跑到34B模型(比如Yi 34B),再大就得用量化或卸载。推理速度上,Ultra比P...