Switch Section

Core Path

01 1. 思想先行：Linux 哲学与思维转变 02 2. 理论基础：硬件与引导 03 3. 安装实战准备 (Preparation) 04 4. 踏上旅途：发行版与安装 05 5. 软件仓库与包管理 (Ecosystem) 06 6. 桌面配置与交互美化 (Desktop Experience) 07 7. 命令行秘籍 (Terminal Mastery) 08 8. 系统运维与安全 09 9. 故障恢复与应急手册 10 10. 项目化实战与结业路径 11 11. 极客探索与杂项

New Voyage

12 12. 容器化技术与现代工作流 13 13. 网络与远程协作 14 14. 智能时代：AI 与本地模型部署

Roadmap Panorama

模型量化与管理指南

量化（Quantization）是本地运行 AI 模型的关键技术，它可以显著降低显存占用。

1. 常见量化格式对比

GGUF: llama.cpp 原生格式，兼容性最强（CPU/GPU 混合推理）。
EXL2: 专为 NVIDIA 显卡优化的极速量化格式。
AWQ / GPTQ: 工业界常用的推理加速格式。

2. 如何高速下载模型？

在 Linux 下推荐使用 huggingface-cli 配合多线程工具：

pip install -U "huggingface_hub[cli]"
export HF_ENDPOINT=https://hf-mirror.com  # 国内镜像加速
huggingface-cli download --resume-download 模型名 --local-dir ./path

3. 手动量化实战 (llama.cpp)

(这里将填入如何使用 quantize 工具进行模型压制的步骤…)

2026-02-27 文档初稿完成，系统讲解模型量化原理与 HuggingFace 高速下载方法。

AI 绘画：ComfyUI 极速安装与显存优化

Navigation