Opencode 本地模型完全指南：零成本实现 AI 编程

使用 AI 编程工具，最大的顾虑是什么？

💰 成本：API 调用费用不断累积
🔒 隐私：代码上传到云端不安全
🌐 网络：依赖网络连接，离线无法工作

如果我告诉你，有一种方式可以完全免费、完全离线、完全隐私地使用 Opencode，你会不会心动？

答案就是：本地模型。

为什么选择本地模型？

优势

✅ 完全免费：无需 API Key，无使用限制 ✅ 隐私保护：代码不离开本地，100% 安全 ✅ 离线可用：无需网络连接 ✅ 无限使用：想用多久用多久 ✅ 响应快速：无网络延迟

劣势

⚠️ 硬件要求：需要一定的 GPU/CPU 性能 ⚠️ 模型能力：相比 GPT-4/Claude 有差距（但在缩小） ⚠️ 初始设置：需要下载模型（几个 GB）

硬件要求

最低配置

CPU：8 核心以上
内存：16GB RAM
存储：20GB 可用空间
GPU：可选，但强烈推荐

不同模型的要求

模型	参数量	最小内存	推荐内存	GPU 显存
Qwen 2.5 Coder 7B	7B	8GB	16GB	6GB
DeepSeek Coder 6.7B	6.7B	8GB	16GB	6GB
Llama 3 8B	8B	10GB	16GB	8GB
DeepSeek Coder 33B	33B	24GB	32GB	20GB
Llama 3 70B	70B	48GB	64GB	40GB

方案一：使用 Ollama（推荐）

Ollama 是最简单的本地模型运行方案。

1. 安装 Ollama

macOS：

brew install ollama

Linux：

curl -fsSL https://ollama.ai/install.sh | sh

Windows：访问 ollama.ai 下载安装包

2. 下载推荐模型

DeepSeek Coder（最推荐）

专为编程优化，性能出色：

# 6.7B 版本（推荐，平衡性能和资源）
ollama pull deepseek-coder

# 33B 版本（更强，需要更多资源）
ollama pull deepseek-coder:33b

Qwen 2.5 Coder（新秀）

阿里开源，中文支持好：

# 7B 版本
ollama pull qwen2.5-coder

# 14B 版本
ollama pull qwen2.5-coder:14b

Llama 3（通用能力强）

Meta 开源，综合能力强：

# 8B 版本
ollama pull llama3

# 70B 版本（需要强大硬件）
ollama pull llama3:70b

CodeGemma（Google 出品）

ollama pull codegemma

3. 启动 Ollama 服务

ollama serve

保持这个终端窗口打开，或者设置为开机自启。

4. 测试模型

# 测试 DeepSeek Coder
ollama run deepseek-coder "写一个 Python 函数计算斐波那契数列"

如果能正常返回代码，说明模型运行正常。

5. 配置 Opencode

编辑 ~/.config/opencode/opencode.json：

{
  "provider": {
    "ollama": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Ollama (本地)",
      "options": {
        "baseURL": "http://localhost:11434/v1"
      },
      "models": {
        "deepseek-coder": {
          "name": "DeepSeek Coder 6.7B",
          "contextWindow": 16384
        },
        "deepseek-coder:33b": {
          "name": "DeepSeek Coder 33B",
          "contextWindow": 16384
        },
        "qwen2.5-coder": {
          "name": "Qwen 2.5 Coder 7B",
          "contextWindow": 32768
        },
        "llama3": {
          "name": "Llama 3 8B",
          "contextWindow": 8192
        }
      }
    }
  },
  
  // 设置为默认模型
  "model": "ollama/deepseek-coder",
  
  // 只启用 Ollama
  "enabled_providers": ["ollama"]
}

6. 重启 Opencode

重启后，运行 /models 命令，应该能看到 Ollama 的模型。

7. 开始使用

现在你可以完全离线使用 Opencode 了！

方案二：使用 LM Studio

LM Studio 提供了图形化界面，更适合新手。

1. 下载 LM Studio

访问 lmstudio.ai 下载安装。

2. 下载模型

在 LM Studio 中搜索并下载：

TheBloke/deepseek-coder-6.7B-instruct-GGUF
TheBloke/CodeLlama-13B-Instruct-GGUF

3. 启动本地服务器

在 LM Studio 中：

选择已下载的模型
点击 "Start Server"
记下服务器地址（通常是 http://localhost:1234）

4. 配置 Opencode

{
  "provider": {
    "lmstudio": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "LM Studio",
      "options": {
        "baseURL": "http://localhost:1234/v1"
      },
      "models": {
        "local-model": {
          "name": "Local Model"
        }
      }
    }
  },
  "model": "lmstudio/local-model"
}

性能对比

编程任务测试

我们用相同的任务测试了不同模型：

模型	代码质量	响应速度	资源占用	综合评分
GPT-4 (云端)	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	N/A	⭐⭐⭐⭐⭐
Claude Opus (云端)	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	N/A	⭐⭐⭐⭐⭐
DeepSeek Coder 33B	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐	⭐⭐⭐⭐
DeepSeek Coder 6.7B	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
Qwen 2.5 Coder 7B	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
Llama 3 8B	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐

实际使用建议

日常开发：DeepSeek Coder 6.7B 或 Qwen 2.5 Coder 7B

性能够用
资源占用合理
响应速度快

复杂任务：DeepSeek Coder 33B

代码质量更高
理解能力更强
需要更好的硬件

轻量使用：Llama 3 8B

资源占用最小
适合低配置电脑
通用能力不错

优化技巧

1. 使用 GPU 加速

确保 Ollama 使用 GPU：

# 检查 GPU 是否被使用
nvidia-smi

# 如果没有使用 GPU，设置环境变量
export OLLAMA_GPU=1

2. 调整上下文窗口

较小的上下文窗口可以提升速度：

{
  "provider": {
    "ollama": {
      "models": {
        "deepseek-coder": {
          "contextWindow": 8192  // 从 16384 降低到 8192
        }
      }
    }
  }
}

3. 使用量化模型

量化模型占用更少资源：

# Q4 量化（推荐）
ollama pull deepseek-coder:6.7b-instruct-q4_K_M

# Q8 量化（更高质量）
ollama pull deepseek-coder:6.7b-instruct-q8_0

4. 配置模型参数

{
  "provider": {
    "ollama": {
      "options": {
        "temperature": 0.3,  // 降低随机性
        "top_p": 0.9,
        "num_predict": 2048  // 限制生成长度
      }
    }
  }
}

混合使用策略

最佳实践是混合使用本地和云端模型：

{
  // 主模型：云端（复杂任务）
  "model": "anthropic/claude-sonnet-4-5",
  
  // 小模型：本地（简单任务）
  "small_model": "ollama/deepseek-coder",
  
  "enabled_providers": ["anthropic", "ollama"]
}

Opencode 会自动：

简单补全 → 使用本地模型（快速、免费）
复杂重构 → 使用云端模型（质量高）

常见问题

Q: 本地模型能达到 GPT-4 的水平吗？

A: 目前还有差距，但在编程任务上，DeepSeek Coder 33B 已经接近 GPT-3.5 的水平。对于日常开发够用了。

Q: 需要一直开着 Ollama 吗？

A: 是的，Opencode 需要连接到 Ollama 服务。可以设置开机自启：

# macOS
brew services start ollama

# Linux (systemd)
sudo systemctl enable ollama
sudo systemctl start ollama

Q: 可以同时运行多个模型吗？

A: 可以，但会占用更多资源。建议根据任务切换模型。

Q: 模型下载很慢怎么办？

A: 可以使用镜像或手动下载：

# 使用国内镜像（如果有）
export OLLAMA_MIRROR=https://mirror.example.com

# 或手动下载模型文件
# 然后使用 ollama create 导入

Q: 如何更新模型？

ollama pull deepseek-coder  # 会自动检查更新

Q: 本地模型支持中文吗？

A: 支持！Qwen 2.5 Coder 和 DeepSeek Coder 对中文支持都很好。

总结

本地模型让 AI 编程变得：

✅ 完全免费
✅ 完全隐私
✅ 完全离线

虽然在能力上还不如顶级云端模型，但对于日常开发已经足够。

推荐起步配置：

安装 Ollama
下载 DeepSeek Coder 6.7B
配置 Opencode
开始免费的 AI 编程之旅！