Ubuntu 搭建 Ollama 本地部署 DeepSeek 和 Qwen 大模型实战指南

字数: (4018)

阅读: (4562)

2026-04-15 04:40:41

内容摘要：Ubuntu 搭建 Ollama 本地部署 DeepSeek 和 Qwen 大模型实战指南,

在当今 AI 技术快速发展的时代，直接在本地运行大模型已成为开发者和研究人员的迫切需求。本文将详细介绍如何在 Ubuntu 系统上使用 Ollama 搭建平台，并部署 DeepSeek 和 Qwen 等优秀的大模型，助你实现本地化的 AI 应用开发。传统的方案例如使用 Docker 部署，会遇到一些网络配置和资源管理的问题，Ollama 则简化了整个流程。

为什么选择 Ollama？

Ollama 提供了一种简单高效的方式来运行和管理本地大模型。它通过自动化的模型下载、依赖管理和推理优化，极大地降低了使用大模型的门槛。对比传统的 TensorFlow Serving 或 PyTorch Serve 方式，Ollama 无需复杂的配置，即可快速启动并使用各种主流的大模型，包括 DeepSeek 和 Qwen。

环境准备：Ubuntu 系统

首先，确保你拥有一台安装了 Ubuntu 系统的服务器或个人电脑。推荐使用 Ubuntu 20.04 或更高版本，并且具备足够的 GPU 资源（如果需要进行 GPU 加速推理）。如果你的服务器在国内，建议配置好 apt 代理，以加速软件包的下载。例如：

Ubuntu 搭建 Ollama 本地部署 DeepSeek 和 Qwen 大模型实战指南

# 配置 apt 代理
sudo nano /etc/apt/apt.conf.d/proxy.conf

# 在文件中添加以下内容，替换为你的代理服务器地址和端口
Acquire::http::Proxy "http://your_proxy_server:your_proxy_port";
Acquire::https::Proxy "http://your_proxy_server:your_proxy_port";

# 更新 apt 软件包索引
sudo apt update

安装 Ollama

Ollama 提供了简单的安装脚本，可以直接从官方网站下载并执行。安装过程会自动下载并安装 Ollama 及其依赖项。

curl -fsSL https://ollama.ai/install.sh | sh

安装完成后，启动 Ollama 服务：

ollama serve

部署 DeepSeek 大模型

Ollama 允许你通过简单的命令行指令来下载和运行 DeepSeek 大模型。首先，搜索可用的 DeepSeek 模型：

ollama pull deepseek-coder

然后，运行 DeepSeek 模型：

ollama run deepseek-coder "请写一段 Python 代码，实现快速排序算法。"

部署 Qwen 大模型

类似地，你可以使用 Ollama 部署 Qwen 大模型。首先，搜索 Qwen 模型：

ollama pull qwen

然后，运行 Qwen 模型：

ollama run qwen "请用中文介绍一下你自己。"

优化与配置

模型选择： Ollama 支持多种 DeepSeek 和 Qwen 模型，你可以根据你的需求选择合适的模型版本。例如 qwen:1.5 可以选择指定版本。
GPU 加速： 如果你的服务器配备了 GPU，Ollama 可以自动利用 GPU 进行加速推理。确保你已经安装了正确的 CUDA 驱动程序和 cuDNN 库。
资源限制： 你可以通过 Ollama 的配置文件来限制模型的内存使用和 CPU 占用，以避免资源耗尽。
Prompt 工程: 针对不同的大模型， Prompt 的效果差异很大，需要根据实际情况调整，才能达到最佳效果。

常见问题与解决方案

下载速度慢： 如果你发现模型下载速度很慢，可以尝试配置 Ollama 使用国内的镜像源。
内存不足： 如果你的服务器内存不足，可以尝试减少模型的并发连接数，或者选择更小尺寸的模型。
GPU 驱动问题： 确保你的 GPU 驱动程序版本与 CUDA 兼容，否则可能导致 GPU 加速失效。

实战案例：本地代码生成

让我们通过一个实战案例来演示如何使用 Ollama 部署的 DeepSeek 大模型进行本地代码生成。假设我们需要生成一个简单的 Web 服务器，可以使用以下指令：

ollama run deepseek-coder "请用 Python Flask 框架编写一个简单的 Web 服务器，监听 8080 端口，并返回 'Hello, World!'。"

DeepSeek 将自动生成相应的 Python 代码，你可以直接运行该代码来启动 Web 服务器。如果遇到问题，可以参考类似 “使用宝塔面板进行 Nginx 反向代理”的思路，配置好网络环境。

总结

本文详细介绍了如何在 Ubuntu 系统上使用 Ollama 搭建平台，并部署 DeepSeek 和 Qwen 等大模型。通过 Ollama，你可以轻松地在本地运行和管理各种主流的大模型，实现本地化的 AI 应用开发。希望本文能够帮助你快速上手 Ollama，并充分利用大模型的强大能力。通过本地部署大模型，可以有效降低延迟，提高数据安全性，并且不受网络环境的限制。这对于一些对实时性要求高或者需要处理敏感数据的应用场景非常重要。

Ubuntu 搭建 Ollama 本地部署 DeepSeek 和 Qwen 大模型实战指南

转载请注明出处: HelloWorld狂魔

本文的链接地址: http://m.acea4.store/blog/089487.SHTML

本文最后发布于2026-04-15 04:40:41，已经过了12天没有更新，若内容或图片失效，请留言反馈

推荐阅读

(37)

MybatisPlus邂逅PageHelper：分页难题终极解决方案及版本兼容避坑指南 LinkedList 头尾插入性能优异？深入剖析 Java 集合中的隐蔽陷阱

您可能对以下文章感兴趣

麻辣烫 3 天前
写得太好了！Ollama 确实简化了大模型的部署流程，省去了很多配置的麻烦。
陕西油泼面 5 天前
感谢分享，正好最近在研究本地部署大模型，这篇教程很有帮助！
风一样的男子 4 天前
请问一下，如果服务器没有 GPU，Ollama 还能正常运行吗？性能会差很多吗？
可乐加冰 4 天前
国内镜像源配置可以详细说一下吗？我下载模型速度太慢了。
香菜必须死 1 天前
写得太好了！Ollama 确实简化了大模型的部署流程，省去了很多配置的麻烦。