综合使用Ollama部署本地大模型

2024-11-19 10:00:55 +0800 CST views 2176

人工智能——使用Ollama部署本地大模型

1、简介

在如今的 AI 应用领域中，大模型（LLM，Large Language Models）已成为推动前沿技术发展的关键力量。其中的 Top1 当属 OpenAI 的 GPT 系列。通过大规模的数据训练，这些模型可以执行高质量的语言处理任务，如聊天问答、文本生成、翻译等。

去年，ChatGPT 引入了定制个人知识库的功能，采用了检索增强（RAG，Retrieval-Augmented Generation）技术。这一技术使得模型在生成回答前，先从知识库中检索相关信息，从而显著提高了输出的准确性和信息量。然而，由于网络环境、隐私和政策等限制，线上知识库的使用面临诸多挑战，越来越多人开始寻求部署本地大模型和知识库。

Ollama 的出现为本地部署带来了便利。Ollama 是一个大模型的管理框架，类似 Docker 的镜像管理方式，可以通过简单的命令快速拉取和运行大模型。

在本文中，我们将引导大家如何利用 Ollama 快速搭建本地大模型服务，并结合 MaxKB 构建一个私人定制的知识库。

2、优势

开源免费： Ollama 及其支持的模型完全开源免费，任何人都可以自由使用、修改和分发。
简单易用：无需复杂配置，只需几条命令即可启动和运行 Ollama。
模型丰富： Ollama 支持如 Llama 3、Mistral、Qwen2 等热门开源 LLM，并提供一键下载和切换功能。
资源占用低：即使在普通笔记本电脑上也能流畅运行。
社区活跃： Ollama 拥有庞大活跃的社区，用户可以轻松获取帮助、分享经验。

3、如何使用

安装 Ollama

根据你的操作系统，从 Ollama 官网下载并安装最新版本。

启动 Ollama

打开终端或命令行，输入以下命令启动 Ollama 服务器：

ollama serve

下载模型

在模型仓库中找到想要的模型，然后使用 ollama pull 命令下载：

ollama pull llama3:70b

运行模型

使用 ollama run 命令启动模型：

ollama run llama3:70b

开始聊天

在终端中输入你的问题或指令，Ollama 会根据模型生成相应的回复。

4、模型库

Ollama 支持多个模型，以下是一些可下载的示例模型：

Model	Parameters	Size	Command
Llama 3	8B	4.7GB	`ollama run llama3`
Llama 3	70B	40GB	`ollama run llama3:70b`
Mistral	7B	4.1GB	`ollama run mistral`
Dolphin Phi	2.7B	1.6GB	`ollama run dolphin-phi`
Code Llama	7B	3.8GB	`ollama run codellama`
Llama 2 Uncensored	7B	3.8GB	`ollama run llama2-uncensored`

5、安装Ollama

使用以下命令安装 Ollama：

curl -fsSL https://ollama.com/install.sh | sh

查看服务状态

systemctl status ollama

修改端口和模型存储位置

如果需要修改 Ollama 默认端口或模型存放路径，可编辑 /etc/systemd/system/ollama.service 文件：

[Service]
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_MODELS=/data/ollama/models"

指定 GPU

如果使用 GPU，可以配置 CUDA_VISIBLE_DEVICES ：

Environment="CUDA_VISIBLE_DEVICES=0,1"

重启 Ollama：

systemctl daemon-reload
systemctl restart ollama

6、安装 MaxKB

MaxKB 是一款基于 LLM 的知识库问答系统，由飞致云开发。使用 Docker 部署 MaxKB：

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data cr2.fit2cloud.com/1panel/maxkb

访问页面（默认账号：admin，密码：MaxKB@123..）。

7、导入模型

在 MaxKB 中，前往“系统管理” -> “模型设置” -> “Ollama”，添加模型，输入 API Key 后自动导入配置。

8、创建应用

在应用页面，点击“创建应用”，输入应用名称，关联模型，保存并发布。

images

复制全文生成海报人工智能机器学习软件开发

2024-11-19 05:14:20 +0800 CST

一个登录注册界面的HTML结构和样式

2024-11-17 20:33:23 +0800 CST

实现系统的动态热部署功能，允许用户上传自定义实现的Jar包并在不重启系统的情况下自动加载

2024-11-18 20:57:45 +0800 CST

Redis和Memcached有什么区别？

2024-11-18 17:57:13 +0800 CST

如何实现PC打开是Web应用、手机打开是H5应用

2024-11-18 21:30:23 +0800 CST

FastAPI是一个现代、高性能的Pythonweb框架，旨在快速构建API

2024-11-18 18:50:26 +0800 CST

前端接口防止重复请求的实现方案，主要通过axios拦截器来处理请求和响应

2024-11-19 08:37:02 +0800 CST

一个收银台的HTML

2025-01-17 16:15:32 +0800 CST

Vue 中 ref 和 reactive 如何实现响应式数据

2024-11-19 04:03:23 +0800 CST

python-docx是一个用于读取、创建和更新 Microsoft Word 2007+ (.docx) 文件的 Python 库。

2024-11-18 23:01:50 +0800 CST

使用Vue3和WebSocket创建一个简单的实时聊天应用

2024-11-17 20:49:57 +0800 CST

V3 Admin Vite：轻量级 Vue3 后台管理模板

2025-07-05 16:21:29 +0800 CST

总结出30个代码前端代码规范

2024-11-19 07:59:43 +0800 CST

一键配置本地yum源

2024-11-18 14:45:15 +0800 CST

Python日志记录：最强大、最好用的调试助手

2024-11-18 18:58:00 +0800 CST

38个实用的JavaScript技巧

2024-11-19 07:42:44 +0800 CST

Python中的`real-estate`库，旨在帮助房地产行业的数据分析人员获取和处理房地产数据

2024-11-18 19:33:13 +0800 CST

Golang 中你应该知道的 noCopy 策略

2024-11-19 05:40:53 +0800 CST

HTML5的 input:file上传类型控制

2024-11-19 07:29:28 +0800 CST

支付宝获取支付密钥和系统公钥的步骤

2024-11-19 02:09:02 +0800 CST

Go语言的并发编程，包括Mutex、RWMutex、WaitGroup和Channel等机制

2024-11-19 08:09:19 +0800 CST

使用Vue3和CompositionAPI实现图片拖拽上传功能。通过创建一个拖拽组件，用户可以直接将图片拖放到指定区域或通过按钮选择文件

2024-11-17 10:01:20 +0800 CST

Python的schedule库，提供了简单优雅的任务调度解决方案

2024-11-19 02:17:26 +0800 CST

2025，重新认识 HTML！

2025-02-07 14:40:00 +0800 CST

Vue 3 中的 Watch 实现及最佳实践

2024-11-18 22:18:40 +0800 CST

Skip是一款为Swift开发者设计的跨平台工具，允许开发者使用一套Swift代码生成iOS和Android的原生应用

2024-11-19 05:18:20 +0800 CST

这是一个基于移动优先设计的简单HTML示例

2024-11-18 15:54:42 +0800 CST

GoView是一个基于Vue3的低代码可视化开发设计器

2024-11-19 06:38:15 +0800 CST

Vue3 自定义 `ref` —— `customRef` 的使用

2024-11-18 10:05:40 +0800 CST

AI 直播工具：Deep Live Cam 实时换脸效果超乎想象！附安装教程

2024-11-19 08:13:10 +0800 CST

php常用的正则表达式

2024-11-19 03:48:35 +0800 CST

MonkeyOCR：国产开源OCR新星，结构化识别更高效

2025-07-22 18:09:30 +0800 CST

18个实用的 JavaScript 函数

2024-11-17 18:10:35 +0800 CST

Awesome-Hacking是一个在GitHub上拥有81,774星的开源项目，旨在为黑客技术爱好者提供全面的资源库

2024-11-19 04:42:04 +0800 CST

Vue.js中的自定义过滤器是什么？如何创建一个自定义过滤器？

2024-11-17 14:04:17 +0800 CST

Flip‑JS：优雅处理元素结构变化动画

2025-06-28 11:41:42 +0800 CST

编程语言中，python,go,rust 哪个好？

2024-11-19 03:49:32 +0800 CST

在Vue中，你有使用过的单文件组件吗？

2024-11-17 04:30:45 +0800 CST

如何在Vue中为组件添加简单的CSS动画和过渡效果

2024-11-18 05:29:03 +0800 CST

CentOS 镜像源配置

2024-11-18 11:28:06 +0800 CST

Vue3中的不同生命周期钩子是如何演变的？他们与传统的Vue2生命周期钩子有何不同？

2024-11-19 08:56:37 +0800 CST

Vue3中的自定义指令有哪些变化？

2024-11-18 07:48:06 +0800 CST

Vue3 中哪些 API 变化较大，需要开发者特别留意？

2024-11-18 10:16:41 +0800 CST

Fingerprintjs：告别隐身的浏览器指纹识别技术

2024-11-19 04:25:55 +0800 CST

Rust 的错误处理机制是否真的完美？

2024-11-19 02:17:29 +0800 CST

提升 CSS 开发效率的必备 Chrome 插件

2025-07-12 15:17:22 +0800 CST

如何在Vue3中使用事件总线实现跨组件通信？

2024-11-17 22:19:47 +0800 CST

如何在Vue3中使用组合API和ref创建一个响应式表单？

2024-11-19 07:04:42 +0800 CST

使用 Go 语言操作 SQLite 数据库的详细指南

2024-11-18 08:11:37 +0800 CST

使用Vue3实现动画效果，包括简单的渐变动画和淡入淡出效果。通过示例代码，读者可以了解如何利用Vue3的组合式API和CSS动画提升用户体验

2024-11-18 22:44:37 +0800 CST

综合 使用Ollama部署本地大模型