综合 使用Ollama部署本地大模型

2024-11-19 10:00:55 +0800 CST views 1671

人工智能——使用Ollama部署本地大模型

1、简介

在如今的 AI 应用领域中,大模型(LLM,Large Language Models)已成为推动前沿技术发展的关键力量。其中的 Top1 当属 OpenAI 的 GPT 系列。通过大规模的数据训练,这些模型可以执行高质量的语言处理任务,如聊天问答、文本生成、翻译等。

去年,ChatGPT 引入了定制个人知识库的功能,采用了检索增强(RAG,Retrieval-Augmented Generation)技术。这一技术使得模型在生成回答前,先从知识库中检索相关信息,从而显著提高了输出的准确性和信息量。然而,由于网络环境、隐私和政策等限制,线上知识库的使用面临诸多挑战,越来越多人开始寻求部署本地大模型和知识库。

Ollama 的出现为本地部署带来了便利。Ollama 是一个大模型的管理框架,类似 Docker 的镜像管理方式,可以通过简单的命令快速拉取和运行大模型。

在本文中,我们将引导大家如何利用 Ollama 快速搭建本地大模型服务,并结合 MaxKB 构建一个私人定制的知识库。

2、优势

  • 开源免费: Ollama 及其支持的模型完全开源免费,任何人都可以自由使用、修改和分发。
  • 简单易用: 无需复杂配置,只需几条命令即可启动和运行 Ollama。
  • 模型丰富: Ollama 支持如 Llama 3、Mistral、Qwen2 等热门开源 LLM,并提供一键下载和切换功能。
  • 资源占用低: 即使在普通笔记本电脑上也能流畅运行。
  • 社区活跃: Ollama 拥有庞大活跃的社区,用户可以轻松获取帮助、分享经验。

3、如何使用

安装 Ollama

根据你的操作系统,从 Ollama 官网 下载并安装最新版本。

启动 Ollama

打开终端或命令行,输入以下命令启动 Ollama 服务器:

ollama serve

下载模型

在模型仓库中找到想要的模型,然后使用 ollama pull 命令下载:

ollama pull llama3:70b

运行模型

使用 ollama run 命令启动模型:

ollama run llama3:70b

开始聊天

在终端中输入你的问题或指令,Ollama 会根据模型生成相应的回复。

4、模型库

Ollama 支持多个模型,以下是一些可下载的示例模型:

ModelParametersSizeCommand
Llama 38B4.7GBollama run llama3
Llama 370B40GBollama run llama3:70b
Mistral7B4.1GBollama run mistral
Dolphin Phi2.7B1.6GBollama run dolphin-phi
Code Llama7B3.8GBollama run codellama
Llama 2 Uncensored7B3.8GBollama run llama2-uncensored

5、安装Ollama

使用以下命令安装 Ollama:

curl -fsSL https://ollama.com/install.sh | sh

查看服务状态

systemctl status ollama

修改端口和模型存储位置

如果需要修改 Ollama 默认端口或模型存放路径,可编辑 /etc/systemd/system/ollama.service 文件:

[Service]
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_MODELS=/data/ollama/models"

指定 GPU

如果使用 GPU,可以配置 CUDA_VISIBLE_DEVICES

Environment="CUDA_VISIBLE_DEVICES=0,1"

重启 Ollama:

systemctl daemon-reload
systemctl restart ollama

6、安装 MaxKB

MaxKB 是一款基于 LLM 的知识库问答系统,由飞致云开发。使用 Docker 部署 MaxKB:

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data cr2.fit2cloud.com/1panel/maxkb

访问页面(默认账号:admin,密码:MaxKB@123..)。

7、导入模型

在 MaxKB 中,前往“系统管理” -> “模型设置” -> “Ollama”,添加模型,输入 API Key 后自动导入配置。

8、创建应用

在应用页面,点击“创建应用”,输入应用名称,关联模型,保存并发布。

images

复制全文 生成海报 人工智能 机器学习 软件开发

推荐文章

php客服服务管理系统
2024-11-19 06:48:35 +0800 CST
15 个 JavaScript 性能优化技巧
2024-11-19 07:52:10 +0800 CST
npm速度过慢的解决办法
2024-11-19 10:10:39 +0800 CST
Redis函数在PHP中的使用方法
2024-11-19 04:42:21 +0800 CST
如何在Rust中使用UUID?
2024-11-19 06:10:59 +0800 CST
HTML5的 input:file上传类型控制
2024-11-19 07:29:28 +0800 CST
Python 微软邮箱 OAuth2 认证 Demo
2024-11-20 15:42:09 +0800 CST
PHP 代码功能与使用说明
2024-11-18 23:08:44 +0800 CST
Gin 与 Layui 分页 HTML 生成工具
2024-11-19 09:20:21 +0800 CST
阿里云免sdk发送短信代码
2025-01-01 12:22:14 +0800 CST
任务管理工具的HTML
2025-01-20 22:36:11 +0800 CST
go发送邮件代码
2024-11-18 18:30:31 +0800 CST
windows安装sphinx3.0.3(中文检索)
2024-11-17 05:23:31 +0800 CST
2025,重新认识 HTML!
2025-02-07 14:40:00 +0800 CST
go命令行
2024-11-18 18:17:47 +0800 CST
Go 语言实现 API 限流的最佳实践
2024-11-19 01:51:21 +0800 CST
在JavaScript中实现队列
2024-11-19 01:38:36 +0800 CST
程序员茄子在线接单