编程使用 LangChainGo + Gin 实现流式 AI 问答系统

2025-03-09 22:26:15 +0800 CST views 981

实战: 使用 LangChainGo + Gin 实现流式 AI 问答系统

在本篇文章中，我们将使用 LangChainGo + Gin 框架，结合 Ollama 大语言模型，实现一个流式 AI 问答系统。最终，我们还会使用 curl 进行测试，由于是实战例子所以我会提供一个简单的 html+css+js 的前端来实时显示 AI 的回答。

流式响应的意义

在传统 API 调用中，我们往往要等到大语言模型（LLM）计算完成后，才能返回完整的回答。这会导致：

等待时间长：用户需要等待很久，体验不佳。
缺乏实时性：无法在模型生成内容的同时，逐步显示给用户。

而流式响应可以：

逐步输出生成的内容，前端可以即时渲染，提升用户体验。
优化带宽，避免一次性传输大数据，减少系统压力。

后端：Gin + LangChainGo 实现流式响应

我们闲话少说，开始今天的正题，具体步骤如下所示:

1. 创建项目并安装依赖

首先我们创建一个名为 robot-go 的项目，并安装其所需要的依赖。

mkdir robot-go
cd robot-go/
go mod init github.com/xxx/robot-go
go get github.com/gin-gonic/gin
go get github.com/tmc/langchaingo@v0.1.13
go get github.com/tmc/langchaingo/llms@v0.1.13

2. 编写代码

键入如下代码：

func chatHandler(c *gin.Context) {
    var request struct {
        Question string `json:"question"`
    }
    if err := c.ShouldBindJSON(&request); err != nil {
        log.Printf("Invalid request: %v", err)
        c.JSON(http.StatusBadRequest, gin.H{"error": "invalid request"})
        return
    }
    if request.Question == "" {
        log.Print("Empty question received")
        c.JSON(http.StatusBadRequest, gin.H{"error": "question cannot be empty"})
        return
    }
    ctx := context.Background()
    // 设置 SSE 头部
    c.Writer.Header().Set("Content-Type", "text/event-stream")
    c.Writer.Header().Set("Cache-Control", "no-cache")
    c.Writer.Header().Set("Connection", "keep-alive")
    c.Writer.Flush()
    content := []llms.MessageContent{
        llms.TextParts(llms.ChatMessageTypeHuman, request.Question),
    }
    // 调用流式 API
    _, err := llmClient.GenerateContent(ctx, content, llms.WithStreamingFunc(func(ctx context.Context, chunk []byte) error {
        fmt.Fprintf(c.Writer, "data: %s\n\n", string(chunk))
        c.Writer.Flush()
        return nil
    }))
    if err != nil {
        log.Printf("Failed to generate content: %v", err)
        c.JSON(http.StatusInternalServerError, gin.H{"error": "failed to get response"})
        return
    }
    fmt.Fprintln(c.Writer, "data: [DONE]\n")
    c.Writer.Flush()
}

代码解析

llm.GenerateContent：调用 LangChainGo 生成流式数据。
llms.WithStreamingFunc：注册一个回调函数，每当 LLM 生成新的文本，都会实时返回。
c.Writer.Flush()：确保数据立即推送到客户端，而不是缓存。

使用 curl 进行测试

我们先运行后端服务，具体命令如下所示：

go run main.go

然后，使用 curl 进行测试：

curl -X POST http://localhost:9527/api/chat \
    -H "Content-Type: application/json" \
    -d '{"question": "请介绍一下Go语言"}' \
    --no-buffer

⚠️注意: --no-buffer 让 curl 立即显示流式数据。

测试结果如下所示：

⚠️注意: 别忘记了在本地运行 Ollama，这里我使用的模型是 qwen2:7b！！！

前端实现

由于是一个简单的例子所以就没有用 react 框架来做，前端的效果如下所示：

这里可以放置前端代码和截图（如果有的话）

总结

本篇文章，我们从后端实现到前端流式渲染，完整实现了一个流式 AI 问答系统：

✅ 使用 LangChainGo + Ollama 处理 LLM 调用
✅ Gin 提供 SSE（Server-Sent Events）流式 API
✅ curl 终端测试，逐步返回 AI 生成文本
✅ 简单的使用了 html+css+js 实现前端实时显示

🚀 完整代码已开源，你可以尝试改进并扩展，比如：

支持多轮对话，携带对话上下文记忆等。
接入更强大的 LLM 模型，例如 deepseek 等。
优化前端 UI 交互，可以使用 react 这类框架来实现。
实现更复杂的应用场景，例如问答搜索等。

复制全文生成海报 AI 编程 Web开发流式处理后端开发

2025-05-07 10:28:48 +0800 CST

一文详解回调地狱

2024-11-19 05:05:31 +0800 CST

4.6K Star 彻底颠覆!!! 你敢信浏览器直接跑 Linux！

2024-11-19 02:10:52 +0800 CST

Flask内置调试器是开发者查找和修复问题的重要工具

2024-11-19 05:28:21 +0800 CST

thinkphp swoole websocket 结合的demo

2024-11-18 10:18:17 +0800 CST

Chrome AI：颠覆网页开发的全新黑科技

2024-11-19 09:46:54 +0800 CST

请简要介绍一下 Vue3 的标记式重建和效率优化

2024-11-19 03:10:22 +0800 CST

Rust 并发执行异步操作

2024-11-19 08:16:42 +0800 CST

Go 中的单例模式

2024-11-17 21:23:29 +0800 CST

PPTist是一个基于Vue3的在线PPT演示文稿应用

2024-11-19 04:37:49 +0800 CST

aiohere是一个用于处理异步IO操作的Python库

2024-11-18 11:00:26 +0800 CST

全网首发：Vue 3.5 源码解析，useTemplateRef 实现原理

2024-11-19 09:30:11 +0800 CST

如何安全使用SSH？限制在本地访问

2024-11-19 03:35:41 +0800 CST

智慧加水系统

2024-11-19 06:33:36 +0800 CST

效率翻倍！6 款不容错过的免费 AI 神器

2024-11-19 08:21:41 +0800 CST

PygameZero是一个简单而强大的Python游戏开发库，适合初学者和快速创建简单游戏的开发者

2024-11-19 08:48:09 +0800 CST

什么是 JavaScript 记忆化（Memoization）？

2024-11-19 09:33:15 +0800 CST

Go/Golang中的集合 – 使用映射和推荐的包

2024-11-19 02:03:38 +0800 CST

Vue3中使用CompositionAPI进行组件间通信的多种方式，包括父子组件通信、兄弟组件通信和非直接关系组件通信

2024-11-18 19:52:25 +0800 CST

nuxt.js服务端渲染框架

2024-11-17 18:20:42 +0800 CST

MySQL 优化利剑 EXPLAIN

2024-11-19 00:43:21 +0800 CST

Vue 3 中的 `toRefs` 函数有什么用途？

2024-11-18 11:26:50 +0800 CST

告别Mock.js：现代前端API模拟解决方案深度实践

2025-03-30 09:19:22 +0800 CST

gosort 包实现了对列表的排序以及在有序列表上的二分查找

2024-11-19 04:46:04 +0800 CST

如何将TypeScript与Vue3结合使用

2024-11-19 01:47:20 +0800 CST

H5保险购买与投诉意见

2024-11-19 03:48:35 +0800 CST

JSDoc是一个用于JavaScript的开源API文档生成器，允许开发者在源代码中添加注释并生成HTML文档

2024-11-19 10:05:45 +0800 CST

attrs是一个强大的Python库，旨在简化类定义，减少样板代码

2024-11-18 04:47:26 +0800 CST

Shell脚本监控和管理Linux系统中的高CPU使用率进程

2024-11-19 06:13:28 +0800 CST

Rust中的异步编程，重点介绍了`async-std`库的安装、基本概念、异步函数、任务调度、异步I/O操作以及错误处理等内容

2024-11-17 21:59:47 +0800 CST

Chance.js，一款神奇的 JavaScript 开源极简随机数据生成器

2024-11-19 02:30:05 +0800 CST

ServerStatus一款开源的服务器监控工具

2024-11-18 18:12:07 +0800 CST

七种高级JavaScript技术，包括闭包、解构、去抖动、节流、柯里化、Proxy、事件循环和记忆化

2024-11-18 22:08:50 +0800 CST

Go 语言 iota 解密：小设计解决大问题的智慧

2025-07-11 12:37:30 +0800 CST

实时监控网页变动的利器！- ChangeDetection

2024-11-19 10:07:56 +0800 CST

Gin 框架的中间件代码压缩

2024-11-19 08:23:48 +0800 CST

10个优秀的开源无头浏览器—自动化测试、爬虫、RPA 操作利器

2024-11-19 09:36:25 +0800 CST

Python的schedule库，提供了简单优雅的任务调度解决方案

2024-11-19 02:17:26 +0800 CST

VibeBot，一个在Python中非常有用的库

2024-11-19 09:42:19 +0800 CST

FingerprintJS：强大的浏览器指纹识别库

2024-11-19 09:45:25 +0800 CST

Linux 常用进程命令介绍

2024-11-19 05:06:44 +0800 CST

Vue3的setup语法糖构建一个简单的购物车应用

2024-11-18 08:58:07 +0800 CST

Rust：一个安全快速的多生产者多消费者 Channel 库

2024-11-18 14:42:09 +0800 CST

移动端 CSS 适配全攻略：从基础到进阶全面解析

2025-07-22 12:32:47 +0800 CST

中后台开发神器！Cool-Admin-Midway 让你一分钟完成后台搭建！

2024-11-18 01:31:19 +0800 CST

✍️ 纯 CSS 实现打字效果（无需 JavaScript）

2025-05-15 10:26:06 +0800 CST

写Vue大篇幅的ref、computed，而reactive为何少见？

2024-11-18 21:26:50 +0800 CST

gdrepl库，轻松实现Python中的全局字符串替换

2024-11-18 08:47:46 +0800 CST

如何在Vue3中使用事件总线实现跨组件通信？

2024-11-17 22:19:47 +0800 CST

对多个数组或多维数组进行排序

2024-11-17 05:10:28 +0800 CST

编程 使用 LangChainGo + Gin 实现流式 AI 问答系统