程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
编程
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
2026-04-15 22:19:22 +0800 CST
view 400
深度解析微软VibeVoice开源语音AI全家桶:7.5Hz连续Tokenizer如何压缩60分钟音频,Next-Token Diffusion如何驱动90分钟对话合成,附完整代码实战与性能对比。
VibeVoice
微软
语音AI
ASR
TTS
Diffusion
LLM
VibeVoice 深度实战:微软开源的 33K Star 语音AI全家桶——从架构设计到生产部署的全链路解析
编程
VibeVoice 深度实战:微软开源的 33K Star 语音AI全家桶——从架构设计到生产部署的全链路解析
2026-05-06 13:01:56 +0800 CST
view 664
微软开源 VibeVoice 语音AI框架深度解析,33K Star,单次处理60分钟ASR、90分钟TTS、300ms实时生成。
VibeVoice
语音AI
微软
开源
TTS
ASR
实时语音
OmniVoice Studio:5k Star开源声音克隆工具,646种语言,无GPU也能跑
编程
OmniVoice Studio:5k Star开源声音克隆工具,646种语言,无GPU也能跑
2026-05-28 20:50:27 +0800 CST
view 236
OmniVoice Studio是5k Star全本地运行ElevenLabs开源替代方案,支持零样本声音克隆、646种语言、无GPU也能跑(最低4GB内存),跨平台桌面客户端,支持MCP。
声音克隆
开源
TTS
AI音频
OmniVoice
语音合成
多语言
CosyVoice
MCP
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
编程
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
2026-04-25 08:17:20 +0800 CST
view 859
MOSS-TTS-Nano 是模思智能和OpenMOSS团队开源的0.1B参数超小语音合成模型,支持纯CPU推理、ONNX加速、20种语言、零样本语音克隆、流式输出48kHz立体声,还有浏览器插件可直接在Chrome中使用。
AI
开源
语音合成
TTS
MOSS
MySQL 9.7.0 LTS 深度解析:向量检索、JOIN 性能飞跃、AI 与云原生时代的数据库新标杆
编程
MySQL 9.7.0 LTS 深度解析:向量检索、JOIN 性能飞跃、AI 与云原生时代的数据库新标杆
2026-05-14 14:43:35 +0800 CST
view 308
MySQL 9.7.0 LTS于2026年4月21日发布,8年支持周期。原生向量检索支持RAG架构、多表JOIN性能提升3-5倍、JavaScript/Python存储过程、JSON增强查询、HeatWave内存加速。完整迁移指南与性能基准测试对比。
MySQL
数据库
向量检索
RAG
LTS
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率重塑语音 AI——从 ASR 到实时 TTS 的全栈技术内幕
编程
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率重塑语音 AI——从 ASR 到实时 TTS 的全栈技术内幕
2026-04-17 10:48:42 +0800 CST
view 492
深入解析微软开源的 VibeVoice 语音 AI 框架,涵盖 7.5Hz 超低帧率连续 tokenizer、Next-Token Diffusion 架构、三大模型(ASR/TTS/Realtime)全栈设计,以及生产环境部署与性能优化实践。
语音AI
VibeVoice
微软
TTS
ASR
深度学习
开源
微软开源 VibeVoice:60分钟长音频转录、实时TTS,这个语音AI全家桶有点猛
编程
微软开源 VibeVoice:60分钟长音频转录、实时TTS,这个语音AI全家桶有点猛
2026-04-08 11:36:14 +0800 CST
view 529
微软开源的 VibeVoice 语音 AI 全家桶,集 ASR 和 TTS 能力于一身,支持 60 分钟长音频转录、90 分钟多说话人音频生成、300ms 实时 TTS。本文深入解析其技术架构与实测代码。
TTS
ASR
语音AI
微软
VibeVoice
开源项目
MySQL 8.4 LTS 深度实战:8年超长支持周期的数据库新标准——从架构变革到生产级部署的全链路解析
编程
MySQL 8.4 LTS 深度实战:8年超长支持周期的数据库新标准——从架构变革到生产级部署的全链路解析
2026-05-08 10:40:39 +0800 CST
view 383
深度剖析 MySQL 8.4 LTS 的架构变革、MGR 一致性模型、废弃特性、性能优化与升级迁移实战,覆盖 8 年超长支持周期的数据库新标准
MySQL
Database
LTS
DBA
InnoDB
VoxCPM2 深度实战:当开源 TTS 突破「tokenizer 诅咒」——从Tokenizer-Free 架构到本地 CPU/GPU 部署的完全指南(2026)
编程
VoxCPM2 深度实战:当开源 TTS 突破「tokenizer 诅咒」——从Tokenizer-Free 架构到本地 CPU/GPU 部署的完全指南(2026)
2026-06-09 14:50:53 +0800 CST
view 89
VoxCPM2 深度实战:当开源 TTS 突破「tokenizer 诅咒」——从Tokenizer-Free 架构到本地 CPU/GPU 部署的完全指南(2026) 前言 2026年的TTS(Text-to-Speech,语音合成)战场,用一个字形容就是「卷」。 闭源巨头们打得不可开交——GPT-4o 的语音模式刚刚让人惊艳,ElevenLabs 又祭出了新一代多语言引擎,Google 的 Pro...
VoxCPM2
TTS
语音合成
AI语音
开源
Diffusion
Tokenizer-Free
MiniCPM
多语言
语音克隆
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
编程
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
2026-04-28 12:43:51 +0800 CST
view 289
NVIDIA开源NeuTTS Air——0.5B参数超拟真语音合成模型,仅需3秒音频即可完成声音克隆,可在手机、笔记本甚至树莓派上本地运行,完全保护隐私,无需联网。
AI
TTS
声音克隆
本地部署
NVIDIA
语音合成
边缘计算
2026 AI Agent 框架四分天下:OpenAI、Claude Code、CodeBuddy、OpenClaw 的架构哲学对决
编程
2026 AI Agent 框架四分天下:OpenAI、Claude Code、CodeBuddy、OpenClaw 的架构哲学对决
2026-04-09 06:54:56 +0800 CST
view 1046
2026年AI Agent领域最值得关注的不是某个新框架的诞生,而是既有格局的彻底分叉。本文深入剖析OpenAI、Claude Code、CodeBuddy和OpenClaw四条路线的架构哲学、核心机制与实际取舍,为AI Agent选型提供真正有价值的参考。
AI Agent
OpenAI
Claude Code
OpenClaw
多Agent
框架对比
Star-Office-UI:超可爱的像素风格AI办公室看板,把龙虾摸鱼状态可视化
案例
Star-Office-UI:超可爱的像素风格AI办公室看板,把龙虾摸鱼状态可视化
2026-05-09 07:16:11 +0800 CST
view 268
Star-Office-UI开源项目:像素风格的AI办公室看板,实时可视化Agent工作状态,支持多Agent协作、中英日三语、桌面宠物模式,与OpenClaw深度集成一条命令部署
OpenClaw
像素风格
AI看板
多Agent协作
桌面宠物
可视化
OpenClaw集成
OpenViking 深度实战:火山引擎开源上下文数据库——让 AI Agent 拥有「记忆」的技术革命(2026 完全指南)
编程
OpenViking 深度实战:火山引擎开源上下文数据库——让 AI Agent 拥有「记忆」的技术革命(2026 完全指南)
2026-05-26 14:41:18 +0800 CST
view 285
OpenViking 是火山引擎开源的上下文数据库,专为 AI Agent 设计,通过虚拟文件系统(viking:// 协议)管理项目资源、用户偏好和会话状态,支持三级上下文加载和 HNSW 向量检索,让 AI Agent 真正拥有长期记忆能力。
AI Agent
OpenViking
上下文管理
火山引擎
向量数据库
OpenClaw
记忆系统
MCP
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
编程
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
2026-04-10 02:23:58 +0800 CST
view 679
深入解析OpenScreen:26K Stars的GitHub开源录屏工具,用Electron+FFmpeg技术栈复现Screen Studio全部核心功能,包括自动缩放、运动模糊、背景虚化等。跨平台支持macOS/Windows/Linux,完全免费开源。
OpenScreen
Screen Studio
Electron
FFmpeg
开源录屏
桌面应用
TypeScript
MCP(Model Context Protocol)深度解析:AI Agent 的「USB-C 接口」如何重构智能体生态
编程
MCP(Model Context Protocol)深度解析:AI Agent 的「USB-C 接口」如何重构智能体生态
2026-04-13 00:55:43 +0800 CST
view 449
深度解析MCP协议:AI Agent生态的USB-C统一接口,从协议规范到工程实践全覆盖。
MCP
Model Context Protocol
Anthropic
AI Agent
智能体协议
JSON-RPC
标准化
OpenClaw
工程实践
MCP vs A2A 实战对比:一篇文章讲透 AI Agent 两大通信协议的设计哲学与生产落地
编程
MCP vs A2A 实战对比:一篇文章讲透 AI Agent 两大通信协议的设计哲学与生产落地
2026-06-04 14:45:19 +0800 CST
view 211
2026年AI Agent领域最重要的两个协议——MCP和A2A的深度对比解析。从协议原理到生产落地,工程师视角的完整实战指南。
MCP
A2A
AI Agent
协议
OpenAI
Anthropic
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
编程
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
2026-04-09 05:15:20 +0800 CST
view 530
2026年4月4日,Anthropic正式封杀OpenClaw,30万虾农遭遇断粮危机。本文深度解析封杀背后的商业逻辑、ClawAegis安全防护体系,以及AI Agent时代的商业模式之争。
AI Agent
OpenClW
ClawAegis
Anthropic
大模型安全
开源智能体
OpenSRE 深度解析:当 AI Agent 遇上生产故障排查,SRE 的范式革命正在发生
编程
OpenSRE 深度解析:当 AI Agent 遇上生产故障排查,SRE 的范式革命正在发生
2026-04-18 11:15:31 +0800 CST
view 621
OpenSRE 是一个开源的 AI SRE Agent 框架,专注于生产环境故障的根因分析。本文深度解析其架构设计、合成测试体系与实战应用。
OpenSRE
SRE
AI Agent
DevOps
故障排查
开源项目
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 516
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
Free Claude Code:让Claude Code接入任意模型,打破Anthropic绑定
编程
Free Claude Code:让Claude Code接入任意模型,打破Anthropic绑定
2026-04-29 12:20:38 +0800 CST
view 785
Free Claude Code是让Claude Code接入任意模型的代理层项目,打破Anthropic绑定,支持NVIDIA NIM/OpenRouter/DeepSeek/Ollama/LM Studio等后端,适合想降成本或本地部署AI编程环境的人。
Claude Code
AI编程
开源工具
OpenRouter
DeepSeek
Ollama
LM Studio
AI Coding
Anthropic
CLI Printing Press:火爆外网的Go开源神器!一键生成Agent专属CLI工具,45个开箱即用
案例
CLI Printing Press:火爆外网的Go开源神器!一键生成Agent专属CLI工具,45个开箱即用
2026-05-09 10:35:37 +0800 CST
view 398
CLI Printing Press:火爆外网的Go开源神器!给一个API地址或网站URL,自动生成专为AI Agent设计的Go CLI工具+MCP服务器+Claude Code Skill。内置五层创造力梯子(本地持久化→compound查询→行为洞察),比MCP token消耗少100倍。45个开箱即用的CLI库(espn/linear/flight-goat等),Go 1.26+即可使用。
Go
AI Agent
CLI
MCP
开源
Claude Code
SQLite
本地优先
API
Python
Rust
OpenClaw
discord
Linear
Stripe
GitHub
Notion
OpenHuman 深度实战:从 Tauri 2.x 到桌面 AI 超级智能体——2026 年个人 AI 助手架构完全指南
编程
OpenHuman 深度实战:从 Tauri 2.x 到桌面 AI 超级智能体——2026 年个人 AI 助手架构完全指南
2026-05-24 04:02:31 +0800 CST
view 299
深度剖析 OpenHuman 基于 Tauri 2.x + Rust + TypeScript 的架构设计,讲解 Memory Tree、118+ 第三方集成、TokenJuice 等核心功能,并提供完整代码实战。
OpenHuman
Tauri
Rust
TypeScript
AI Agent
ClawKeeper 深度解析:当「用智能体监管智能体」从概念走向工程——三层防御架构如何为 OpenClaw 系上数字安全带
编程
ClawKeeper 深度解析:当「用智能体监管智能体」从概念走向工程——三层防御架构如何为 OpenClaw 系上数字安全带
2026-04-12 20:56:05 +0800 CST
view 501
深度解析智源、北邮、信通院联合发布的 ClawKeeper v1.0——首个面向 OpenClaw 的三层实时安全框架。从 CVE-2026-33579 等高危漏洞切入,详细剖析 Skill-based、Plugin-based、Watcher-based 三层防御架构的设计哲学与工程实现,探讨「用智能体监管智能体」的安全新范式。
AI安全
OpenClaw
ClawKeeper
eBPF
智能体
安全框架
OpenScreen深度解析:GitHub 2万+ Stars的开源录屏神器,如何用Electron + PixiJS重塑开发者内容创作体验
编程
OpenScreen深度解析:GitHub 2万+ Stars的开源录屏神器,如何用Electron + PixiJS重塑开发者内容创作体验
2026-04-17 17:47:56 +0800 CST
view 468
深度解析GitHub爆火开源录屏工具OpenScreen的技术架构,涵盖Electron跨平台采集、PixiJS WebGL实时渲染、MediaRecorder录制管线、FFmpeg导出优化等核心技术的工程实践。
Electron
PixiJS
开源
录屏工具
TypeScript
React
OpenScreen
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
42
下一页