程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
VibeVoice 深度解析:微软如何用双分词器与扩散解码器重新定义语音AI的天花板
编程
VibeVoice 深度解析:微软如何用双分词器与扩散解码器重新定义语音AI的天花板
2026-04-14 11:25:32 +0800 CST
view 357
深度解析微软开源的 VibeVoice 语音 AI 框架,涵盖双分词器架构、σ-VAE 声学分词器、语义分词器、扩散解码器、长序列建模等核心技术,配完整代码示例和本地部署教程。
VibeVoice
微软
语音AI
TTS
ASR
扩散模型
tokenizer
开源
VibeVoice 深度解析:微软开源语音 AI 全家桶,90 分钟长语音合成 + 60 分钟语音识别
编程
VibeVoice 深度解析:微软开源语音 AI 全家桶,90 分钟长语音合成 + 60 分钟语音识别
2026-05-13 22:42:48 +0800 CST
view 187
VibeVoice是微软研究院开源的语音AI全家桶,TTS支持90分钟长语音合成、ASR支持60分钟语音识别、实时TTS 300ms首包延迟。本文深度解析其7.5Hz超低帧率、全局韵律编码、多说话人统一建模架构及完整部署实战。
VibeVoice,微软,语音AI,TTS,ASR,实时语音合成
Coasts 深度实战:为 Git 工作区打造的主机服务隔离与编排工具——让 AI 智能体安全运行在主系统之外
编程
Coasts 深度实战:为 Git 工作区打造的主机服务隔离与编排工具——让 AI 智能体安全运行在主系统之外
2026-05-06 09:02:52 +0800 CST
view 181
Coasts 是为 Git 工作区打造的轻量级隔离工具,解决 AI 智能体主机权限过大的安全风险,提供容器化环境与服务编排能力
AI智能体
Git工作区
容器隔离
Coasts
DevOps
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
编程
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
2026-04-15 22:19:22 +0800 CST
view 316
深度解析微软VibeVoice开源语音AI全家桶:7.5Hz连续Tokenizer如何压缩60分钟音频,Next-Token Diffusion如何驱动90分钟对话合成,附完整代码实战与性能对比。
VibeVoice
微软
语音AI
ASR
TTS
Diffusion
LLM
VibeVoice 深度实战:微软开源的 33K Star 语音AI全家桶——从架构设计到生产部署的全链路解析
编程
VibeVoice 深度实战:微软开源的 33K Star 语音AI全家桶——从架构设计到生产部署的全链路解析
2026-05-06 13:01:56 +0800 CST
view 523
微软开源 VibeVoice 语音AI框架深度解析,33K Star,单次处理60分钟ASR、90分钟TTS、300ms实时生成。
VibeVoice
语音AI
微软
开源
TTS
ASR
实时语音
OmniVoice Studio:5k Star开源声音克隆工具,646种语言,无GPU也能跑
编程
OmniVoice Studio:5k Star开源声音克隆工具,646种语言,无GPU也能跑
2026-05-28 20:50:27 +0800 CST
view 90
OmniVoice Studio是5k Star全本地运行ElevenLabs开源替代方案,支持零样本声音克隆、646种语言、无GPU也能跑(最低4GB内存),跨平台桌面客户端,支持MCP。
声音克隆
开源
TTS
AI音频
OmniVoice
语音合成
多语言
CosyVoice
MCP
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
编程
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
2026-04-25 08:17:20 +0800 CST
view 669
MOSS-TTS-Nano 是模思智能和OpenMOSS团队开源的0.1B参数超小语音合成模型,支持纯CPU推理、ONNX加速、20种语言、零样本语音克隆、流式输出48kHz立体声,还有浏览器插件可直接在Chrome中使用。
AI
开源
语音合成
TTS
MOSS
MySQL 9.7.0 LTS 深度解析:向量检索、JOIN 性能飞跃、AI 与云原生时代的数据库新标杆
编程
MySQL 9.7.0 LTS 深度解析:向量检索、JOIN 性能飞跃、AI 与云原生时代的数据库新标杆
2026-05-14 14:43:35 +0800 CST
view 228
MySQL 9.7.0 LTS于2026年4月21日发布,8年支持周期。原生向量检索支持RAG架构、多表JOIN性能提升3-5倍、JavaScript/Python存储过程、JSON增强查询、HeatWave内存加速。完整迁移指南与性能基准测试对比。
MySQL
数据库
向量检索
RAG
LTS
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率重塑语音 AI——从 ASR 到实时 TTS 的全栈技术内幕
编程
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率重塑语音 AI——从 ASR 到实时 TTS 的全栈技术内幕
2026-04-17 10:48:42 +0800 CST
view 438
深入解析微软开源的 VibeVoice 语音 AI 框架,涵盖 7.5Hz 超低帧率连续 tokenizer、Next-Token Diffusion 架构、三大模型(ASR/TTS/Realtime)全栈设计,以及生产环境部署与性能优化实践。
语音AI
VibeVoice
微软
TTS
ASR
深度学习
开源
微软开源 VibeVoice:60分钟长音频转录、实时TTS,这个语音AI全家桶有点猛
编程
微软开源 VibeVoice:60分钟长音频转录、实时TTS,这个语音AI全家桶有点猛
2026-04-08 11:36:14 +0800 CST
view 445
微软开源的 VibeVoice 语音 AI 全家桶,集 ASR 和 TTS 能力于一身,支持 60 分钟长音频转录、90 分钟多说话人音频生成、300ms 实时 TTS。本文深入解析其技术架构与实测代码。
TTS
ASR
语音AI
微软
VibeVoice
开源项目
MySQL 8.4 LTS 深度实战:8年超长支持周期的数据库新标准——从架构变革到生产级部署的全链路解析
编程
MySQL 8.4 LTS 深度实战:8年超长支持周期的数据库新标准——从架构变革到生产级部署的全链路解析
2026-05-08 10:40:39 +0800 CST
view 296
深度剖析 MySQL 8.4 LTS 的架构变革、MGR 一致性模型、废弃特性、性能优化与升级迁移实战,覆盖 8 年超长支持周期的数据库新标准
MySQL
Database
LTS
DBA
InnoDB
VibeVoice 深度解析:微软如何用 7.5Hz 连续语音分词器重新定义语音 AI 的边界
编程
VibeVoice 深度解析:微软如何用 7.5Hz 连续语音分词器重新定义语音 AI 的边界
2026-04-18 07:48:59 +0800 CST
view 251
微软开源的 VibeVoice 用 7.5Hz 连续语音分词器和 Next-token Diffusion 框架,实现了 60 分钟长音频单次处理,正在重新定义语音 AI 的技术边界。本文深度解析其架构设计、工程实践和部署优化。
VibeVoice
语音AI
ASR
TTS
微软开源
Next-token Diffusion
连续语音分词器
ICLR 2026
Whisper替代
长音频处理
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
编程
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
2026-04-28 12:43:51 +0800 CST
view 211
NVIDIA开源NeuTTS Air——0.5B参数超拟真语音合成模型,仅需3秒音频即可完成声音克隆,可在手机、笔记本甚至树莓派上本地运行,完全保护隐私,无需联网。
AI
TTS
声音克隆
本地部署
NVIDIA
语音合成
边缘计算
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
编程
OpenScreen 深度解析:当开源撕掉屏幕录制的高价标签,开发者终于不用再被 Screen Studio 收割
2026-04-10 02:23:58 +0800 CST
view 568
深入解析OpenScreen:26K Stars的GitHub开源录屏工具,用Electron+FFmpeg技术栈复现Screen Studio全部核心功能,包括自动缩放、运动模糊、背景虚化等。跨平台支持macOS/Windows/Linux,完全免费开源。
OpenScreen
Screen Studio
Electron
FFmpeg
开源录屏
桌面应用
TypeScript
DeerFlow 2.0 深度实战:字节跳动开源 Super Agent 框架——从架构原理到生产级多智能体协作的完整指南
编程
DeerFlow 2.0 深度实战:字节跳动开源 Super Agent 框架——从架构原理到生产级多智能体协作的完整指南
2026-05-21 18:19:52 +0800 CST
view 107
30天斩获4.9万Star,MIT协议完全开源。深度解析DeerFlow 2.0的Lead Agent + Sub-Agents架构、沙箱执行环境、任务拆解算法,以及与LangChain/AutoGPT的本质差异。
AI Agent
Super Agent
DeerFlow
字节跳动
多智能体协作
Agent框架
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 575
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
DeerFlow深度解析:字节跳动如何用"Harness架构"重新定义AI Agent执行系统
编程
DeerFlow深度解析:字节跳动如何用"Harness架构"重新定义AI Agent执行系统
2026-04-28 15:20:25 +0800 CST
view 303
深度解析字节跳动开源的超级Agent框架DeerFlow,从Harness架构设计到Memory持久化、沙箱隔离、技能系统等核心技术实现,附完整代码实战和生产部署指南。
DeerFlow
AI Agent
字节跳动
SuperAgent
多智能体
DeerFlow 2.0 深度实战:字节跳动开源 Super Agent Harness——从 LangGraph 多智能体编排到 18 层中间件责任链的完全指南(2026)
编程
DeerFlow 2.0 深度实战:字节跳动开源 Super Agent Harness——从 LangGraph 多智能体编排到 18 层中间件责任链的完全指南(2026)
2026-06-01 17:52:37 +0800 CST
view 20
2026年2月字节跳动开源 DeerFlow 2.0,从深度研究框架进化为 Super Agent 运行时基础设施。本文深度拆解其四层微服务架构、多智能体协作模型、18层中间件责任链设计,并提供完整的代码实战与生产级部署指南。
DeerFlow
字节跳动
Super Agent
LangGraph
AI Agent
DeerFlow 2.0 技术完全指南:字节跳动开源 Super Agent 运行时——Multi-Agent 编排、沙盒执行与 18 层中间件架构深度实战(2026)
编程
DeerFlow 2.0 技术完全指南:字节跳动开源 Super Agent 运行时——Multi-Agent 编排、沙盒执行与 18 层中间件架构深度实战(2026)
2026-06-01 17:53:38 +0800 CST
view 21
2026年2月字节跳动开源 DeerFlow 2.0,从深度研究框架进化为 Super Agent 运行时基础设施。本文深度拆解其四层微服务架构、多智能体协作模型、18层中间件责任链设计,并提供完整的代码实战与生产级部署指南。
DeerFlow
字节跳动
Super Agent
LangGraph
AI Agent
DeerFlow 2.0 深度实战:从 LangGraph 重构到 Super Agent Harness——字节跳动开源超级智能体框架的架构设计与生产级实践
编程
DeerFlow 2.0 深度实战:从 LangGraph 重构到 Super Agent Harness——字节跳动开源超级智能体框架的架构设计与生产级实践
2026-05-22 21:18:30 +0800 CST
view 154
DeerFlow 2.0 是字节跳动开源的超级智能体框架,基于 LangGraph 1.0 重构,30天斩获近5万Star。本文深入解析其 Super Agent Harness 架构、Lead+Sub-Agent 协作模型、Docker Sandbox 安全执行环境、三层记忆系统,以及与 LangChain/CrewAI 的深度对比。
AI Agent
DeerFlow
LangGraph
字节跳动
Super Agent框架
编程
DeerFlow 深度实战:字节跳动超级智能体运行时——从 LangGraph 编排到 Docker 沙箱执行的生产级完全指南
2026-05-23 12:46:13 +0800 CST
view 178
DeerFlow 2.0 是字节跳动开源的超级智能体运行时,30天近5万Star。本文深入拆解其 Lead Agent + Sub-Agents 架构、Docker沙箱执行、技能系统、上下文管理等核心技术,并通过竞品分析实战案例展示完整工作流程。
DeerFlow
AI Agent
字节跳动
LangGraph
Docker
智能体
Agent框架
生产级
DeerFlow 2.0 深度实战:从"半途而废"到"真正干活"——字节跳动开源超级 Agent Harness 完全指南(2026)
编程
DeerFlow 2.0 深度实战:从"半途而废"到"真正干活"——字节跳动开源超级 Agent Harness 完全指南(2026)
2026-05-24 06:02:50 +0800 CST
view 167
DeerFlow 2.0 是字节跳动开源的超级 Agent 框架,提供沙箱执行、持久化记忆、多 Agent 编排等生产级能力。本文深入剖析其架构设计、三层沙箱机制、记忆系统和实战案例。
AI Agent
DeerFlow
字节跳动
LangGraph
多Agent编排
DeerFlow 2.0 深度解析:从 Deep Research 到超级智能体运行时,52K Star 背后的架构设计与工程实践
编程
DeerFlow 2.0 深度解析:从 Deep Research 到超级智能体运行时,52K Star 背后的架构设计与工程实践
2026-04-23 01:10:34 +0800 CST
view 641
深度解析字节跳动开源的 DeerFlow 2.0 超级智能体框架:Lead Agent + Middleware Chain + Sub-Agents 架构设计、Docker 沙箱执行、三层记忆系统、Markdown 技能扩展、Context Engineering 上下文工程,以及完整部署实战与性能调优指南。
DeerFlow
AI Agent
LangGraph
字节跳动
开源
Docker Sandbox
Sub-Agent
长期记忆
DeerFlow 深度解析:字节跳动开源超级智能体运行时——从架构设计到生产级 Multi-Agent 编排的完整技术内幕
编程
DeerFlow 深度解析:字节跳动开源超级智能体运行时——从架构设计到生产级 Multi-Agent 编排的完整技术内幕
2026-05-18 09:43:33 +0800 CST
view 146
深入解析字节跳动开源的 DeerFlow 超级智能体运行时框架,从核心架构、执行引擎、Multi-Agent 编排到生产级部署,完整呈现这一 GitHub Trending 榜首项目的技术内幕。
AI Agent
DeerFlow
字节跳动
Multi-Agent
开源项目
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
43
下一页