程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率重塑语音 AI——从 ASR 到实时 TTS 的全栈技术内幕
编程
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率重塑语音 AI——从 ASR 到实时 TTS 的全栈技术内幕
2026-04-17 10:48:42 +0800 CST
view 438
深入解析微软开源的 VibeVoice 语音 AI 框架,涵盖 7.5Hz 超低帧率连续 tokenizer、Next-Token Diffusion 架构、三大模型(ASR/TTS/Realtime)全栈设计,以及生产环境部署与性能优化实践。
语音AI
VibeVoice
微软
TTS
ASR
深度学习
开源
微软开源 VibeVoice:60分钟长音频转录、实时TTS,这个语音AI全家桶有点猛
编程
微软开源 VibeVoice:60分钟长音频转录、实时TTS,这个语音AI全家桶有点猛
2026-04-08 11:36:14 +0800 CST
view 445
微软开源的 VibeVoice 语音 AI 全家桶,集 ASR 和 TTS 能力于一身,支持 60 分钟长音频转录、90 分钟多说话人音频生成、300ms 实时 TTS。本文深入解析其技术架构与实测代码。
TTS
ASR
语音AI
微软
VibeVoice
开源项目
Microsoft Agent-Lightning 深度实战:零代码优化AI代理的训练框架——微软RL训练的革命性工具与生产级实践
编程
Microsoft Agent-Lightning 深度实战:零代码优化AI代理的训练框架——微软RL训练的革命性工具与生产级实践
2026-05-22 21:46:03 +0800 CST
view 106
深度解析微软Agent-Lightning框架,实现零代码修改的AI Agent强化学习训练,解耦架构设计与生产实践
AI Agent
强化学习
微软
RL训练
Agent-Lightning
Agent-Lightning 深度实战:微软开源RL训练框架——零代码优化任意AI代理的生产级实践
编程
Agent-Lightning 深度实战:微软开源RL训练框架——零代码优化任意AI代理的生产级实践
2026-05-22 21:46:28 +0800 CST
view 117
深度解析微软Agent-Lightning框架,实现零代码修改的AI Agent强化学习训练,解耦架构设计与生产实践
AI Agent
强化学习
微软
RL训练
Agent-Lightning
微软 VibeVoice 深度实战:从 7.5Hz 超低帧率到 90 分钟长音频合成——下一代语音 AI 的架构革命与生产级实践
编程
微软 VibeVoice 深度实战:从 7.5Hz 超低帧率到 90 分钟长音频合成——下一代语音 AI 的架构革命与生产级实践
2026-05-23 01:45:11 +0800 CST
view 161
深度解析微软开源语音AI模型VibeVoice,涵盖7.5Hz超低帧率、90分钟长音频合成、300ms实时流式等核心技术
语音AI
VibeVoice
微软
TTS
ASR
深度学习
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
编程
MarkItDown 深度解析:微软如何用一行命令解决 LLM 文档处理的世纪难题
2026-04-19 17:14:36 +0800 CST
view 406
深度解析微软开源工具 MarkItDown,10.8万星GitHub热门项目,解决 LLM 文档处理的世纪难题。支持20+格式一键转Markdown,MCP协议与AI工具深度集成。
MarkItDown
Markdown
Python
微软
LLM
MCP
RAG
文档处理
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 174
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
微软 Agent Governance Toolkit 深度解析:当 AI Agent 安全治理进入「操作系统级」时代
编程
微软 Agent Governance Toolkit 深度解析:当 AI Agent 安全治理进入「操作系统级」时代
2026-04-12 11:55:53 +0800 CST
view 548
微软 Agent Governance Toolkit 开源项目深度解析,从 OWASP Top 10 到七大组件架构,详解如何用操作系统级思维解决 AI Agent 安全治理问题,包含提示词注入防护、工具滥用防护、级联故障防护等核心安全机制的代码实现。
AI Agent
安全治理
微软
OWASP
企业级
MarkItDown 深度解析:微软如何用一款工具重塑 RAG 文档处理管线
编程
MarkItDown 深度解析:微软如何用一款工具重塑 RAG 文档处理管线
2026-04-13 12:25:55 +0800 CST
view 653
微软开源的 MarkItDown 如何统一 PDF、Word、Excel、PPT 等格式转换为 Markdown,成为 RAG 数据预处理的事实标准。
RAG
Python
文档处理
Markdown
微软
OpenAI
LLM
BitNet b1.58 深度解析:微软如何用1.58位量化颠覆大模型推理范式
编程
BitNet b1.58 深度解析:微软如何用1.58位量化颠覆大模型推理范式
2026-04-23 19:09:57 +0800 CST
view 304
深度解析微软开源的BitNet b1.58 2B4T模型,从1.58位三值量化原理、架构设计、性能对比到部署实战,全面剖析这个仅需0.4GB内存、在普通CPU上流畅运行的革命性大语言模型。
BitNet
量化
大模型
微软
CPU推理
边缘计算
VibeVoice 深度解析:微软开源语音 AI 全家桶,90 分钟长语音合成 + 60 分钟语音识别
编程
VibeVoice 深度解析:微软开源语音 AI 全家桶,90 分钟长语音合成 + 60 分钟语音识别
2026-05-13 22:42:48 +0800 CST
view 187
VibeVoice是微软研究院开源的语音AI全家桶,TTS支持90分钟长语音合成、ASR支持60分钟语音识别、实时TTS 300ms首包延迟。本文深度解析其7.5Hz超低帧率、全局韵律编码、多说话人统一建模架构及完整部署实战。
VibeVoice,微软,语音AI,TTS,ASR,实时语音合成
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
编程
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
2026-04-15 22:19:22 +0800 CST
view 316
深度解析微软VibeVoice开源语音AI全家桶:7.5Hz连续Tokenizer如何压缩60分钟音频,Next-Token Diffusion如何驱动90分钟对话合成,附完整代码实战与性能对比。
VibeVoice
微软
语音AI
ASR
TTS
Diffusion
LLM
BitNet 深度实战:微软 32K Star 的 1-bit LLM 推理框架——从三值量化原理到 CPU 原生推理的全链路架构解析
编程
BitNet 深度实战:微软 32K Star 的 1-bit LLM 推理框架——从三值量化原理到 CPU 原生推理的全链路架构解析
2026-05-07 03:35:48 +0800 CST
view 231
深度解析微软 BitNet 1-bit LLM 推理框架,从三值量化数学原理到 bitnet.cpp 内核优化,再到 CPU 原生推理实战部署的全链路架构解析
BitNet
1-bit LLM
量化
CPU推理
微软
TypeScript 7.0 Beta深度解析:微软用Go重写编译器,10倍性能跃迁背后的技术革命
编程
TypeScript 7.0 Beta深度解析:微软用Go重写编译器,10倍性能跃迁背后的技术革命
2026-04-26 16:41:24 +0800 CST
view 465
深度解析微软TypeScript 7.0 Beta:用Go重写编译器实现10倍性能提升,剖析技术决策、架构设计与性能优化原理
TypeScript
Go
编译器
性能优化
微软
TypeScript Native Port 深度解析:微软用 Go 重写编译器,性能提升 10 倍背后的工程哲学
编程
TypeScript Native Port 深度解析:微软用 Go 重写编译器,性能提升 10 倍背后的工程哲学
2026-04-27 16:51:14 +0800 CST
view 245
微软用 Go 重写 TypeScript 编译器,性能提升 10 倍。本文深度解析 Corsa 架构设计、性能优化原理和迁移实践。
TypeScript
Go
编译器
前端工程化
微软
微软 Agent Lightning 深度实战:从零构建可进化的 AI Agent——强化学习训练框架的技术架构与生产级实践
编程
微软 Agent Lightning 深度实战:从零构建可进化的 AI Agent——强化学习训练框架的技术架构与生产级实践
2026-05-22 09:48:50 +0800 CST
view 112
微软开源的Agent Lightning框架深度解析:零代码变更即可对LangChain、AutoGen、CrewAI等主流Agent框架进行强化学习训练,支持PPO、自动Prompt优化和分布式训练
Agent Lightning
强化学习
AI Agent
LangChain
微软
MCP
RL
开源项目的「反AI赌局」:Zig的Contributor Poker哲学如何重新定义代码贡献的价值
编程
开源项目的「反AI赌局」:Zig的Contributor Poker哲学如何重新定义代码贡献的价值
2026-06-02 10:27:11 +0800 CST
view 3
Zig语言宣布全面禁止AI辅助贡献,其背后的Contributor Poker哲学重新定义了开源项目的核心价值——投资人而不是投资代码
Zig
开源
AI编程
Contributor Poker
代码贡献
开源治理
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 384
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
Pgrx 深度解析:用 Rust 为 PostgreSQL 打造高性能扩展——从入门到生产级实战
编程
Pgrx 深度解析:用 Rust 为 PostgreSQL 打造高性能扩展——从入门到生产级实战
2026-04-28 14:24:36 +0800 CST
view 227
深度解析 Pgrx(4.5k+ Stars)框架:用 Rust 为 PostgreSQL 编写高性能扩展,涵盖类型映射、内存管理、代码实战与生产部署完整指南。
Rust
PostgreSQL
数据库扩展
高性能
开源
系统编程
Pgrx
Claw Code 深度解析:当韩国开发者用 Rust 重写 Claude Code,GitHub 史上最快 5 万星项目诞生
编程
Claw Code 深度解析:当韩国开发者用 Rust 重写 Claude Code,GitHub 史上最快 5 万星项目诞生
2026-04-09 06:04:37 +0800 CST
view 704
韩国开发者用 Rust 重写 Claude Code,claw-code 项目 2 小时破 5 万星,创下 GitHub 史上最快增速纪录。深度解析其 Python+Rust 混合架构、净室重写工程实践和 Agent Harness 设计理念。
Rust
AI编程
开源项目
Claude Code
Agent Harness
净室重写
从OpenClaw到Hermes Agent:两款爆火开源AI Agent的对决与深层技术哲学
编程
从OpenClaw到Hermes Agent:两款爆火开源AI Agent的对决与深层技术哲学
2026-04-18 16:15:01 +0800 CST
view 295
深度解析OpenClaw与Hermes Agent的功能差异与底层架构:Skill体系谁按下启动键、记忆系统谁在替谁记事、上下文管理的确定性优先哲学,以及两者背后的干预递减光谱与自动化控制权之争。
AI Agent
OpenClaw
Hermes
NousResearch
Skill系统
记忆系统
自进化
GitHub
开源
技术哲学
GitHub 22k Star 的 Beads:如何用 Dolt 给 AI Agent 装上一个永久记忆大脑
编程
GitHub 22k Star 的 Beads:如何用 Dolt 给 AI Agent 装上一个永久记忆大脑
2026-04-28 14:54:44 +0800 CST
view 289
深度解析 GitHub 22.3k Star 的 Beads 项目:用 Dolt 版本控制数据库为 AI coding agent 构建持久化记忆系统,覆盖架构设计、Dolt 分支模型、代码实战与生产部署指南。
AI编程
Dolt
Agent
GitHub开源
版本控制
SQL数据库
编程工具
长任务追踪
Pathway 深度解析:Python ETL 框架的流式处理革命 —— 用 Rust 引擎吊打 Flink/Spark,构建实时 LLM Pipeline
编程
Pathway 深度解析:Python ETL 框架的流式处理革命 —— 用 Rust 引擎吊打 Flink/Spark,构建实时 LLM Pipeline
2026-05-16 03:46:12 +0800 CST
view 166
55K+ Star,基于 Differential Dataflow 的 Rust 引擎,增量计算,内存计算,无缝集成 Python ML 生态——Pathway 正在重新定义实时流处理与 LLM Pipeline 的边界。
Python
流处理
实时分析
LLM
RAG
Pathway
ETL
开源项目
GitHub Trending
10个优秀的开源无头浏览器—自动化测试、爬虫、RPA 操作利器
综合
10个优秀的开源无头浏览器—自动化测试、爬虫、RPA 操作利器
2024-11-19 09:36:25 +0800 CST
view 2404
无头浏览器是一种没有图形用户界面的Web浏览器,能够在后台执行任务,广泛应用于自动化测试、网络爬虫和数据抓取。它通过编程接口支持控制,提升测试效率并节省资源。主流工具包括Puppeteer、Selenium、Playwright等,适合在CI/CD流程中使用,但可能无法完全模拟真实用户体验。
开源工具
自动化
Web技术
测试
爬虫
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
23
下一页