程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
VibeVoice 深度解析:当微软把60分钟语音识别压缩进一颗 GPU
编程
VibeVoice 深度解析:当微软把60分钟语音识别压缩进一颗 GPU
2026-04-11 08:44:54 +0800 CST
view 233
VibeVoice 是微软2026年开源的前沿语音AI框架,支持60分钟长音频单次转录、90分钟多说话人语音合成、300ms首字延迟的实时流式TTS,是目前最强大的开源语音AI解决方案。
语音AI
ASR
TTS
开源项目
微软
人工智能
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
编程
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
2026-04-20 22:53:28 +0800 CST
view 362
复旦大学OpenMOSS团队开源的0.1B参数多语言TTS模型,纯CPU运行、支持零样本语音克隆、48kHz双声道、20种语言、流式推理,MacBook Air单核即可流畅运行
TTS
语音合成
语音克隆
AI
开源
CPU推理
OpenMOSS
VibeVoice深度解析:微软如何用7.5Hz超低帧率Tokenizer突破语音AI的「超长上下文」困境
编程
VibeVoice深度解析:微软如何用7.5Hz超低帧率Tokenizer突破语音AI的「超长上下文」困境
2026-04-12 14:25:53 +0800 CST
view 265
深入解析微软VibeVoice开源语音AI框架,探讨其7.5Hz超低帧率Tokenizer、LLM+Diffusion混合架构如何突破60分钟ASR和90分钟TTS的长上下文困境,附完整工程实践代码。
语音AI
ASR
TTS
VibeVoice
微软
开源
深度学习
VibeVoice 深度解析:微软开源语音AI的架构革命,7.5Hz帧率如何重塑长音频处理范式
编程
VibeVoice 深度解析:微软开源语音AI的架构革命,7.5Hz帧率如何重塑长音频处理范式
2026-04-22 01:51:38 +0800 CST
view 100
微软开源VibeVoice语音AI模型家族深度解析,7.5Hz超低帧率连续语音Tokenizer、Next-Token Diffusion架构、ASR长音频识别、TTS多说话人合成、实时流式语音生成,附完整代码实战与生产部署指南
VibeVoice
语音AI
ASR
TTS
微软开源
扩散模型
VibeVoice 深度解析:微软如何用双分词器与扩散解码器重新定义语音AI的天花板
编程
VibeVoice 深度解析:微软如何用双分词器与扩散解码器重新定义语音AI的天花板
2026-04-14 11:25:32 +0800 CST
view 195
深度解析微软开源的 VibeVoice 语音 AI 框架,涵盖双分词器架构、σ-VAE 声学分词器、语义分词器、扩散解码器、长序列建模等核心技术,配完整代码示例和本地部署教程。
VibeVoice
微软
语音AI
TTS
ASR
扩散模型
tokenizer
开源
告别笨重 CAD:Claude 写出来的 3D 建筑编辑器,浏览器打开就能用
资讯
告别笨重 CAD:Claude 写出来的 3D 建筑编辑器,浏览器打开就能用
2026-04-24 07:27:07 +0800 CST
view 126
PascalEditor是一款由ClaudeAI参与开发的WebGPU3D建筑编辑器,开源免费、浏览器直接运行、性能流畅。本文深入分析其技术架构(WebGPU、ReactThreeFiber、脏节点追踪、Monorepo分层设计)、核心特性(零门槛免安装、完全免费开源、AI参与开发)、与主流工具(酷家乐、SketchUp、AutoCAD/Revit)的对比,以及它所代表的AI编程新范式。适合装修房主、设计师、前端开发者及创业团队使用。
WebGPU
ReactThreeFiber
AI编程
开源3D工具
Claude
前端图形学
建筑可视化
MIT协议
3D编辑器
浏览器应用
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 194
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
编程
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
2026-04-15 22:19:22 +0800 CST
view 151
深度解析微软VibeVoice开源语音AI全家桶:7.5Hz连续Tokenizer如何压缩60分钟音频,Next-Token Diffusion如何驱动90分钟对话合成,附完整代码实战与性能对比。
VibeVoice
微软
语音AI
ASR
TTS
Diffusion
LLM
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
编程
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
2026-04-25 08:17:20 +0800 CST
view 188
MOSS-TTS-Nano 是模思智能和OpenMOSS团队开源的0.1B参数超小语音合成模型,支持纯CPU推理、ONNX加速、20种语言、零样本语音克隆、流式输出48kHz立体声,还有浏览器插件可直接在Chrome中使用。
AI
开源
语音合成
TTS
MOSS
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率重塑语音 AI——从 ASR 到实时 TTS 的全栈技术内幕
编程
VibeVoice 深度解析:微软如何用 7.5Hz 超低帧率重塑语音 AI——从 ASR 到实时 TTS 的全栈技术内幕
2026-04-17 10:48:42 +0800 CST
view 237
深入解析微软开源的 VibeVoice 语音 AI 框架,涵盖 7.5Hz 超低帧率连续 tokenizer、Next-Token Diffusion 架构、三大模型(ASR/TTS/Realtime)全栈设计,以及生产环境部署与性能优化实践。
语音AI
VibeVoice
微软
TTS
ASR
深度学习
开源
微软开源 VibeVoice:60分钟长音频转录、实时TTS,这个语音AI全家桶有点猛
编程
微软开源 VibeVoice:60分钟长音频转录、实时TTS,这个语音AI全家桶有点猛
2026-04-08 11:36:14 +0800 CST
view 273
微软开源的 VibeVoice 语音 AI 全家桶,集 ASR 和 TTS 能力于一身,支持 60 分钟长音频转录、90 分钟多说话人音频生成、300ms 实时 TTS。本文深入解析其技术架构与实测代码。
TTS
ASR
语音AI
微软
VibeVoice
开源项目
VibeVoice 深度解析:微软如何用 7.5Hz 连续语音分词器重新定义语音 AI 的边界
编程
VibeVoice 深度解析:微软如何用 7.5Hz 连续语音分词器重新定义语音 AI 的边界
2026-04-18 07:48:59 +0800 CST
view 129
微软开源的 VibeVoice 用 7.5Hz 连续语音分词器和 Next-token Diffusion 框架,实现了 60 分钟长音频单次处理,正在重新定义语音 AI 的技术边界。本文深度解析其架构设计、工程实践和部署优化。
VibeVoice
语音AI
ASR
TTS
微软开源
Next-token Diffusion
连续语音分词器
ICLR 2026
Whisper替代
长音频处理
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
编程
NeuTTS Air:0.5B参数超拟真语音合成,3秒音频克隆你的声音
2026-04-28 12:43:51 +0800 CST
view 46
NVIDIA开源NeuTTS Air——0.5B参数超拟真语音合成模型,仅需3秒音频即可完成声音克隆,可在手机、笔记本甚至树莓派上本地运行,完全保护隐私,无需联网。
AI
TTS
声音克隆
本地部署
NVIDIA
语音合成
边缘计算
Playwright Test Agents深度解析:三个AI Agent帮你全自动写测试
编程
Playwright Test Agents深度解析:三个AI Agent帮你全自动写测试
2026-04-28 16:25:24 +0800 CST
view 107
Playwright官方推出Test Agents,三个AI Agent接力:Planner探索应用生成测试计划、Generator转代码、Healer自动修复失败测试,全程自动化。
Playwright
AI
测试
自动化
Agent
HTML5的 input:file上传类型控制
编程
HTML5的 input:file上传类型控制
2024-11-19 07:29:28 +0800 CST
view 2801
本文介绍了HTML中input:file属性的使用,包括accept和multiple属性的具体应用,以及常用的MIME类型列表。同时,文中详细说明了如何使用AJAX上传文件,包括获取文件列表、构建表单数据和发送POST请求的步骤,最后展示了服务器端接收文件的示例。
HTML
文件上传
AJAX
前端开发
Web技术
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
编程
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
2026-04-28 21:16:14 +0800 CST
view 47
深度解析 GitHub 19K Star 的 RAG-Anything 多模态 RAG 框架:All-in-One 架构设计、MinerU 文档解析、多模态知识图谱、向量-图谱融合检索,完整覆盖从原理到生产部署的技术细节。
RAG
多模态
知识图谱
LightRAG
MinerU
AI
向量检索
文档处理
Agent Lightning 深度解析:当微软说「零代码改动」就能让 AI Agent 持续进化
编程
Agent Lightning 深度解析:当微软说「零代码改动」就能让 AI Agent 持续进化
2026-04-10 06:32:45 +0800 CST
view 185
微软开源的 Agent Lightning 框架深度解析:零代码改动让 AI Agent 持续进化,支持强化学习、提示优化、监督微调,兼容 LangChain、AutoGen、CrewAI 等所有主流框架。
AI Agent
强化学习
微软
开源
Agent Lightning
机器学习
html一些比较人使用的技巧和代码
编程
html一些比较人使用的技巧和代码
2024-11-17 05:05:01 +0800 CST
view 2825
本文介绍了一系列JavaScript和HTML代码片段,用于增强网页的安全性和用户体验,包括禁止右键、复制、粘贴等功能,防止网页被框架化和缓存,以及自定义表单样式和图标等。通过这些代码,开发者可以有效地控制用户对网页的操作,保护内容不被随意复制或修改。
网页安全
JavaScript
HTML
编程
10个几乎无人使用的罕见HTML标签
2024-11-18 21:44:46 +0800 CST
view 1273
本文介绍了10个罕见的HTML标签,这些标签在开发中很少被使用。包括`<abbr>`用于缩写,`<q>`用于引用,`<s>`用于删除线,`<mark>`用于高亮,`<wbr>`用于文本换行,`<details>`用于可展开内容,`<optgroup>`用于下拉列表分组,`<datalist>`用于自动完成,`<fieldset>`用于表单分组,以及`<sup>`和`<sub>`用于上标和下标。
HTML
Web开发
前端技术
一行代码搞定图片懒加载!浏览器原生 `loading="lazy"` 全面指南
编程
一行代码搞定图片懒加载!浏览器原生 `loading="lazy"` 全面指南
2025-08-15 11:54:15 +0800 CST
view 1789
本文介绍了浏览器原生的图片懒加载功能,通过使用HTML属性loading=\"lazy\",开发者可以轻松实现高效的懒加载,提升网页性能,减少流量消耗。与传统的JavaScript懒加载相比,原生支持的实现更简单,性能开销更低,同时提供了最佳实践和使用注意事项,以确保良好的用户体验。
懒加载
前端开发
网页性能
JavaScript
html
window.open彻底过时了!浏览器全新Popover API发布,零依赖、无拦截、样式自由
编程
window.open彻底过时了!浏览器全新Popover API发布,零依赖、无拦截、样式自由
2026-04-21 08:52:41 +0800 CST
view 103
浏览器原生Popover API正式发布,零依赖、无拦截风险、样式完全可控、支持自动/手动两种模式,window.open的完美替代方案
前端
JavaScript
HTML5
CSS
Popover API
Browser API
Web开发
编程
自定义input文件上传 file的提示文字及样式
2024-11-17 05:01:13 +0800 CST
view 4874
该文本包含一个用于选择和上传文件的HTML和JavaScript代码示例。用户可以通过点击链接选择文件,选择后文件名会显示在页面上,并通过AJAX将文件上传到指定的URL。代码中使用了FormData对象来处理文件上传,并在成功后将返回的链接填入指定的输入框中。
前端开发
文件上传
JavaScript
HTML
AJAX
代码
一个登录注册界面的HTML结构和样式
2024-11-17 20:33:23 +0800 CST
view 1368
该文本描述了一个登录注册界面的HTML结构和样式。界面包括登录和注册两个部分,用户可以输入邮箱和密码进行登录或注册。界面设计使用了CSS进行样式设置,并通过JavaScript实现了登录和注册之间的切换功能。整体布局采用了Flexbox,确保了良好的响应式设计。
前端开发
网页设计
用户界面
HTML
CSS
JavaScript
每个开发人员都应该知道的 10 个 HTML 技巧
编程
每个开发人员都应该知道的 10 个 HTML 技巧
2024-11-18 15:27:51 +0800 CST
view 1368
本文探讨了每个开发人员都应该了解的10个基本HTML技巧,包括使用语义HTML、响应式图像、data-*数据属性、内联SVG、自动对焦属性等。这些技巧旨在提高代码的可读性、可访问性和用户体验,帮助开发人员编写更高效的网页。
Web开发
前端技术
HTML技巧
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
下一页