程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
前端录屏黑科技:几行 JS 代码实现网页录屏
编程
前端录屏黑科技:几行 JS 代码实现网页录屏
2025-08-15 15:19:33 +0800 CST
view 937
本文介绍了如何使用MediaRecorderAPI和原生JavaScript实现网页录屏功能。通过简单的几行代码,开发者可以获取用户屏幕流并进行录制,支持音视频捕获。文章详细说明了获取媒体流、创建MediaRecorder实例、开始和停止录制的步骤,并提供了注意事项和最佳实践,强调了浏览器兼容性和用户授权的重要性。
前端开发
Web技术
编程
视频处理
AI 直播工具:Deep Live Cam 实时换脸效果超乎想象!附安装教程
综合
AI 直播工具:Deep Live Cam 实时换脸效果超乎想象!附安装教程
2024-11-19 08:13:10 +0800 CST
view 4501
DeepLiveCam是一款实时AI换脸工具,支持Windows和Mac,用户只需一张图片即可实现面部替换和视频深度伪造。该工具在GitHub上开源,提供简单的安装步骤,包括GPU和CPU部署方式。用户可以通过一键安装包或源码部署来使用,支持多种操作系统。文中还包含了常见问题的解决方案。
AI工具
深度伪造
开源软件
视频处理
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
编程
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
2024-11-19 08:26:56 +0800 CST
view 2102
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率。它提供简单易用的API,支持多种创意项目,如视频同步观看、嵌入式设备摄像头传输、数据安全传输等。Pion实现了完整的PeerConnectionAPI,支持多种媒体格式和加密算法,适用于多个操作系统和架构。示例代码展示了如何使用Pion发送视频文件到浏览器。
WebRTC
Golang
视频处理
网络通信
实时应用
编程
OpenCV 检测与跟踪移动物体
2024-11-18 15:27:01 +0800 CST
view 2008
本文介绍了如何使用OpenCV和Python检测与跟踪移动物体,重点讲解了背景减除器的工作原理及其在视频流中的应用。通过比较帧之间的差异,背景减除技术能够有效隔离前景物体。文中详细描述了KNN和MOG2两种背景减除器的实现过程,并提供了相应的代码示例,帮助读者理解如何在实际应用中进行目标检测与追踪。
计算机视觉
目标检测
视频处理
DeepSeek+Runway联合工作流:1小时出4K电影级短片,手把手保姆级教程
编程
DeepSeek+Runway联合工作流:1小时出4K电影级短片,手把手保姆级教程
2026-04-29 12:18:40 +0800 CST
view 14
DeepSeek写分镜脚本+Runway生图生视频,1小时完成从想法到4K电影级成片的完整工作流。无需拍摄、无需演员、不用专业剪辑,手把手保姆级教程含避坑指南和3个爆款模板。
AI视频
DeepSeek
Runway
4K视频
分镜脚本
短视频创作
AI工作流
AIGC
影视制作
Pydub是一个强大的Python音频处理库,提供简单直观的API,支持音频文件的剪切、拼接、格式转换和音量调整等功能
综合
Pydub是一个强大的Python音频处理库,提供简单直观的API,支持音频文件的剪切、拼接、格式转换和音量调整等功能
2024-11-18 17:27:54 +0800 CST
view 1996
Pydub是一个强大的Python音频处理库,提供简单直观的API,支持音频文件的剪切、拼接、格式转换和音量调整等功能。它依赖于FFmpeg,能够处理多种音频格式。本文介绍了Pydub的安装、基本用法、高级功能及实际应用案例,适合音乐制作、语音处理等场景,帮助用户快速上手音频处理。
音频处理
编程
Python库
音乐制作
技术
vue ios微信无法自动播放背景音解决办法
编程
vue ios微信无法自动播放背景音解决办法
2024-11-18 12:59:50 +0800 CST
view 3599
该文本讨论了由于ios系统导致的问题,并提供了解决方案,即使用微信的api。代码片段展示了如何在特定条件下创建音频播放器并播放音频,尤其是在微信环境下的处理方式。
技术
开发
音频处理
如何在Vue3中使用音频库Howler.js实现音频播放?
编程
如何在Vue3中使用音频库Howler.js实现音频播放?
2024-11-18 15:35:49 +0800 CST
view 1735
本文详细讲解了如何在Vue3项目中集成Howler.js音频库,实现音频播放功能。包括初始化Vue3项目、安装Howler.js、创建音频播放组件以及实现播放、暂停、停止和音量调节等功能。通过这些步骤,开发者可以轻松为Web应用添加音频功能,提升用户体验。
Web开发
音频处理
前端技术
综合
Sound.js是一个强大的JavaScript音频库
2024-11-19 03:47:13 +0800 CST
view 1715
Sound.js是一个强大的JavaScript音频库,提供统一的API来处理不同浏览器中的音频播放,支持多种音频格式和跨浏览器兼容性。它适用于游戏开发、教育应用和交互式网站,能够提升用户体验。通过简单的代码,开发者可以快速集成音频功能,使用预加载、事件监听和音量控制等最佳实践,创建丰富的多媒体应用。
音频处理
JavaScript库
用户体验
游戏开发
多媒体应用
VibeVoice 深度解析:微软如何用 7.5Hz 连续语音分词器重新定义语音 AI 的边界
编程
VibeVoice 深度解析:微软如何用 7.5Hz 连续语音分词器重新定义语音 AI 的边界
2026-04-18 07:48:59 +0800 CST
view 120
微软开源的 VibeVoice 用 7.5Hz 连续语音分词器和 Next-token Diffusion 框架,实现了 60 分钟长音频单次处理,正在重新定义语音 AI 的技术边界。本文深度解析其架构设计、工程实践和部署优化。
VibeVoice
语音AI
ASR
TTS
微软开源
Next-token Diffusion
连续语音分词器
ICLR 2026
Whisper替代
长音频处理
LMG2025大会获奖团队开源!Pixelle-Video让AI视频创作变成一句话的事
编程
LMG2025大会获奖团队开源!Pixelle-Video让AI视频创作变成一句话的事
2026-04-21 13:55:15 +0800 CST
view 186
GitHub热榜AI视频项目!LMG2025大会获奖团队开源,输入主题自动生成完整短视频,含数字人口播、图生视频、动作迁移等功能。
Pixelle-Video
AI视频
开源
短视频
数字人
从一张产品图到TikTok带货视频:Image2+Seedance 2.0全自动闭环工作流
编程
从一张产品图到TikTok带货视频:Image2+Seedance 2.0全自动闭环工作流
2026-04-28 03:24:00 +0800 CST
view 35
从一张产品图到TikTok带货视频的全自动闭环工作流。Image2锁死画面视觉DNA,Seedance 2.0赋予导演级运动控制。四个实战案例:多宫格分镜TikTok视频、数字人带货、Instagram Live动图、品牌创意短片。
AI视频
Seedance 2.0
Image2
跨境电商
TikTok
视频生成
综合
Roop是一款免费开源的AI换脸工具
2024-11-19 08:31:01 +0800 CST
view 2604
Roop是一款免费开源的AI换脸工具,支持图片、视频及直播实时换脸,操作简单,适合创意工作者和普通用户。用户只需上传人脸图片,即可轻松完成换脸。Roop提供批量处理、保持帧率等多种功能,且安装过程简单,支持Windows环境。文章还介绍了报错处理及客户端代码示例,帮助用户更好地使用该工具。
人工智能
开源软件
图像处理
视频编辑
技术教程
FFmpeg 编译使用 ffmpeg-gl-transition 以丰富视频特效
综合
FFmpeg 编译使用 ffmpeg-gl-transition 以丰富视频特效
2024-11-19 05:45:47 +0800 CST
view 2389
本文介绍如何在Mac系统上编译支持GLTransitions的FFmpeg,包括安装依赖库、下载源代码、修改代码和编译步骤。通过集成GLTransitions,用户可以在视频中添加炫酷的转场效果。文中详细描述了从源码编译GLEW和GLFW3的过程,以及如何配置和使用gltransition过滤器。
多媒体处理
视频编辑
开源软件
编程
技术文档
综合
基于Webcodecs + Vue3实现的Web端剪辑工具
2024-11-19 10:07:35 +0800 CST
view 2080
这是一个基于WebCodecs实现的Web端视频编辑工具,功能类似于剪映Web版。该工具允许用户在线编辑视频,提供了便捷的编辑体验。开源地址为:https://github.com/x007xyz/fly-cut。
视频编辑
Web技术
开源工具
综合
pin.gl是基于WebRTC的屏幕共享工具
2024-11-19 06:38:05 +0800 CST
view 2142
WebRTC是一种开源技术,支持实时音视频通信,允许浏览器和应用程序直接进行P2P连接。pin.gl是基于WebRTC的屏幕共享工具,用户只需输入房间代码即可共享屏幕或摄像头,具有超低延迟和隐私保护的特点,支持多种设备。该工具简单易用,适合现场活动和互动会议,但并不开源。
实时通信
视频技术
网络工具
开源无限时长虚拟人视频生成,1.6K Stars 的 InfiniteTalk 来了
编程
开源无限时长虚拟人视频生成,1.6K Stars 的 InfiniteTalk 来了
2026-04-19 09:44:57 +0800 CST
view 140
InfiniteTalk是美团MeiGen-AI团队开源的音频驱动视频生成框架,基于Wan2.1-14B,支持无限时长生成,嘴唇、头部、身体、表情全同步
开源
AI
视频生成
数字人
Python
FastRTC:为 Python 开发者打造的实时音视频通信利器
编程
FastRTC:为 Python 开发者打造的实时音视频通信利器
2025-05-15 09:56:44 +0800 CST
view 1858
FastRTC是一个专为Python开发者设计的开源实时通信库,简化了实时音视频应用的开发。它基于WebRTC和WebSocket,支持自动语音检测、UI生成和电话接入等功能。通过简单的API,开发者可以快速构建AI语音助手、实时翻译工具等应用。FastRTC使得实时通信变得更加易用和灵活,适合快速原型开发。
实时通信
Python开发
开源项目
AI技术
音视频应用
综合
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频
2024-11-19 03:46:15 +0800 CST
view 2419
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频。它结合了Web技术和编程的力量,使得视频制作更加灵活和高效。用户可以利用CSS、Canvas、SVG和WebGL等技术,实时编辑和预览视频效果,并通过API动态生成内容。作为一个开源项目,Remotion提供了丰富的功能和活跃的开发者社区,适合用于制作宣传视频和数据可视化。
前端开发
视频制作
开源工具
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
编程
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
2026-04-21 08:46:51 +0800 CST
view 96
FFmpegFree:Vue3+TypeScript+Go+Wails跨平台桌面工具,支持音视频互转、RTMP/HLS推流、屏幕录制推流、FLV拉流播放、Office转PDF
开源
桌面应用
FFmpeg
音视频
Go
Vue3
Wails
流媒体
RTMP
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 286
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
浏览器自动播放策略
编程
浏览器自动播放策略
2024-11-19 08:54:41 +0800 CST
view 2494
随着网络视频和音频内容的普及,浏览器对自动播放实施了不同的策略以改善用户体验。主要策略包括静音播放、用户互动、自动委派和媒体参与度。不同浏览器如Chrome、Firefox、Safari和Edge在自动播放的默认行为上有所不同。设计时需考虑用户体验,避免干扰,并提供控制选项和清晰提示。
浏览器
自动播放
用户体验
网络技术
视频
美团开源InfiniteTalk:一张照片生成无限时长AI视频,口型动作完美同步
编程
美团开源InfiniteTalk:一张照片生成无限时长AI视频,口型动作完美同步
2026-04-23 15:49:52 +0800 CST
view 136
美团MeiGen-AI团队开源InfiniteTalk:一张照片+一段音频生成无限时长数字人视频,口型/头部/表情/身体全同步,GitHub 1.6K Stars,HuggingFace月下载6.4万次,完全本地运行隐私安全。
InfiniteTalk
数字人
美团开源
AI视频
无限时长
Wan2.1
综合
MiroTalkC2C是一个基于WebRTC的免费实时视频通话和屏幕共享平台,支持端到端加密,保障用户通信安全
2024-11-19 02:36:33 +0800 CST
view 1757
MiroTalkC2C是一个基于WebRTC的免费实时视频通话和屏幕共享平台,支持端到端加密,保障用户通信安全。用户无需下载或插件,只需一键即可开始通话。平台提供即时消息功能,适用于在线教育、远程医疗、客户服务等场景,灵活性和可扩展性使其成为各种规模企业的理想选择。
通信
开源项目
视频会议
安全
在线服务
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
9
下一页