程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
从一张产品图到TikTok带货视频:Image2+Seedance 2.0全自动闭环工作流
编程
从一张产品图到TikTok带货视频:Image2+Seedance 2.0全自动闭环工作流
2026-04-28 03:24:00 +0800 CST
view 457
从一张产品图到TikTok带货视频的全自动闭环工作流。Image2锁死画面视觉DNA,Seedance 2.0赋予导演级运动控制。四个实战案例:多宫格分镜TikTok视频、数字人带货、Instagram Live动图、品牌创意短片。
AI视频
Seedance 2.0
Image2
跨境电商
TikTok
视频生成
综合
Roop是一款免费开源的AI换脸工具
2024-11-19 08:31:01 +0800 CST
view 2786
Roop是一款免费开源的AI换脸工具,支持图片、视频及直播实时换脸,操作简单,适合创意工作者和普通用户。用户只需上传人脸图片,即可轻松完成换脸。Roop提供批量处理、保持帧率等多种功能,且安装过程简单,支持Windows环境。文章还介绍了报错处理及客户端代码示例,帮助用户更好地使用该工具。
人工智能
开源软件
图像处理
视频编辑
技术教程
FFmpeg 编译使用 ffmpeg-gl-transition 以丰富视频特效
综合
FFmpeg 编译使用 ffmpeg-gl-transition 以丰富视频特效
2024-11-19 05:45:47 +0800 CST
view 2584
本文介绍如何在Mac系统上编译支持GLTransitions的FFmpeg,包括安装依赖库、下载源代码、修改代码和编译步骤。通过集成GLTransitions,用户可以在视频中添加炫酷的转场效果。文中详细描述了从源码编译GLEW和GLFW3的过程,以及如何配置和使用gltransition过滤器。
多媒体处理
视频编辑
开源软件
编程
技术文档
综合
基于Webcodecs + Vue3实现的Web端剪辑工具
2024-11-19 10:07:35 +0800 CST
view 2277
这是一个基于WebCodecs实现的Web端视频编辑工具,功能类似于剪映Web版。该工具允许用户在线编辑视频,提供了便捷的编辑体验。开源地址为:https://github.com/x007xyz/fly-cut。
视频编辑
Web技术
开源工具
综合
pin.gl是基于WebRTC的屏幕共享工具
2024-11-19 06:38:05 +0800 CST
view 2360
WebRTC是一种开源技术,支持实时音视频通信,允许浏览器和应用程序直接进行P2P连接。pin.gl是基于WebRTC的屏幕共享工具,用户只需输入房间代码即可共享屏幕或摄像头,具有超低延迟和隐私保护的特点,支持多种设备。该工具简单易用,适合现场活动和互动会议,但并不开源。
实时通信
视频技术
网络工具
开源无限时长虚拟人视频生成,1.6K Stars 的 InfiniteTalk 来了
编程
开源无限时长虚拟人视频生成,1.6K Stars 的 InfiniteTalk 来了
2026-04-19 09:44:57 +0800 CST
view 585
InfiniteTalk是美团MeiGen-AI团队开源的音频驱动视频生成框架,基于Wan2.1-14B,支持无限时长生成,嘴唇、头部、身体、表情全同步
开源
AI
视频生成
数字人
Python
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
编程
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
2026-05-09 18:51:15 +0800 CST
view 337
腾讯混元开源 HunyuanVideo 1.5 视频生成模型,8.3B 参数 Diffusion Transformer 架构,14G 显存消费级显卡可运行。SSTA 稀疏注意力机制实现推理速度 1.87 倍提升,3D 因果 VAE 实现空间 16 倍、时间 4 倍压缩。
AI视频生成
腾讯混元
HunyuanVideo
Diffusion Transformer
SSTA
开源模型
消费级显卡
FastRTC:为 Python 开发者打造的实时音视频通信利器
编程
FastRTC:为 Python 开发者打造的实时音视频通信利器
2025-05-15 09:56:44 +0800 CST
view 2029
FastRTC是一个专为Python开发者设计的开源实时通信库,简化了实时音视频应用的开发。它基于WebRTC和WebSocket,支持自动语音检测、UI生成和电话接入等功能。通过简单的API,开发者可以快速构建AI语音助手、实时翻译工具等应用。FastRTC使得实时通信变得更加易用和灵活,适合快速原型开发。
实时通信
Python开发
开源项目
AI技术
音视频应用
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
编程
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
2026-05-16 21:15:15 +0800 CST
view 859
SANA-WM是NVIDIA Lab开源的2.6B参数世界模型视频生成系统,支持1分钟720p视频生成。本文从扩散Transformer底层数学到Flow Matching推理优化,完整解析其Dual-Pathway架构、3D VAE时空压缩、因果注意力掩码等核心技术,并提供完整PyTorch代码示例。
AI视频生成
世界模型
扩散模型
Transformer
Flow Matching
综合
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频
2024-11-19 03:46:15 +0800 CST
view 2613
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频。它结合了Web技术和编程的力量,使得视频制作更加灵活和高效。用户可以利用CSS、Canvas、SVG和WebGL等技术,实时编辑和预览视频效果,并通过API动态生成内容。作为一个开源项目,Remotion提供了丰富的功能和活跃的开发者社区,适合用于制作宣传视频和数据可视化。
前端开发
视频制作
开源工具
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
编程
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
2026-04-21 08:46:51 +0800 CST
view 439
FFmpegFree:Vue3+TypeScript+Go+Wails跨平台桌面工具,支持音视频互转、RTMP/HLS推流、屏幕录制推流、FLV拉流播放、Office转PDF
开源
桌面应用
FFmpeg
音视频
Go
Vue3
Wails
流媒体
RTMP
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
编程
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
2026-06-03 15:17:28 +0800 CST
view 229
深入解析 GetStream 开源的 Vision-Agents 框架,从架构设计、视频处理管道、多模态LLM集成、RAG知识库、MCP工具调用到Kubernetes生产部署的完整实战指南
Vision-Agents
GetStream
多模态AI
视频AI
Agent
WebRTC
低延迟
RAG
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 668
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
香港大学开源ViMax多智能体视频生成框架
编程
香港大学开源ViMax多智能体视频生成框架
2026-05-18 06:31:45 +0800 CST
view 570
香港大学HKUDS开源ViMax多智能体视频生成框架,从创意/小说/剧本到完整多镜头视频端到端自动化,支持RAG长文本分析、多机位模拟、一致性校验。
开源项目
AI视频
多智能体
香港大学
Pixelle-Video:阿里开源全自动视频生成,输入一句话串起整条产线,GitHub 2.2万 Star
编程
Pixelle-Video:阿里开源全自动视频生成,输入一句话串起整条产线,GitHub 2.2万 Star
2026-06-13 12:45:50 +0800 CST
view 175
Pixelle-Video是阿里国际AI团队开源的全自动视频生成工具,输入主题自动写文案/生成配图/合成语音/加BGM,支持ComfyUI本地/RunningHub云端/直连API三种配图方案,数字人口播+动作迁移,零成本可选。
Pixelle-Video
阿里开源
视频生成
AI
全自动
ComfyUI
数字人
动作迁移
Streamlit
AIGC
浏览器自动播放策略
编程
浏览器自动播放策略
2024-11-19 08:54:41 +0800 CST
view 2703
随着网络视频和音频内容的普及,浏览器对自动播放实施了不同的策略以改善用户体验。主要策略包括静音播放、用户互动、自动委派和媒体参与度。不同浏览器如Chrome、Firefox、Safari和Edge在自动播放的默认行为上有所不同。设计时需考虑用户体验,避免干扰,并提供控制选项和清晰提示。
浏览器
自动播放
用户体验
网络技术
视频
美团开源InfiniteTalk:一张照片生成无限时长AI视频,口型动作完美同步
编程
美团开源InfiniteTalk:一张照片生成无限时长AI视频,口型动作完美同步
2026-04-23 15:49:52 +0800 CST
view 791
美团MeiGen-AI团队开源InfiniteTalk:一张照片+一段音频生成无限时长数字人视频,口型/头部/表情/身体全同步,GitHub 1.6K Stars,HuggingFace月下载6.4万次,完全本地运行隐私安全。
InfiniteTalk
数字人
美团开源
AI视频
无限时长
Wan2.1
综合
MiroTalkC2C是一个基于WebRTC的免费实时视频通话和屏幕共享平台,支持端到端加密,保障用户通信安全
2024-11-19 02:36:33 +0800 CST
view 1966
MiroTalkC2C是一个基于WebRTC的免费实时视频通话和屏幕共享平台,支持端到端加密,保障用户通信安全。用户无需下载或插件,只需一键即可开始通话。平台提供即时消息功能,适用于在线教育、远程医疗、客户服务等场景,灵活性和可扩展性使其成为各种规模企业的理想选择。
通信
开源项目
视频会议
安全
在线服务
Video.js:视频播放的全能解决方案
综合
Video.js:视频播放的全能解决方案
2024-11-18 23:37:03 +0800 CST
view 1330
Video.js是一个强大且灵活的HTML5视频播放器,支持多种视频格式和流媒体协议,适用于视频分享平台、直播应用和教育培训平台。它易于定制,拥有丰富的插件生态,能够满足各种视频播放需求。通过简单的代码引入和初始化,开发者可以快速上手并实现高质量的视频播放体验。
多媒体
网页开发
视频技术
Taisly Agent Kit 深度实战:当 AI Agent 学会「视频发布」——从 SDK 架构原理到生产级自动化视频管线的完全指南(2026)
编程
Taisly Agent Kit 深度实战:当 AI Agent 学会「视频发布」——从 SDK 架构原理到生产级自动化视频管线的完全指南(2026)
2026-06-14 05:50:18 +0800 CST
view 146
深入剖析Taisly Agent Kit的架构设计、核心SDK能力、CLI工作流,并通过完整代码示例展示如何从零构建生产级AI视频发布管线。
AI Agent
视频生成
Taisly
SDK设计
自动化管线
Python
TypeScript
HLS视频下载神器:Python实现加密流媒体一键下载与合并
代码
HLS视频下载神器:Python实现加密流媒体一键下载与合并
2025-08-30 19:21:22 +0800 CST
view 1451
本文介绍了一款基于Python的HLS视频下载工具,支持加密流和并行下载,能够自动合并视频片段。工具的设计包括M3U8解析、AES解密和FFmpeg集成,适用于保存在线教育课程、会议录像等流媒体视频。提供了详细的代码实现和使用教程,帮助用户理解HLS协议和视频处理技术。
视频下载
编程
流媒体
技术教程
Python
告别Pr/AE!用FFCreator这个Node.js神器,编程式自动化批量生成视频
编程
告别Pr/AE!用FFCreator这个Node.js神器,编程式自动化批量生成视频
2025-09-01 06:59:10 +0800 CST
view 969
FFCreator是一个基于Node.js的视频处理库,旨在通过程序化方式自动化批量生成高质量视频。它将视频制作简化为简单的API调用,支持多种元素(图片、视频、音频、文本)的组合,内置丰富的动画效果和高级功能,如文本转语音和虚拟主播,适合电商、新媒体和在线教育等场景。
视频制作
自动化工具
编程
Node.js
多媒体
综合
Plyr.js 播放器介绍
2024-11-18 12:39:35 +0800 CST
view 2220
Plyr.js是一款极简、可定制的HTML5播放器,支持视频和音频,具有响应式设计和丰富的API。用户可以通过CDN或npm/yarn安装,并轻松初始化播放器。Plyr.js还支持音量控制等自定义选项,适合开发者集成音视频播放功能。更多信息请访问Plyr.js官方网站。
播放器
前端开发
音视频技术
如何在Vue3中使用视频库Video.js实现视频播放?
编程
如何在Vue3中使用视频库Video.js实现视频播放?
2024-11-19 07:27:29 +0800 CST
view 2394
本文介绍了如何在Vue3项目中集成Video.js视频播放器,详细步骤包括创建Vue3项目、安装Video.js、创建VideoPlayer组件以及使用该组件。通过代码示例,读者可以学习如何实现基本的视频播放功能,并了解如何扩展Video.js的功能,如自定义控制栏等。
前端开发
视频播放
Vue.js
技术教程
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
11
下一页