程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
开源无限时长虚拟人视频生成,1.6K Stars 的 InfiniteTalk 来了
编程
开源无限时长虚拟人视频生成,1.6K Stars 的 InfiniteTalk 来了
2026-04-19 09:44:57 +0800 CST
view 573
InfiniteTalk是美团MeiGen-AI团队开源的音频驱动视频生成框架,基于Wan2.1-14B,支持无限时长生成,嘴唇、头部、身体、表情全同步
开源
AI
视频生成
数字人
Python
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
编程
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
2026-05-09 18:51:15 +0800 CST
view 327
腾讯混元开源 HunyuanVideo 1.5 视频生成模型,8.3B 参数 Diffusion Transformer 架构,14G 显存消费级显卡可运行。SSTA 稀疏注意力机制实现推理速度 1.87 倍提升,3D 因果 VAE 实现空间 16 倍、时间 4 倍压缩。
AI视频生成
腾讯混元
HunyuanVideo
Diffusion Transformer
SSTA
开源模型
消费级显卡
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
编程
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
2026-05-16 21:15:15 +0800 CST
view 851
SANA-WM是NVIDIA Lab开源的2.6B参数世界模型视频生成系统,支持1分钟720p视频生成。本文从扩散Transformer底层数学到Flow Matching推理优化,完整解析其Dual-Pathway架构、3D VAE时空压缩、因果注意力掩码等核心技术,并提供完整PyTorch代码示例。
AI视频生成
世界模型
扩散模型
Transformer
Flow Matching
综合
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频
2024-11-19 03:46:15 +0800 CST
view 2613
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频。它结合了Web技术和编程的力量,使得视频制作更加灵活和高效。用户可以利用CSS、Canvas、SVG和WebGL等技术,实时编辑和预览视频效果,并通过API动态生成内容。作为一个开源项目,Remotion提供了丰富的功能和活跃的开发者社区,适合用于制作宣传视频和数据可视化。
前端开发
视频制作
开源工具
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
编程
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
2026-04-21 08:46:51 +0800 CST
view 430
FFmpegFree:Vue3+TypeScript+Go+Wails跨平台桌面工具,支持音视频互转、RTMP/HLS推流、屏幕录制推流、FLV拉流播放、Office转PDF
开源
桌面应用
FFmpeg
音视频
Go
Vue3
Wails
流媒体
RTMP
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
编程
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
2026-06-03 15:17:28 +0800 CST
view 217
深入解析 GetStream 开源的 Vision-Agents 框架,从架构设计、视频处理管道、多模态LLM集成、RAG知识库、MCP工具调用到Kubernetes生产部署的完整实战指南
Vision-Agents
GetStream
多模态AI
视频AI
Agent
WebRTC
低延迟
RAG
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 663
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
FFmpeg WebCLI:浏览器中运行完整 FFmpeg,离线处理视频,文件无需上传
编程
FFmpeg WebCLI:浏览器中运行完整 FFmpeg,离线处理视频,文件无需上传
2026-06-13 08:34:10 +0800 CST
view 147
FFmpeg WebCLI基于ffmpeg.wasm构建,通过WebAssembly将完整FFmpeg移植到浏览器中,支持30+操作(GIF/格式转换/压缩/剪辑/滤镜),PWA离线可用,文件全程本地处理无需上传。
FFmpeg
WebAssembly
WebCLI
视频处理
PWA
ffmpeg.wasm
离线工具
GIF制作
格式转换
香港大学开源ViMax多智能体视频生成框架
编程
香港大学开源ViMax多智能体视频生成框架
2026-05-18 06:31:45 +0800 CST
view 561
香港大学HKUDS开源ViMax多智能体视频生成框架,从创意/小说/剧本到完整多镜头视频端到端自动化,支持RAG长文本分析、多机位模拟、一致性校验。
开源项目
AI视频
多智能体
香港大学
Pixelle-Video:阿里开源全自动视频生成,输入一句话串起整条产线,GitHub 2.2万 Star
编程
Pixelle-Video:阿里开源全自动视频生成,输入一句话串起整条产线,GitHub 2.2万 Star
2026-06-13 12:45:50 +0800 CST
view 156
Pixelle-Video是阿里国际AI团队开源的全自动视频生成工具,输入主题自动写文案/生成配图/合成语音/加BGM,支持ComfyUI本地/RunningHub云端/直连API三种配图方案,数字人口播+动作迁移,零成本可选。
Pixelle-Video
阿里开源
视频生成
AI
全自动
ComfyUI
数字人
动作迁移
Streamlit
AIGC
AI 直播工具:Deep Live Cam 实时换脸效果超乎想象!附安装教程
综合
AI 直播工具:Deep Live Cam 实时换脸效果超乎想象!附安装教程
2024-11-19 08:13:10 +0800 CST
view 4752
DeepLiveCam是一款实时AI换脸工具,支持Windows和Mac,用户只需一张图片即可实现面部替换和视频深度伪造。该工具在GitHub上开源,提供简单的安装步骤,包括GPU和CPU部署方式。用户可以通过一键安装包或源码部署来使用,支持多种操作系统。文中还包含了常见问题的解决方案。
AI工具
深度伪造
开源软件
视频处理
美团开源InfiniteTalk:一张照片生成无限时长AI视频,口型动作完美同步
编程
美团开源InfiniteTalk:一张照片生成无限时长AI视频,口型动作完美同步
2026-04-23 15:49:52 +0800 CST
view 776
美团MeiGen-AI团队开源InfiniteTalk:一张照片+一段音频生成无限时长数字人视频,口型/头部/表情/身体全同步,GitHub 1.6K Stars,HuggingFace月下载6.4万次,完全本地运行隐私安全。
InfiniteTalk
数字人
美团开源
AI视频
无限时长
Wan2.1
MTools:免费开源的本地 AI 工具集,一个顶好几个
编程
MTools:免费开源的本地 AI 工具集,一个顶好几个
2026-05-13 17:55:20 +0800 CST
view 297
MTools是一款完全本地运行的开源AI工具集,集成抠图、证件照制作、人声分离、音频转文字、视频插帧、超分辨率等功能,保护隐私且不限次数使用。
AI工具
本地运行
开源软件
图像处理
音频处理
视频处理
人声分离
抠图工具
综合
MiroTalkC2C是一个基于WebRTC的免费实时视频通话和屏幕共享平台,支持端到端加密,保障用户通信安全
2024-11-19 02:36:33 +0800 CST
view 1961
MiroTalkC2C是一个基于WebRTC的免费实时视频通话和屏幕共享平台,支持端到端加密,保障用户通信安全。用户无需下载或插件,只需一键即可开始通话。平台提供即时消息功能,适用于在线教育、远程医疗、客户服务等场景,灵活性和可扩展性使其成为各种规模企业的理想选择。
通信
开源项目
视频会议
安全
在线服务
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
编程
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
2024-11-19 08:26:56 +0800 CST
view 2315
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率。它提供简单易用的API,支持多种创意项目,如视频同步观看、嵌入式设备摄像头传输、数据安全传输等。Pion实现了完整的PeerConnectionAPI,支持多种媒体格式和加密算法,适用于多个操作系统和架构。示例代码展示了如何使用Pion发送视频文件到浏览器。
WebRTC
Golang
视频处理
网络通信
实时应用
Taisly Agent Kit 深度实战:当 AI Agent 学会「视频发布」——从 SDK 架构原理到生产级自动化视频管线的完全指南(2026)
编程
Taisly Agent Kit 深度实战:当 AI Agent 学会「视频发布」——从 SDK 架构原理到生产级自动化视频管线的完全指南(2026)
2026-06-14 05:50:18 +0800 CST
view 137
深入剖析Taisly Agent Kit的架构设计、核心SDK能力、CLI工作流,并通过完整代码示例展示如何从零构建生产级AI视频发布管线。
AI Agent
视频生成
Taisly
SDK设计
自动化管线
Python
TypeScript
告别Pr/AE!用FFCreator这个Node.js神器,编程式自动化批量生成视频
编程
告别Pr/AE!用FFCreator这个Node.js神器,编程式自动化批量生成视频
2025-09-01 06:59:10 +0800 CST
view 966
FFCreator是一个基于Node.js的视频处理库,旨在通过程序化方式自动化批量生成高质量视频。它将视频制作简化为简单的API调用,支持多种元素(图片、视频、音频、文本)的组合,内置丰富的动画效果和高级功能,如文本转语音和虚拟主播,适合电商、新媒体和在线教育等场景。
视频制作
自动化工具
编程
Node.js
多媒体
CutClaw 深度解析:开源 AI 智能剪辑师如何"听懂"音乐并剪出电影感大片——多智能体协作的音乐驱动视频剪辑革命
编程
CutClaw 深度解析:开源 AI 智能剪辑师如何"听懂"音乐并剪出电影感大片——多智能体协作的音乐驱动视频剪辑革命
2026-04-16 08:48:53 +0800 CST
view 803
深度解析开源项目CutClaw的技术架构、多智能体协作机制、音乐驱动剪辑原理。由大湾区大学GVC实验室和北京交通大学团队联合腾讯ARC实验室开源,能将几小时素材自动剪成电影感大片。
CutClaw
AI剪辑
开源
视频剪辑
多智能体
音乐驱动
智能剪辑师
EchoChat:Go语言音视频会议直播系统,控制面与媒体面分离架构设计
编程
EchoChat:Go语言音视频会议直播系统,控制面与媒体面分离架构设计
2026-05-14 08:41:45 +0800 CST
view 276
EchoChat是基于Go语言开发的实时音视频会议直播系统,控制面与媒体面分离架构,Go处理信令+mediasoup C++ SFU转发媒体流,uniapp多端适配,支持即时聊天、多人会议、互动直播。
音视频
开源项目
Go
mediasoup
SFU
直播
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
编程
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
2026-04-16 16:42:03 +0800 CST
view 459
RedditVideoMakerBot 是一个将 Reddit 帖子链接自动制作成视频的开源工具,支持语音合成、自动配图、字幕生成和背景音乐。
Reddit
视频自动化
Python
MoviePy
PRAW
内容创作
开源工具
AI漫剧运镜万能提示词完全指南:如何用文字实现电影级镜头感
资讯
AI漫剧运镜万能提示词完全指南:如何用文字实现电影级镜头感
2026-04-27 06:07:58 +0800 CST
view 486
系统梳理AI漫剧运镜万能提示词词库,涵盖万能结构公式、镜头类型、景别切换、光影氛围、音频设计、场景化模板、高阶控制指令等完整体系,让创作者复制粘贴就能用。
AI视频
运镜
提示词
漫剧创作
social-auto-upload 深度解析:11K Stars 的 Python 脚本,一键发布视频到抖音/快手/视频号
编程
social-auto-upload 深度解析:11K Stars 的 Python 脚本,一键发布视频到抖音/快手/视频号
2026-05-15 10:08:49 +0800 CST
view 465
深入解析 11K Stars 的 social-auto-upload:基于 Playwright 的 Python 自动化脚本,一键发布视频到抖音、快手、视频号、小红书、B站、TikTok 等平台,支持多账号矩阵管理、定时发布、批量上传,自媒体效率神器。
social-auto-upload
抖音
视频号
Python自动化
自媒体工具
Playwright
编程
OpenCV 检测与跟踪移动物体
2024-11-18 15:27:01 +0800 CST
view 2158
本文介绍了如何使用OpenCV和Python检测与跟踪移动物体,重点讲解了背景减除器的工作原理及其在视频流中的应用。通过比较帧之间的差异,背景减除技术能够有效隔离前景物体。文中详细描述了KNN和MOG2两种背景减除器的实现过程,并提供了相应的代码示例,帮助读者理解如何在实际应用中进行目标检测与追踪。
计算机视觉
目标检测
视频处理
Pixelle-Video:一句话生成完整短视频的开源 AI 引擎
编程
Pixelle-Video:一句话生成完整短视频的开源 AI 引擎
2026-04-18 08:51:53 +0800 CST
view 1593
阿里 AIDC 团队开源的 Pixelle-Video,只需输入一个主题,就能自动完成文案撰写、AI配图、语音合成、背景音乐、视频剪辑全流程。本文深度解析其技术架构、核心能力和部署方案。
AI
短视频
开源工具
ComfyUI
自动化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
15
下一页