程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 328
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
编程
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
2026-04-20 22:53:28 +0800 CST
view 882
复旦大学OpenMOSS团队开源的0.1B参数多语言TTS模型,纯CPU运行、支持零样本语音克隆、48kHz双声道、20种语言、流式推理,MacBook Air单核即可流畅运行
TTS
语音合成
语音克隆
AI
开源
CPU推理
OpenMOSS
微信小程序开发资源汇总
编程
微信小程序开发资源汇总
2026-05-11 16:11:29 +0800 CST
view 261
本文档汇总了微信小程序开发的官方资源(设计指南、开发教程、框架、组件、API、开发者工具)以及丰富的第三方工具、插件、组件和后端SDK。
微信小程序
开发资源
前端框架
UI组件
Demo示例
工具插件
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实战
编程
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实战
2026-04-22 16:02:39 +0800 CST
view 459
Mozilla发布开源AI客户端Thunderbolt,基于Haystack框架,支持ACP/MCP双协议,主打自托管、数据主权与隐私保护。深度解析其架构设计与Docker部署实战。
Mozilla
Thunderbolt
Haystack
ACP
MCP
AI客户端
RAG
开源
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实践
编程
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实践
2026-04-22 16:03:28 +0800 CST
view 461
Mozilla发布开源AI客户端Thunderbolt,基于Haystack框架,支持ACP/MCP双协议,主打自托管、数据主权与隐私保护。深度解析其架构设计与Docker部署实战。
Mozilla
Thunderbolt
Haystack
ACP
MCP
AI客户端
RAG
开源
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 325
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
OpenHuman 深度解析:从 Memory Tree 到 TokenJuice——登顶 GitHub Trending 的个人 AI 超级智能架构内幕
编程
OpenHuman 深度解析:从 Memory Tree 到 TokenJuice——登顶 GitHub Trending 的个人 AI 超级智能架构内幕
2026-05-18 12:14:32 +0800 CST
view 560
深度拆解登顶GitHub Trending的OpenHuman项目:Memory Tree摘要树架构、TokenJuice 80%压缩引擎、模型路由策略、Auto-Fetch自动同步、118+集成、Obsidian双向集成、本地优先隐私设计的完整技术内幕
OpenHuman
AI助手
Memory Tree
TokenJuice
Rust
Tauri
开源项目
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
编程
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
2026-06-13 20:17:57 +0800 CST
view 86
Redis之父antirez新作DwarfStar 4深度解析:专为DeepSeek V4 Flash打造的本地推理引擎,非对称2-bit量化、磁盘KV缓存、Metal图执行、分布式推理、方向引导,MacBook上284B模型跑出26 tok/s的完全指南
ds4
DwarfStar
DeepSeek
本地推理
Metal
MoE
量化
KV缓存
DiffusionGemma 深度实战:当文本生成进入「扩散纪元」——从离散扩散原理到本地高速推理的完全指南(2026)
编程
DiffusionGemma 深度实战:当文本生成进入「扩散纪元」——从离散扩散原理到本地高速推理的完全指南(2026)
2026-06-14 01:18:58 +0800 CST
view 78
2026年6月Google开源DiffusionGemma——基于离散扩散技术的文本生成模型,打破传统自回归范式,实现4倍生成速度提升。本文深入解析其架构原理、性能实测、代码实战与生产落地。
DiffusionGemma
离散扩散
文本生成
AI大模型
Google
并行推理
MoE架构
HarmonyOS 6 深度实战:ArkTS + ArkUI + AI 原生——从架构原理到生产级应用开发完全指南(2026)
编程
HarmonyOS 6 深度实战:ArkTS + ArkUI + AI 原生——从架构原理到生产级应用开发完全指南(2026)
2026-06-05 15:07:15 +0800 CST
view 326
从ArkTS语言设计到ArkUI声明式框架,从Aspect AOP到系统级AI集成,全面解析HarmonyOS 6的生产级应用开发
HarmonyOS
ArkTS
ArkUI
鸿蒙开发
AI原生
方舟编译器
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
编程
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
2026-05-28 16:37:41 +0800 CST
view 146
深入解析 Meta Llama 4 的 MoE 混合专家架构原理,探讨其如何以 17B 激活参数撬动万亿级算力,并提供完整的本地部署实战指南。
Llama4
MoE
混合专家
开源大模型
本地部署
Meta
人工智能
深度学习
Linux 7.0 深度实战:当内核遇见 Rust 与 BPF——从架构原理到生产级内核调优完全指南(2026)
编程
Linux 7.0 深度实战:当内核遇见 Rust 与 BPF——从架构原理到生产级内核调优完全指南(2026)
2026-06-06 00:37:40 +0800 CST
view 136
深度解析 Linux 7.0 内核新特性:Rust 正式成为内核一等公民、BPF/sched_ext 调度框架革命、DAMON 内存管理优化、安全增强与漏洞修复。包含大量实战代码与生产级调优指南,适合内核开发者和系统工程师。
Linux
内核
Rust
BPF
调度器
DAMON
安全
性能优化
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
编程
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
2026-04-24 17:19:28 +0800 CST
view 423
2026年4月24日DeepSeek发布V4预览版,总参1.6T/284B,激活49B/13B,100万Token上下文,DSA稀疏注意力,兼容OpenAI+Anthropic双协议,昇腾与寒武纪Day 0适配,深度解析其架构与API用法。
DeepSeek
V4
MoE
大模型
开源
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
编程
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
2026-04-16 16:42:03 +0800 CST
view 418
RedditVideoMakerBot 是一个将 Reddit 帖子链接自动制作成视频的开源工具,支持语音合成、自动配图、字幕生成和背景音乐。
Reddit
视频自动化
Python
MoviePy
PRAW
内容创作
开源工具
开源MES/MOM系统TMom:用一套系统管好几个厂区的生产,低代码、大屏、移动端全支持
编程
开源MES/MOM系统TMom:用一套系统管好几个厂区的生产,低代码、大屏、移动端全支持
2026-04-16 17:01:13 +0800 CST
view 683
TMom是一款基于.NET 8开源的多厂区多项目级MOM/MES系统,支持计划排程、工艺路线设计、在线低代码报表、大屏看板、移动端和AOT客户端,MIT协议开源。
MES
MOM
.NET
低代码
数字化看板
制造
开源
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
编程
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
2026-04-25 08:17:20 +0800 CST
view 887
MOSS-TTS-Nano 是模思智能和OpenMOSS团队开源的0.1B参数超小语音合成模型,支持纯CPU推理、ONNX加速、20种语言、零样本语音克隆、流式输出48kHz立体声,还有浏览器插件可直接在Chrome中使用。
AI
开源
语音合成
TTS
MOSS
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
编程
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
2026-04-26 08:10:21 +0800 CST
view 455
深度解析DeepSeek-V4的技术突破:百万Token原生上下文、万亿级MoE架构、国产芯片适配。从技术原理到工程实践,全面剖析这场开源AI的革命。
DeepSeek
大模型
MoE
百万上下文
开源AI
6G通感算智融合架构深度解析:当通信基站进化为「超级智能体」——从协议栈到底层原理的完全指南(2026)
编程
6G通感算智融合架构深度解析:当通信基站进化为「超级智能体」——从协议栈到底层原理的完全指南(2026)
2026-06-09 19:51:27 +0800 CST
view 165
深度解析6G通感算智融合架构:太赫兹通信、通感一体化ISAC、天地一体组网、算力网络协同。含代码示例和架构分析。
6G
通信技术
通感算智融合
ISAC
太赫兹
天地一体
边缘计算
网络架构
低轨卫星
MIMO
OpenHuman 深度实战:Rust+Tauri 构建本地优先的 AI 桌面助手——Memory Tree 持久记忆与 118+ 集成完全指南(2026)
编程
OpenHuman 深度实战:Rust+Tauri 构建本地优先的 AI 桌面助手——Memory Tree 持久记忆与 118+ 集成完全指南(2026)
2026-05-30 21:11:41 +0800 CST
view 200
OpenHuman 用 Rust+Tauri 构建本地优先的 AI 桌面助手,通过 Memory Tree 持久记忆和 118+ 集成让 Agent 拥有跨会话长期记忆。本文从架构原理到生产级部署完整拆解。
OpenHuman
Rust
Tauri
AI桌面助手
Memory Tree
知识图谱
本地AI
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
编程
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
2026-04-09 00:53:51 +0800 CST
view 1050
2026年4月8日智谱发布GLM-5.1,744B参数MIT开源,SWE-bench Pro 58.4分超越Claude Opus 4.6,全球首个支持8小时长程自治的开源模型。
GLM-5.1
智谱AI
开源大模型
MoE
SWE-bench
长程自治
LLM
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 316
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
编程
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
2026-04-09 04:54:56 +0800 CST
view 635
Google于2026年4月发布Gemma 4开源模型系列,首次全面切换Apache 2.0许可证,搭载Per-Layer Embedding架构创新,26B MoE以3.8B激活参数击败Qwen3-235B。本文深度解析PLE架构、稀疏激活机制与全规格产品矩阵。
Gemma 4
Google
开源模型
Apache 2.0
MoE
Per-Layer Embedding
GitNexus + GenericAgent:零服务器知识图谱与极简自我进化Agent的架构共振
编程
GitNexus + GenericAgent:零服务器知识图谱与极简自我进化Agent的架构共振
2026-04-20 16:46:06 +0800 CST
view 589
深入解析GitNexus(浏览器内零服务器代码知识图谱引擎)与GenericAgent(3.3K行极简自我进化Agent)的架构设计,探讨极简约束下的涌现智能范式。
AI Agent
GitNexus
GenericAgent
知识图谱
Graph RAG
自我进化
从浏览器到终端:GitNexus代码图谱与GenericAgent进化引擎的技术解密与集成实战
编程
从浏览器到终端:GitNexus代码图谱与GenericAgent进化引擎的技术解密与集成实战
2026-04-20 16:46:58 +0800 CST
view 364
深入解析GitNexus(浏览器内零服务器代码知识图谱引擎)与GenericAgent(3.3K行极简自我进化Agent)的架构设计,探讨极简约束下的涌现智能范式。
AI Agent
GitNexus
GenericAgent
知识图谱
Graph RAG
自我进化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
5
6
7
8
9
...
51
下一页