程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 312
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
VoxCPM2 深度实战:当开源 TTS 突破「tokenizer 诅咒」——从Tokenizer-Free 架构到本地 CPU/GPU 部署的完全指南(2026)
编程
VoxCPM2 深度实战:当开源 TTS 突破「tokenizer 诅咒」——从Tokenizer-Free 架构到本地 CPU/GPU 部署的完全指南(2026)
2026-06-09 14:50:53 +0800 CST
view 177
VoxCPM2 深度实战:当开源 TTS 突破「tokenizer 诅咒」——从Tokenizer-Free 架构到本地 CPU/GPU 部署的完全指南(2026) 前言 2026年的TTS(Text-to-Speech,语音合成)战场,用一个字形容就是「卷」。 闭源巨头们打得不可开交——GPT-4o 的语音模式刚刚让人惊艳,ElevenLabs 又祭出了新一代多语言引擎,Google 的 Pro...
VoxCPM2
TTS
语音合成
AI语音
开源
Diffusion
Tokenizer-Free
MiniCPM
多语言
语音克隆
Rust 进军 MCU 嵌入式领域:ST 官方案例深度剖析与从零实战指南
编程
Rust 进军 MCU 嵌入式领域:ST 官方案例深度剖析与从零实战指南
2026-05-25 06:22:00 +0800 CST
view 246
基于 ST 官方 IoT 案例研究,深度剖析 Rust 在微控制器领域的实战表现,含完整代码示例和性能优化指南
Rust
嵌入式
MCU
ST
Arm
no_std
Embassy
AtomCode深度实战:用Rust重构终端AI编码助手,鸿蒙PC开发迎来新纪元
编程
AtomCode深度实战:用Rust重构终端AI编码助手,鸿蒙PC开发迎来新纪元
2026-05-21 17:23:11 +0800 CST
view 625
深度剖析AtomCode终端AI编码助手的技术架构与实战用法,涵盖Rust底层实现、Agent Loop机制、21个内置工具、鸿蒙PC原生适配,以及与Claude Code的对比分析。
Rust
AI编码
鸿蒙PC
AtomCode
终端工具
VSCode 2026 Agent Runtime 深度解析:IDE 原生多智能体协同开发架构从零到一
编程
VSCode 2026 Agent Runtime 深度解析:IDE 原生多智能体协同开发架构从零到一
2026-06-01 18:25:03 +0800 CST
view 224
深入解析 VSCode 2026 原生 Agent Runtime 架构:ACP 协议、Intent Bus、WASM 沙箱、RAG-Augmented 工作流与生产级性能优化实践。
VSCode
多智能体
Agent Runtime
ACP协议
WASM
Intent Bus
AI编程
IntelliJ IDEA 2026.1 深度解析:IDE 的战略升维——从代码编辑器到 AI Agent 开放平台
编程
IntelliJ IDEA 2026.1 深度解析:IDE 的战略升维——从代码编辑器到 AI Agent 开放平台
2026-05-09 23:43:15 +0800 CST
view 413
IntelliJ IDEA 2026.1深度解析:ACP协议开放AI Agent平台、Codex/Cursor/Claude多Agent协作、Spring运行时洞察、Java 26首日支持、虚拟线程调试工具链等核心新特性全剖析
IntelliJ IDEA
JetBrains
Java
Kotlin
AI Agent
ACP协议
IDE
编程工具
Spring
虚拟线程
LLM推理框架2026选型完全指南:从vLLM到TensorRT-LLM,一次讲透四大引擎的架构哲学与生产级实战
编程
LLM推理框架2026选型完全指南:从vLLM到TensorRT-LLM,一次讲透四大引擎的架构哲学与生产级实战
2026-06-02 09:36:52 +0800 CST
view 284
从vLLM到TensorRT-LLM,一次讲透vLLM、SGLang、TensorRT-LLM、llama.cpp四大LLM推理框架的架构哲学、核心原理、生产级部署实战与选型决策树。
LLM
vLLM
TensorRT-LLM
llama.cpp
SGLang
推理优化
GPU
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
编程
oMLX 深度实战:当 Apple Silicon 遇见本地大模型推理——从 MTP 加速到分层 KV 缓存的生产级完全指南(2026)
2026-06-16 16:46:05 +0800 CST
view 204
深度解析 2026 年 Apple Silicon 本地大模型推理技术栈:从 llama.cpp 量化体系到 oMLX 分层 KV 缓存架构,从 MTP 加速到 CoreAI 全栈指南,包含实测 Benchmark 与生产级部署方案。
Apple Silicon
MLX
llama.cpp
oMLX
MTP
本地大模型
量化
本地推理
Hermes Agent 深度实战:当 AI 学会自我进化——从 GEPA 遗传算法到三层记忆架构、从 ACP 协议到生产级部署的完全指南(2026)
编程
Hermes Agent 深度实战:当 AI 学会自我进化——从 GEPA 遗传算法到三层记忆架构、从 ACP 协议到生产级部署的完全指南(2026)
2026-06-22 05:53:50 +0800 CST
view 28
深度解析 Hermes Agent 自进化 AI 框架:GEPA 遗传算法、三层记忆架构、ACP 协议、生产级部署实战,附完整代码示例。
Hermes Agent
AI Agent
自进化
GEPA
Nous Research
ACP协议
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
编程
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
2026-06-11 00:19:05 +0800 CST
view 167
全面解析 llama.cpp 推理引擎,从 GGUF 格式、量化原理、架构设计到跨平台部署,提供生产级代码实战和性能优化指南。
llama.cpp
GGUF
量化
端侧推理
大语言模型
VoxCPM2:无分词 Tokenizer-Free 语音合成——从架构革命到工程落地的完整指南
编程
VoxCPM2:无分词 Tokenizer-Free 语音合成——从架构革命到工程落地的完整指南
2026-04-19 14:46:06 +0800 CST
view 716
深度解析面壁智能开源的VoxCPM2:2B参数、Tokenizer-Free连续空间生成、236万小时训练数据、RTF 0.13、8GB显存可跑,30语言支持。包含架构分析、代码实战、性能优化指南。
语音合成
TTS
VoxCPM2
面壁智能
AI音频
Rust 杀入 CPython 腹地:Python 3.16 背后那场静悄悄的底层革命——从 FFI 边界到构建系统的全链路深度拆解
编程
Rust 杀入 CPython 腹地:Python 3.16 背后那场静悄悄的底层革命——从 FFI 边界到构建系统的全链路深度拆解
2026-05-23 08:54:29 +0800 CST
view 336
Rust即将进入CPython官方解释器——Python 3.16背后从FFI边界设计到构建系统工程的全面深度拆解,含PyO3实战与性能优化
Python
Rust
CPython
PyO3
Rust 改造 CPython 全链路实战:从 FFI 边界设计到 PyO3 内部机制,拆解 Python 3.16 底层重构的每一个技术细节
编程
Rust 改造 CPython 全链路实战:从 FFI 边界设计到 PyO3 内部机制,拆解 Python 3.16 底层重构的每一个技术细节
2026-05-01 02:25:15 +0800 CST
view 362
深度拆解 Rust for CPython 项目的 FFI 边界设计、构建系统集成、PyO3 内部机制和模块迁移实战
Rust
Python
CPython
PyO3
FFI
内存安全
MiniCPM-o 2.6 深度解析:8B参数如何在iPad上跑出GPT-4o级全模态性能——端侧多模态大模型的工程化突破
编程
MiniCPM-o 2.6 深度解析:8B参数如何在iPad上跑出GPT-4o级全模态性能——端侧多模态大模型的工程化突破
2026-05-11 01:50:57 +0800 CST
view 372
深入解析MiniCPM-o 2.6:8B参数如何在iPad上实现GPT-4o级全模态性能,时分复用TDM机制、端到端架构、低延迟并发处理的技术内幕,附完整部署代码和性能优化实战
AI,MiniCPM,多模态,端侧模型,面壁智能
Spring Boot 4.1.0 深度实战:虚拟线程默认开启、原生 gRPC 加持、连接池反直觉陷阱——从架构升级到生产调优的完全指南(2026)
编程
Spring Boot 4.1.0 深度实战:虚拟线程默认开启、原生 gRPC 加持、连接池反直觉陷阱——从架构升级到生产调优的完全指南(2026)
2026-06-22 17:54:04 +0800 CST
view 37
Spring Boot 4.1.0 深度实战指南:虚拟线程默认开启、原生 gRPC 自动配置、LazyConnection 连接池惰性获取等新特性详解,附 3.x 到 4.1 完整迁移路径和真实压测数据。
Spring Boot 4.1
Spring Framework 7
Virtual Threads
gRPC
HikariCP
Java 21
性能优化
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 1355
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
从140GB到4GB:AirLLM无量化层间推理原理深度剖析与生产级部署实战(2026)
编程
从140GB到4GB:AirLLM无量化层间推理原理深度剖析与生产级部署实战(2026)
2026-06-22 19:28:19 +0800 CST
view 28
深入解析 AirLLM 的无量化层间 Offloading 技术原理,探讨如何通过 CPU-GPU 混合推理在 4GB 显存上运行 70B 大模型,附完整代码实战与生产部署指南。
LLM推理
GPU优化
CPU Offload
层间调度
AirLLM
PyTorch
编程
TIME_WAIT状态的连接过多导致系统端口资源耗尽问题
2024-11-17 21:27:27 +0800 CST
view 3341
本文讨论了如何优化Linux系统中的TIME_WAIT状态,使用netstat命令查看TCP连接状态,并通过修改/etc/sysctl.conf文件中的相关参数来减少TIME_WAIT套接字的数量。具体参数包括开启SYNCookies、重用TIME-WAITsockets、快速回收TIME-WAITsockets等,最后通过执行/sysctl-p命令使修改生效。
Linux
网络优化
TCP配置
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
编程
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
2026-04-20 22:53:28 +0800 CST
view 974
复旦大学OpenMOSS团队开源的0.1B参数多语言TTS模型,纯CPU运行、支持零样本语音克隆、48kHz双声道、20种语言、流式推理,MacBook Air单核即可流畅运行
TTS
语音合成
语音克隆
AI
开源
CPU推理
OpenMOSS
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 683
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
Python 3.14 深度解析:Tail-call 解释器、JIT 编译器与解释器架构的范式跃迁
编程
Python 3.14 深度解析:Tail-call 解释器、JIT 编译器与解释器架构的范式跃迁
2026-05-12 03:43:26 +0800 CST
view 324
Python 3.14 引入了 tail-call 解释器(3-5% 提速)、实验性 JIT 编译器、增量 GC、多解释器标准库支持(PEP 734)、模板字符串(PEP 750)、延迟注解评估(PEP 649/749)、Zstandard 标准库支持(PEP 784)等核心改进
Python
CPython
JIT编译器
性能优化
QtScrcpy:27.6K Star 的跨平台 Android 同屏神器,无需 Root
编程
QtScrcpy:27.6K Star 的跨平台 Android 同屏神器,无需 Root
2026-05-12 06:53:26 +0800 CST
view 316
QtScrcpy是一款跨平台Android设备投屏与控制工具,支持Windows/macOS/Linux,低延迟30-70ms,高帧率30-120fps,无需root,支持USB/网络连接,27.6K+ GitHub Stars。
QtScrcpy
Android同屏
跨平台
开源工具
屏幕镜像
NVIDIA Vera CPU 深度实战:首款 Agentic AI 原生 CPU 架构解析(2026)
编程
NVIDIA Vera CPU 深度实战:首款 Agentic AI 原生 CPU 架构解析(2026)
2026-06-18 16:29:37 +0800 CST
view 88
深度解析 NVIDIA 首款 Agentic AI 原生 CPU——Vera CPU 的架构设计、Olympus 核心创新、统一内存架构、CPU-GPU 协同方案,并提供 Python/Go 代码实战示例。
NVIDIA
Vera CPU
Agentic AI
Olympus架构
FP8
NVLink-C2C
Rubin GPU
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
2026-06-05 04:13:34 +0800 CST
view 202
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
12
13
14
15
下一页