程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
编程
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
2026-04-11 10:24:48 +0800 CST
view 596
深度解析 Apple Silicon 上的视觉语言模型推理引擎 MLX-VLM,涵盖架构设计、模型支持、性能优化与实战部署。
Apple Silicon
MLX
视觉语言模型
VLM
Mac本地AI
多模态推理
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 224
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
资讯
商城APP开发费用解析:如何判断报价是否合理?
2024-11-19 01:02:48 +0800 CST
view 1625
本文分析了商城APP开发费用的影响因素,包括功能复杂度、开发方式、开发团队选择、设计与用户体验、后期维护等。提供了判断开发报价合理性的参考,强调源码交付和功能扩展的重要性。企业在开发前应明确需求,了解报价细节,以确保合理预算和高质量交付。
APP开发
软件开发
移动互联网
定制软件开发
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 552
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
编程
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
2026-05-18 06:15:03 +0800 CST
view 310
Redis之父antirez开源ds4.c项目深度解析:用纯C语言在MacBook上运行284B参数大模型,不对称2-bit量化、KV缓存磁盘化、OpenAI/Anthropic API兼容,打造首个真正的本地Agent推理后端
AI推理
本地大模型
Redis
Apple Silicon
DeepSeek
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
2026-06-05 04:13:34 +0800 CST
view 104
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
2026-06-05 04:13:52 +0800 CST
view 141
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
资讯
定制开发一个App到底需要多少钱?
2024-11-19 01:06:47 +0800 CST
view 1673
定制开发App的成本受多种因素影响,包括功能复杂度、设计要求、开发团队、开发周期、测试与质量保证、维护与更新及市场推广。开发流程包括需求分析、UI/UX设计、开发、测试及上线审核。定制开发的优势在于精确满足需求、独特用户体验、性能优化、安全保障、易于维护和高投资回报。团队由营销专家、设计师和工程师组成,致力于提供优质服务。
App开发
定制开发
用户体验
市场推广
技术服务
百度秒哒App上线:手机上对话就能搓出一个APP,从想法到安装包全链路搞定
编程
百度秒哒App上线:手机上对话就能搓出一个APP,从想法到安装包全链路搞定
2026-05-14 12:49:04 +0800 CST
view 340
百度秒哒在Create 2026推出App版,手机对话即可生成可安装APP,从需求文档到打包签名发布全链路AI搞定,8岁小朋友用对话搓出拼伞小程序,普通人的创造力被AI解锁。
AI编程
百度秒哒
Vibe Coding
无代码
App开发
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
编程
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
2026-05-19 12:42:27 +0800 CST
view 203
2026年,边缘AI不再只是云端模型的精简版。本文深入剖析DeepSeek-R1 CPU版的技术原理,从模型蒸馏、量化技术的底层原理到生产环境的完整部署方案,提供可直接落地的代码和可量化的性能数据。
DeepSeek
R1
边缘计算
AI推理
模型蒸馏
量化
llama.cpp
Ollama
端侧AI
Lightpanda 深度实战:18K+ Star 的 Zig 语言无头浏览器——从零构建到 AI Agent 原生集成的全链路架构解析
编程
Lightpanda 深度实战:18K+ Star 的 Zig 语言无头浏览器——从零构建到 AI Agent 原生集成的全链路架构解析
2026-05-07 20:06:57 +0800 CST
view 269
深入解析 Lightpanda 浏览器:用 Zig 从零构建的 AI 专用无头浏览器,内存仅 Chrome 的 1/16,速度快 9 倍,原生支持 CDP 和 MCP 协议。
浏览器
Zig
AI自动化
无头浏览器
爬虫
CDP
Puppeteer
oMLX 深度解析:Apple Silicon 原生的本地大模型推理服务器——从分层 KV 缓存到菜单栏级 AI 编码伴侣
编程
oMLX 深度解析:Apple Silicon 原生的本地大模型推理服务器——从分层 KV 缓存到菜单栏级 AI 编码伴侣
2026-05-21 22:30:11 +0800 CST
view 254
深入解析 oMLX 的分层 KV 缓存架构(热 RAM + 冷 SSD)、Copy-on-Write 优化、与 Claude Code 的深度集成,以及 Apple Silicon 原生的推理性能优化。
oMLX
Apple Silicon
本地大模型
KV缓存
MLX
推理服务器
Apple CoreCrypto 开源深度解析:后量子密码学的形式化验证革命
编程
Apple CoreCrypto 开源深度解析:后量子密码学的形式化验证革命
2026-05-31 09:25:15 +0800 CST
view 161
深度解析 Apple CoreCrypto 后量子密码学开源实现,包括 ML-KEM、ML-DSA 算法的架构设计、形式化验证方法论,以及生产环境落地指南。
密码学
安全
Apple
后量子
形式化验证
Gemma MacOS Tuner 深度解析:在 Apple Silicon 上用 PyTorch 和 MPS 高效微调多模态 Gemma
编程
Gemma MacOS Tuner 深度解析:在 Apple Silicon 上用 PyTorch 和 MPS 高效微调多模态 Gemma
2026-04-09 01:14:39 +0800 CST
view 774
详解 gemma-tuner-multimodal 项目:在 Apple Silicon 上通过 PyTorch MPS 后端对 Google Gemma 系列模型进行 LoRA 微调,支持文本、图像、音频三种模态,完全本地运行,数据不出机器,零 NVIDIA GPU 依赖。
Gemma
Apple Silicon
PyTorch
MPS
LoRA
微调
Machine Learning
VSCode 2026 Agent Runtime 深度解析:IDE 原生多智能体协同开发架构从零到一
编程
VSCode 2026 Agent Runtime 深度解析:IDE 原生多智能体协同开发架构从零到一
2026-06-01 18:25:03 +0800 CST
view 118
深入解析 VSCode 2026 原生 Agent Runtime 架构:ACP 协议、Intent Bus、WASM 沙箱、RAG-Augmented 工作流与生产级性能优化实践。
VSCode
多智能体
Agent Runtime
ACP协议
WASM
Intent Bus
AI编程
Go 1.24 深度解析:Swiss Tables 革新 map 性能、泛型类型别名解禁、weak 包登场
编程
Go 1.24 深度解析:Swiss Tables 革新 map 性能、泛型类型别名解禁、weak 包登场
2026-04-28 16:23:21 +0800 CST
view 283
深入解析 Go 1.24 重大更新:Swiss Tables 让 map 性能提升 20-30%、泛型类型别名八年解禁、weak 包和 runtime.AddCleanup 登场、FIPS 140-3 合规与后量子加密标准库支持。附完整代码示例与迁移指南。
Go
map
Swiss Tables
泛型
标准库
后量子
FIPS140
weak
runtime
crypto
Go 1.26 深度实战:Green Tea GC、new(expr)、Secret 模式与生产级迁移全链路解析
编程
Go 1.26 深度实战:Green Tea GC、new(expr)、Secret 模式与生产级迁移全链路解析
2026-05-09 07:37:34 +0800 CST
view 273
从生产环境视角深度解析 Go 1.26 全部核心特性:Green Tea GC 性能实测、new(expr) 语法实战、Secret 安全执行域、SIMD 向量计算、后量子加密 HPKE、goroutine 泄漏检测,以及完整的生产级迁移检查清单。
Go
GC
Green Tea
runtime
SIMD
HPKE
泛型
生产迁移
.NET 11 Preview 4 深度解析:Runtime-Async 革命、进程 API 重写与 AI 原生 SDK 的全面进化
编程
.NET 11 Preview 4 深度解析:Runtime-Async 革命、进程 API 重写与 AI 原生 SDK 的全面进化
2026-05-17 06:13:43 +0800 CST
view 300
.NET 11 Preview 4 深度解析:Runtime-Async 全面启用、Process API 从八步走简化到一行、MCP Server 模板内置 SDK、Blazor 五大改进、EF Core 向量搜索,配完整代码示例与性能优化建议
.NET
C#
Runtime-Async
MCP Server
Blazor
EF Core
Go 1.24 深度解析:Swiss Table 如何让 Map 性能提升 50%——从哈希表原理到 SIMD 优化实战
编程
Go 1.24 深度解析:Swiss Table 如何让 Map 性能提升 50%——从哈希表原理到 SIMD 优化实战
2026-04-12 13:56:41 +0800 CST
view 376
深入解析Go 1.24 runtime map的Swiss Table重构:哈希表演进史、SIMD加速原理、内存布局对比、实战性能数据,以及如何零成本获得33-50%的性能提升。
Go语言
性能优化
哈希表
SIMD
系统编程
Runtime
Deno 2.8 深度实战:import defer、6大新子命令与3.66x性能飞跃——2026 Deno生产级应用完全指南
编程
Deno 2.8 深度实战:import defer、6大新子命令与3.66x性能飞跃——2026 Deno生产级应用完全指南
2026-06-04 17:16:43 +0800 CST
view 95
2026年5月Deno发布2.8版本,带来6大新子命令、import defer语法、3.66x性能提升和76.4% Node.js兼容性。本文深入解析每个新特性并提供生产级实战代码。
deno,typescript,javascript,runtime,node.js,2026
Docker AI Toolkit 2026 深度解析:从镜像构建到推理服务,AI 工作流的全链路重构
编程
Docker AI Toolkit 2026 深度解析:从镜像构建到推理服务,AI 工作流的全链路重构
2026-05-14 01:55:02 +0800 CST
view 202
Docker AI Toolkit 2026于2026年3月1日发布,原生支持PyTorch 2.4、TensorFlow 2.17、ONNX Runtime 1.19一键构建,Sigstore签名+OIDC身份绑定防止供应链攻击,docker ai serve --adaptive自适应推理让GPU利用率稳定在80%,LLM微调延迟压至83ms,WASM沙箱让边缘AI应用启动时间<100ms。
Docker,AI Toolkit,PyTorch,TensorFlow,ONNX Runtime,模型签名验证,Sigstore,WASM沙箱,自适应推理
RuoYi-Vue-Plus:15.7K Star重写RuoYi,Sa-Token+多租户+WarmFlow工作流,企业后台标杆
编程
RuoYi-Vue-Plus:15.7K Star重写RuoYi,Sa-Token+多租户+WarmFlow工作流,企业后台标杆
2026-04-16 19:04:25 +0800 CST
view 504
RuoYi-Vue-Plus是dromara开源的15.7K Star多租户后台管理系统,重写RuoYi所有功能,集成Sa-Token鉴权、WarmFlow工作流和MyBatis-Plus,适合SaaS化企业应用。
Java
SpringBoot
RuoYi
多租户
工作流
SaaS
开源
Anthropic 收购 Bun 深度解析:AI 巨头掌控底层代码基建的战略棋局——从 Zig 到 Rust 的技术迁移全景
编程
Anthropic 收购 Bun 深度解析:AI 巨头掌控底层代码基建的战略棋局——从 Zig 到 Rust 的技术迁移全景
2026-05-09 23:08:31 +0800 CST
view 381
Anthropic以数亿美元收购JavaScript运行时Bun,解析AI巨头掌控底层代码基建的战略逻辑,以及Bun从Zig迁移到Rust的技术故事
Anthropic
Bun
JavaScript
AI
编程工具
开源
Rust
Zig
Claude Code
收购
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
编程
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
2026-05-28 15:44:20 +0800 CST
view 195
ASMR(Agentic Search and Memory Retrieval)在 LongMemEval 基准测试中以 99% 准确率刷新世界纪录,彻底颠覆传统 RAG 方案。本文深入解析 ASMR 的 Observer Agents、Search Agents、Memory Graph 三大核心组件,以及无向量数据库的实现原理。
ASMR
AI Agent
永久记忆
LongMemEval
Supermemory
RAG替代
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
46
下一页