adopt B200 一半时间在等内存:一篇 160 页的 LLM 推理效率教程讲了什么 精读 Alex Smola 的 LLM 推理效率教程,从硬件到 KV 压缩,提炼核心结论和量化直觉。 2026-06-11 LLM推理教程精读
adopt 工具装多了,内存告急——我给 pi 加了个「管家」 两层服务管理方案:手动 manage_services 工具 + 自动 memory-guard 脚本,解决本地模型内存占用问题。 2026-06-06 AI Agent基础设施
trial DeepSeek V4 推理能力拉满,但它是个「睁眼瞎」 用本地 Qwen3-VL 视觉模型补上 DeepSeek V4 缺失的视觉能力,实现推理+视觉的模型组合。 2026-06-05 AI Agent视觉理解
trial 我把声音克隆配音接进了 AI 助手,现在它能直接出视频 用 VoxCPM 本地声音克隆模型实现口播稿→配音+打字机字幕视频的全自动流水线,支持多规格输出和音频复用。 2026-06-04 AI Agent声音克隆
trial 又往 AI 助手里塞了一个工具:现在它能帮我出小红书配图了 把 gpt-image-2 图片生成 API 接进 pi,在对话中一句话出图,不再切换软件。 2026-06-03 AI Agent生图
trial 我把本地语音识别接进了 AI 编程助手,全程踩坑实录 把阿里开源的 SenseVoice 语音识别模型接进 pi,实现本地一键转录,附两个关键 bug 修复。 2026-06-02 AI Agent语音识别
adopt 我在用一个 AI 助手,它可以随时塞进新工具 介绍 pi coding agent:模型无关、工具开放、本地优先的 AI agent 平台,后续系列文章的起点。 2026-06-01 AI Agent工具扩展