Measure Zero

【机翻】语音智能体中的记忆问题比你想象的更难

2026-05-18 | ~ | LLM

Memory in Voice Agents Is a Harder Problem Than You Think

【机翻】语音智能体基础 101：能够与人对答的 AI 背后的架构

2026-05-18 | ~ | LLM

Voice Agents 101: The Architecture Behind AI That Talks Back

【机翻】大多数 AI 产品不应该推出记忆功能

2026-05-17 | ~ | LLM

读下来感觉尬吹 Hermes. 其实作者讲的 memory 的点 Claude Code 早就做到了. 作者对 CC memory 的逆向工程是去年做的, 不是基于泄露的代码.

关于 AI 产品是否需要推出记忆功能的决策点可以参考.

Reverse Engineering ChatGPT, Claude, OpenClaw, and Hermes Convinced Me Most AI Products Shouldn’t Ship Memory

读 Claude Code 源码 - 若干小功能 (recap, suggestion, insights)

2026-05-17 | ~ | LLM

小功能 away recap, prompt suggestion, insights.

去年遇到的一个正则的坑

2026-05-03 | ~ | Tech

去年排查过一个性能问题. 一个包含很多正则替换的函数, 在处理几十万字符长度的文本时, 跑了 10 秒才完成. 最后定位到问题正则形式如下:

\s*xyz blahblah

几年前排查过灾难性回溯问题, 但这个正则的结构其实完全没有相关特征. 如果真的是灾难性回溯, 处理几十万字符的字符串早就卡死了, 而不是只跑 10 秒.

最后解决方案是先用

xyz blahblah

找 match, 再处理 leading spaces. 时延是毫秒内.

如何评估 skill

2026-05-01 | ~ | LLM

Langchain 团队如何评估与优化 agent harness

2026-04-28 | ~ | LLM

Harness Cheatsheet

2026-04-13 | ~ | LLM

源于一个比喻, 模型是 horse, 人是 rider, 中间那层是 harness. 从字面来看 harness 是指为确保模型按预期行为运行而构建的约束框架与支撑体系. 至少可以从两个角度理解.

产品侧: Agent 产品 (如 Claude Code) 自己做的 harness (Anthropic 在 Scaling Managed Agents 进一步把有关大模型决策的部分称为 harness, 而 session, tools, sandbox 等独立为其他模块).
用户侧: 开发者使用 coding agent 时为了保证复杂项目受控做的脚手架 (比如 SDD, ralph loop 等).

随着模型能力变化, harness 也需要改变, 如 Harness design for long-running application development.

读 Claude Code 源码 - memory 机制续篇

2026-04-13 | ~ | LLM

书接上回, 增补 Auto Memory 保存和召回细节; 以及介绍 auto-dream.

读 Claude Code 源码 - Web Search & Web Fetch

2026-04-05 | ~ | LLM

WebSearch 调用服务端的搜索工具, WebFetch 本地抓 URL、HTML 转 markdown、再交给一个小模型按 prompt 提炼.