【机翻】语音智能体基础 101:能够与人对答的 AI 背后的架构
|
~
|
LLM
【机翻】大多数 AI 产品不应该推出记忆功能
|
~
|
LLM
读下来感觉尬吹 Hermes. 其实作者讲的 memory 的点 Claude Code 早就做到了. 作者对 CC memory 的逆向工程是去年做的, 不是基于泄露的代码.
关于 AI 产品是否需要推出记忆功能的决策点可以参考.
读 Claude Code 源码 - 若干小功能 (recap, suggestion, insights)
|
~
|
LLM
小功能 away recap, prompt suggestion, insights.
去年遇到的一个正则的坑
|
~
|
Tech
去年排查过一个性能问题. 一个包含很多正则替换的函数, 在处理几十万字符长度的文本时, 跑了 10 秒才完成. 最后定位到问题正则形式如下:
\s*xyz blahblah
几年前排查过 灾难性回溯 问题, 但这个正则的结构其实完全没有相关特征. 如果真的是灾难性回溯, 处理几十万字符的字符串早就卡死了, 而不是只跑 10 秒.
最后解决方案是先用
xyz blahblah
找 match, 再处理 leading spaces. 时延是毫秒内.
如何评估 skill
|
~
|
LLM
Langchain 团队如何评估与优化 agent harness
|
~
|
LLM
Harness Cheatsheet
|
~
|
LLM
源于一个比喻, 模型是 horse, 人是 rider, 中间那层是 harness. 从字面来看 harness 是指为确保模型按预期行为运行而构建的约束框架与支撑体系. 至少可以从两个角度理解.
- 产品侧: Agent 产品 (如 Claude Code) 自己做的 harness (Anthropic 在 Scaling Managed Agents 进一步把有关大模型决策的部分称为 harness, 而 session, tools, sandbox 等独立为其他模块).
- 用户侧: 开发者使用 coding agent 时为了保证复杂项目受控做的脚手架 (比如 SDD, ralph loop 等).
随着模型能力变化, harness 也需要改变, 如 Harness design for long-running application development.
读 Claude Code 源码 - memory 机制续篇
|
~
|
LLM
书接上回, 增补 Auto Memory 保存和召回细节; 以及介绍 auto-dream.
读 Claude Code 源码 - Web Search & Web Fetch
|
~
|
LLM
WebSearch 调用服务端的搜索工具, WebFetch 本地抓 URL、HTML 转 markdown、再交给一个小模型按 prompt 提炼.