Measure Zero


  • About

  • Quotes

  • Notes

  • Sitemap

  • Search

Harness Cheatsheet

2026-04-13 | ~ | LLM

Harness 从字面来看是指为确保模型按预期行为运行而构建的约束框架与支撑体系. 至少可以从两个角度理解.

  • 产品侧: Agent 产品 (如 Claude Code) 自己做的 harness (Anthropic 在 Scaling Managed Agents 进一步把有关大模型决策的部分称为 harness, 而 session, tools, sandbox 等独立为其他模块).
  • 用户侧: 开发者使用 coding agent 时为了保证复杂项目受控做的脚手架 (比如 SDD, ralph loop 等).

随着模型能力变化, harness 也需要改变, 如 Harness design for long-running application development.

用户侧 cheatsheet

维度 实践动作 核心目的
开发流 SDD (规格驱动) / TDD (测试驱动)  
上下文 CLAUDE.md / AGENTS.md 提供项目结构, 开发流程与 Dos/Don’ts 约束
文档同步 文档代码同步  
状态控制 进度状态记录 / 会话交接文档 确保新 session 无缝衔接
原子性 一次一任务 / 频繁 git 提交 降低任务难度, 方便回滚与审计
验证 独立 reviewer / 自动测试 确保 Agent 输出符合验收标准

更多参考可见

  • Learn Harness Engineering
  • Awesome Harness Engineering
Read more »

读 Claude Code 源码 - memory 机制续篇

2026-04-13 | ~ | LLM

书接上回, 增补 Auto Memory 保存和召回细节; 以及介绍 auto-dream.

Read more »

读 Claude Code 源码 - Web Search & Web Fetch

2026-04-05 | ~ | LLM

WebSearch 调用服务端的搜索工具, WebFetch 本地抓 URL、HTML 转 markdown、再交给一个小模型按 prompt 提炼.

Read more »

读 Claude Code 源码 - memory 机制

2026-04-03 | ~ | LLM

分为 Session Memory和 Auto Memory (跨 session).

Read more »

读 Claude Code 源码 - 上下文压缩策略

2026-04-01 | ~ | LLM

若干层压缩.

Read more »

Agent 实践杂录

2025-10-17 | ~ | LLM

2025 年大家都忙着搞 agent. 下面分类是随便分的.

  • antirez. 2026-01. Don’t fall into the anti-AI hype
Read more »

RAG 简要回顾

2025-10-07 | ~ | LLM

2025 年大家都忙着开发 agent, 这里简要回顾一下 RAG.

RAG 基本操作

  • Offline: 文件解析, 文本切片, embedding (以前通常用 bge)
  • 对 query embedding 后做召回 (通常就算个 cos, chunk 量大时用向量数据库牺牲一定精度加速召回)
  • Rerank (通常是 bge-reranker)

这套早在 2023 年就玩烂了.

  • 基本的 “进阶” 操作可见 NisaarAgharia/Advanced_RAG, 以及 NirDiamant/RAG_Techniques
  • 这是一篇很好的综述: 【同济大学 王昊奋】Agentic RAG 时代
  • 另外可以参考一些 字节跳动 RAG 实践手册 将 RAG 分为数据层, 索引层, 检索层, 生成层.
Read more »

读代码: Cherry Studio 联网搜

2025-09-30 | ~ | LLM

非常粗糙.

如果同时开启知识库和联网搜 (searchOrchestrationPlugin.ts), 则用 SEARCH_SUMMARY_PROMPT 做意图分析和 query 改写. 简单地把两种搜索的结果拼接起来 (不会混起来重排), index 加上偏移量避免重叠. 如果设置了召回 memory 也会拼在后面.

联网搜分为两种:

  • 一种是 local search (见 LocalSearchProvider.ts), 直接解析 SERP (比如 https://www.google.com/search?q=%s). 免费.
  • 另一种就是调搜索 API, 比如 Tavily.

访问搜索引擎以及 fetch url 内容都是通过 Electron 在后台打开不可见的浏览器窗口加载指定的 url.

window.api.searchService.openUrlInSearchWindow(uid, url)

类似白嫖搜索引擎的项目还有比如 duckduckgo-mcp-server 以及 open-webSearch. 不清楚是否合规.

Read more »

用 Pydantic 自动生成 LLM Tool Schema

2025-09-14 | ~ | LLM

简单小工具.

定义 tool 参数后, 不引入其他库, 仅用 Pydantic 自动生成符合 OpenAI 规范的 Tool Schema. 想法很简单, 把 Pydantic 的 model_json_schema 生成的 JSON Schema 处理成 OpenAI 规范即可.

好处是 (1) 不用引入或依赖其他乱七八糟的库; (2) 不用手动额外维护一套工具描述; (3) 能利用 Pydantic 的一些功能, 从 JSON string load 之后自动校验参数, 自动转换类型等.

Read more »

难倒各路大模型的两道简单 SQLite 问题

2025-05-05 | ~ | Tech

问题描述以及示例 prompt 如下


你是 SQLite 专家, 请完成下面两个问题.

  1. 用 SQLite 写一个 query, 根据 “now” 获得当地时间今日零点的 unix 时间戳. 注: “当地” 指执行 SQL 的机器的系统时区, “今日” 指当地日期的今日.

例: 若 now 为 ‘2025-05-05 04:00:00+08:00’, 则返回 ‘2025-05-05 00:00:00+08:00’. (假设当地时区为 UTC+8)

  1. 用 SQLite 写一个 query, 根据 “now” 获得上周的周一的日期. 假设周一为一周的开始, 全程只在 UTC 时间考虑问题 (不用考虑时区).

例: 若 now 为 ‘2025-05-05’ 周一, 则返回 ‘2025-04-28’. 若 now 为 ‘2025-05-04’ 周日, 则返回 ‘2025-04-21’.

Read more »
1 2 … 19
Shiina

Shiina

知乎 豆瓣 bangumi Instagram Weibo
Creative Commons
RSS
© 2019 - 2026   Shiina   CC BY-NC-ND 4.0
RSS  
Powered by Jekyll
 
Theme NexT.Mist