Yohei Nakajima 投后工具完整研究 digest——一个 GP 自己搭的 portfolio dashboard 怎么搭的

本地研究报告 · Original

这是一份精读风格的研究 digest。完整 research 报告见 Learning/Research/2026-05-02-Yohei投后工具完整研究.md。

核心问题

2026 年 4 月 28 日，Yohei Nakajima（Untapped Capital GP，BabyAGI 作者）发了 Q1 LP AI Session thread，第一次系统讲他用 AI 给自己搭的投后监控工具。「深思 SenseAI」转述时点出：「前半段趋势播报大多数关注 AI 的人都点头，后半段他展示的内部工具才是这个 thread 最实在的东西。」

这次研究回答四件事：(1) 这套工具到底有哪些功能；(2) 设计原则背后的哲学是什么；(3) 技术栈具体怎么搭的；(4) 个人投资者要在国内场景复刻，路线图是什么样。

五条核心 takeaways

元原则：信任 = 可纠正而非完美。所有具体设计（Ignore 按钮 / Freshness Score / 原文留底 / Check-in 用数据开头 / 归一化双轨）都是这条原则的不同投影。这条原则是 2023 年 Mini Yohei 时代成型的，2026 Q1 只是它在新工具里的可视化落地。
架构选型：单 LLM loop + 动态 skills + SQLite 事件流。不要上 multi-agent supervisor / LangGraph / n8n。Yohei 自己说”simpler is better”。
粘合层选型：Composio 是关键。比自己写各 SaaS SDK 减少 5-10 倍工程量，OAuth 全托管。
抽取 schema 三件套：extracted_value + source_quote + source_event_id。归一化让 LLM 抽取时直接做、不要再写后处理。
不要过早优化：Freshness Score v1 用 now - last_update 单字段够；Ignore v1 用本地 flag 够；intro 自动化别先做（Yohei 自己 4 年还在 manual）。

工具功能全景

数据源是三件套：Attio (CRM) + Gmail + Granola (会议纪要)。每条新 email / 会议笔记进来立刻触发抽取，不是定时批跑。

总览表 10 列：revenue / monthly burn / runway / cash in bank / total raise / current raise status / # interactions / # intros made / sentiment / data freshness score。约 69 家 portfolio 公司，可任意列排序。

单公司页双视图：

概览页 = 财务 + KPI 分析（系统判断不只是数字）+ Asks + Wins + Challenges + 完整 timeline
数据点溯源页 = 每条数据点带「收到日期 + 来源邮件/笔记 + 原始措辞 + 归一化双轨 + Ignore 按钮」

三个 Dashboard：Fundraise（谁缺弹药）/ Engagement（VC 时间分配）/ Cumulative Annualized Revenue（基金组合累计年化收入曲线）。

Check-in Campaign：自动生成季度邮件，正文嵌入「我们已知数据 + 收到时间 + 你的 freshness 百分位」。首轮 response rate 42%。

Asks 自动归类：顶层 75% 是 access-to-people 类（注意：4/13 严格细分只有 35-46%，75% 是把 partnerships / scheduling / hiring / pr 都算”广义 access”——研究中引用要分清营销口径 vs 技术口径）。

运营成本：$500-1000/月跨所有 AI 工具（含 Claude Max / ChatGPT Pro 订阅）。

设计哲学时间溯源

最反直觉的发现：Yohei 的设计原则不是 Q1 thread 突然冒出来的，是 2023 Mini Yohei 时代复利出来的。

2023 已成型：AI 作为粘合剂（Zapier+Airtable 时代）/ “AI 输出永远 cc 自己”/ 纠正即训练数据 / Build-in-Public
2025 升级：Opinionated Ontology（GPT VC Associate 已经在做，2026 Q1 借 Claude Design 命名）/ Forward email → 指标抽取（updates@untapped）
2026 Q1 新增可视化：Ignore 按钮 / Freshness Score / Check-in 用数据开头 / 归一化双轨保留原文

把”信任 = 可纠正而非完美”作为根，所有其他原则都是它的投影：Ignore 按钮（事后纠正）、Freshness Score（自我标注不可信度）、保留原始措辞（让人能去对原始证据）、Check-in 用数据开头（让 founder 来纠正过期数据）、归一化双轨（不替换原始记录、并存 derived）。

还有一条容易被忽略的元原则——Yohei 自己说”Many died when models deprecated. I don’t fix all of them.”——工具迭代节奏 > 工具持久性。这对”要不要在投后工具上长期投入”是关键 reframe。

实现栈推断（high confidence）

Yohei thread 没说编排层用了什么，但基于他公开陈述 + babyagi3 公开 repo 可以高 confidence 推断：

层	选型	confidence
LLM	Anthropic Claude 优先	high
编排框架	基于 babyagi3 的单 LLM loop + 动态 skills	high（哲学层）/ medium（代码复用比例）
工具接入层	Composio	confirmed（他公开多次说”switched to Composio for everything”）
数据库	SQLite events + entities + summaries	medium-high
检索	FTS5 + sqlite-vec hybrid	medium-high
部署	Replit	confirmed（“just vibe’d on replit”）
触发	定时 polling（cron），不是 webhook	medium

锁死推断的三条 Yohei 原话：

2025-03：“switched to Composio for everything”
2026-01：“single LLM loop that has access to the 250+ composio tools, with fallback to writing/updating new skills”
2026-02：“skills on top of @attio skills that use @composio”

最不可能的候选：LangGraph、n8n、OpenAI Agents SDK——他从未在公开陈述里提及做编排层。

复刻 playbook（个人 portfolio 场景，国内栈）

国内等价栈推荐：飞书多维表格（CRM）+ Gmail/原邮箱不动 + 通义听悟（会议纪要）+ Claude Agent SDK + 自写 100 行 Python + macOS launchd cron。

两周 v1——让抽取跑起来：飞书多维表格 1 张 portfolio + 1 张 events 表，Gmail + 通义听悟抽取，Python cron 每 30 分钟跑一次，Claude Agent SDK 调用，先不做 UI。

两个月 v2——加上呈现层：飞书多维表格的「记录详情」+「关联表」+「仪表盘」视图本身就够，Ignore 按钮 = ignored: bool 一列，Freshness Score = cron 每天计算 percentile。

半年 v3——反馈闭环：手动审 50+ 封后再开 check-in 自动发；Asks 自动归类等积累 100+ 真实 ask；Ignore 累积每月人工 review 写回 prompt。

反模式（不要做）：自己写 SaaS SDK / 先上 LangGraph n8n / 多 agent supervisor / webhook 推送 / 加权 freshness 算法 / v1 自动发邮件 / intro 自动化 / 100% 复制 Yohei 字段表。

对立视角：可复刻 vs 不可复刻

技术栈复刻不等于价值复刻。最强反方排序：

(1+5) Yohei = 个人 workflow + AI-native 工程能力杂交体——他不是普通 GP 也不是普通工程师，2022 年 Zapier+OpenAI API 起步，BabyAGI 之前已积累一年。他的工具不是工具，是他个人 workflow 的物化，外包给工程师做也救不回来——反馈闭环在 GP 自己每天的使用里。
Untapped 体量正好合适——~$9.5M Fund I + ~36 笔投资 + pre-seed 单笔——这是这套 stack 的 sweet spot，growth fund / FoF 不能直接套。
Build-in-Public 反向飞轮——BabyAGI 的曝光直接转化为 LP narrative + 社区免费 review + portfolio 主动接洽，普通 GP 没有这个杠杆。
合规雷区（机构基金、不适用 Justin）——SEC 2026 priorities + Reg S-P + PIPL，对 Justin 个人 portfolio 场景影响不大，但未来上机构层级要重新评估。
AI 抽取的隐性失效——Yohei thread 没披露 precision/recall，scale 到 200+ portfolio 或多语种时”静默 false negative”（漏掉一个 ask）的 cost 是真金白银的关系折损。

复刻者的真实交付物不是代码，是反馈闭环 SOP——每天点哪几次、每周看哪个 dashboard、每月调哪几条 prompt、每季度发 check-in。报告里如果只给代码 playbook 不给”如何形成反馈闭环”的指引，复刻者大概率失败。

三件最值得记住的事

元原则：信任 = 可纠正而非完美。这条是 2023 Mini Yohei 时代成型的，不是 2026 Q1 拐点
栈选型铁律：单 LLM loop + Composio（或国内等价）+ SQLite + Replit/cron。不要先上 multi-agent / LangGraph / n8n
真实交付物：复刻这套的不是代码，是反馈闭环 SOP

完整 research 报告（含 33 个 source、子代理证据链、open questions、置信度矩阵）见 Learning/Research/2026-05-02-Yohei投后工具完整研究.md。