Yohei Nakajima 投后工具完整研究 digest——一个 GP 自己搭的 portfolio dashboard 怎么搭的
这是一份精读风格的研究 digest。完整 research 报告见
Learning/Research/2026-05-02-Yohei投后工具完整研究.md。
核心问题
2026 年 4 月 28 日,Yohei Nakajima(Untapped Capital GP,BabyAGI 作者)发了 Q1 LP AI Session thread,第一次系统讲他用 AI 给自己搭的投后监控工具。「深思 SenseAI」转述时点出:「前半段趋势播报大多数关注 AI 的人都点头,后半段他展示的内部工具才是这个 thread 最实在的东西。」
这次研究回答四件事:(1) 这套工具到底有哪些功能;(2) 设计原则背后的哲学是什么;(3) 技术栈具体怎么搭的;(4) 个人投资者要在国内场景复刻,路线图是什么样。
五条核心 takeaways
- 元原则:信任 = 可纠正而非完美。所有具体设计(Ignore 按钮 / Freshness Score / 原文留底 / Check-in 用数据开头 / 归一化双轨)都是这条原则的不同投影。这条原则是 2023 年 Mini Yohei 时代成型的,2026 Q1 只是它在新工具里的可视化落地。
- 架构选型:单 LLM loop + 动态 skills + SQLite 事件流。不要上 multi-agent supervisor / LangGraph / n8n。Yohei 自己说”simpler is better”。
- 粘合层选型:Composio 是关键。比自己写各 SaaS SDK 减少 5-10 倍工程量,OAuth 全托管。
- 抽取 schema 三件套:
extracted_value+source_quote+source_event_id。归一化让 LLM 抽取时直接做、不要再写后处理。 - 不要过早优化:Freshness Score v1 用
now - last_update单字段够;Ignore v1 用本地 flag 够;intro 自动化别先做(Yohei 自己 4 年还在 manual)。
工具功能全景
数据源是三件套:Attio (CRM) + Gmail + Granola (会议纪要)。每条新 email / 会议笔记进来立刻触发抽取,不是定时批跑。
总览表 10 列:revenue / monthly burn / runway / cash in bank / total raise / current raise status / # interactions / # intros made / sentiment / data freshness score。约 69 家 portfolio 公司,可任意列排序。
单公司页双视图:
- 概览页 = 财务 + KPI 分析(系统判断不只是数字)+ Asks + Wins + Challenges + 完整 timeline
- 数据点溯源页 = 每条数据点带「收到日期 + 来源邮件/笔记 + 原始措辞 + 归一化双轨 + Ignore 按钮」
三个 Dashboard:Fundraise(谁缺弹药)/ Engagement(VC 时间分配)/ Cumulative Annualized Revenue(基金组合累计年化收入曲线)。
Check-in Campaign:自动生成季度邮件,正文嵌入「我们已知数据 + 收到时间 + 你的 freshness 百分位」。首轮 response rate 42%。
Asks 自动归类:顶层 75% 是 access-to-people 类(注意:4/13 严格细分只有 35-46%,75% 是把 partnerships / scheduling / hiring / pr 都算”广义 access”——研究中引用要分清营销口径 vs 技术口径)。
运营成本:$500-1000/月跨所有 AI 工具(含 Claude Max / ChatGPT Pro 订阅)。
设计哲学时间溯源
最反直觉的发现:Yohei 的设计原则不是 Q1 thread 突然冒出来的,是 2023 Mini Yohei 时代复利出来的。
- 2023 已成型:AI 作为粘合剂(Zapier+Airtable 时代)/ “AI 输出永远 cc 自己”/ 纠正即训练数据 / Build-in-Public
- 2025 升级:Opinionated Ontology(GPT VC Associate 已经在做,2026 Q1 借 Claude Design 命名)/ Forward email → 指标抽取(updates@untapped)
- 2026 Q1 新增可视化:Ignore 按钮 / Freshness Score / Check-in 用数据开头 / 归一化双轨保留原文
把”信任 = 可纠正而非完美”作为根,所有其他原则都是它的投影:Ignore 按钮(事后纠正)、Freshness Score(自我标注不可信度)、保留原始措辞(让人能去对原始证据)、Check-in 用数据开头(让 founder 来纠正过期数据)、归一化双轨(不替换原始记录、并存 derived)。
还有一条容易被忽略的元原则——Yohei 自己说”Many died when models deprecated. I don’t fix all of them.”——工具迭代节奏 > 工具持久性。这对”要不要在投后工具上长期投入”是关键 reframe。
实现栈推断(high confidence)
Yohei thread 没说编排层用了什么,但基于他公开陈述 + babyagi3 公开 repo 可以高 confidence 推断:
| 层 | 选型 | confidence |
|---|---|---|
| LLM | Anthropic Claude 优先 | high |
| 编排框架 | 基于 babyagi3 的单 LLM loop + 动态 skills | high(哲学层)/ medium(代码复用比例) |
| 工具接入层 | Composio | confirmed(他公开多次说”switched to Composio for everything”) |
| 数据库 | SQLite events + entities + summaries | medium-high |
| 检索 | FTS5 + sqlite-vec hybrid | medium-high |
| 部署 | Replit | confirmed(“just vibe’d on replit”) |
| 触发 | 定时 polling(cron),不是 webhook | medium |
锁死推断的三条 Yohei 原话:
- 2025-03:“switched to Composio for everything”
- 2026-01:“single LLM loop that has access to the 250+ composio tools, with fallback to writing/updating new skills”
- 2026-02:“skills on top of @attio skills that use @composio”
最不可能的候选:LangGraph、n8n、OpenAI Agents SDK——他从未在公开陈述里提及做编排层。
复刻 playbook(个人 portfolio 场景,国内栈)
国内等价栈推荐:飞书多维表格(CRM)+ Gmail/原邮箱不动 + 通义听悟(会议纪要)+ Claude Agent SDK + 自写 100 行 Python + macOS launchd cron。
两周 v1——让抽取跑起来:飞书多维表格 1 张 portfolio + 1 张 events 表,Gmail + 通义听悟 抽取,Python cron 每 30 分钟跑一次,Claude Agent SDK 调用,先不做 UI。
两个月
v2——加上呈现层:飞书多维表格的「记录详情」+「关联表」+「仪表盘」视图本身就够,Ignore
按钮 = ignored: bool 一列,Freshness Score = cron 每天计算
percentile。
半年 v3——反馈闭环:手动审 50+ 封后再开 check-in 自动发;Asks 自动归类等积累 100+ 真实 ask;Ignore 累积每月人工 review 写回 prompt。
反模式(不要做):自己写 SaaS SDK / 先上 LangGraph n8n / 多 agent supervisor / webhook 推送 / 加权 freshness 算法 / v1 自动发邮件 / intro 自动化 / 100% 复制 Yohei 字段表。
对立视角:可复刻 vs 不可复刻
技术栈复刻不等于价值复刻。最强反方排序:
- (1+5) Yohei = 个人 workflow + AI-native 工程能力杂交体——他不是普通 GP 也不是普通工程师,2022 年 Zapier+OpenAI API 起步,BabyAGI 之前已积累一年。他的工具不是工具,是他个人 workflow 的物化,外包给工程师做也救不回来——反馈闭环在 GP 自己每天的使用里。
- Untapped 体量正好合适——~$9.5M Fund I + ~36 笔投资 + pre-seed 单笔——这是这套 stack 的 sweet spot,growth fund / FoF 不能直接套。
- Build-in-Public 反向飞轮——BabyAGI 的曝光直接转化为 LP narrative + 社区免费 review + portfolio 主动接洽,普通 GP 没有这个杠杆。
- 合规雷区(机构基金、不适用 Justin)——SEC 2026 priorities + Reg S-P + PIPL,对 Justin 个人 portfolio 场景影响不大,但未来上机构层级要重新评估。
- AI 抽取的隐性失效——Yohei thread 没披露 precision/recall,scale 到 200+ portfolio 或多语种时”静默 false negative”(漏掉一个 ask)的 cost 是真金白银的关系折损。
复刻者的真实交付物不是代码,是反馈闭环 SOP——每天点哪几次、每周看哪个 dashboard、每月调哪几条 prompt、每季度发 check-in。报告里如果只给代码 playbook 不给”如何形成反馈闭环”的指引,复刻者大概率失败。
三件最值得记住的事
- 元原则:信任 = 可纠正而非完美。这条是 2023 Mini Yohei 时代成型的,不是 2026 Q1 拐点
- 栈选型铁律:单 LLM loop + Composio(或国内等价)+ SQLite + Replit/cron。不要先上 multi-agent / LangGraph / n8n
- 真实交付物:复刻这套的不是代码,是反馈闭环 SOP
完整 research 报告(含 33 个 source、子代理证据链、open
questions、置信度矩阵)见
Learning/Research/2026-05-02-Yohei投后工具完整研究.md。