從 Beta 到實戰：Letta、Mem0 和 Zep 該怎麼選？

大型語言模型（LLM）的革命毋庸置疑，但它們無狀態的本質仍是重大障礙。就像《海底總動員》裡的 Dory，常常忘記先前互動的 context，難以真正個人化、長期對話或任務。這就是 AI Memory 層登場的原因——專門給 AI 應用持久、可搜尋的 context。

這個領域越來越熱，也冒出幾個有趣的玩家。今天來比較三個 prominent 方案：社群驅動的 Letta、主打 production 的 Mem0，以及研究導向的 Zep。

先說一下：我之前寫過一篇文章深入測 Mem0（The AI Memory Challenge, Part 1: We Asked Mem0 to Remember Five Things）。你可能會問，為什麼沒有 Part 2 用同樣 benchmark 比 Letta 和 Zep？老實說，依我的評估，Letta 和 Zep 都還不太適合那種 production 取向的壓力測試。這篇因此聚焦在它們目前的狀態、哲學和潛力上的高層比較。

我們會從成熟度、開放程度、開發者體驗、核心做法等角度來看。

Letta：社群驅動的開源希望

Letta 的亮點是真正開源的承諾（跟另外兩家比；後面再說）。目標是超好上手，文件夠用、開箱就能跑。他們一度試過雲端 Agent Development Environment（ADE），後來明智地拿掉這個要求，還做了好用的 Desktop UI。

優勢：

真的開放又容易上手： 就是能跑。文件對初期架設很 solid，Desktop app 也大幅降低門檻。

活躍社群： 這是 Letta 的超能力。Discord 超熱鬧。有問題？跳進去，很可能有人懂（常常是 cpakcer、swooders 這類核心貢獻者）很快幫你。我親身經歷過——幾週前寫了篇文章講用 Supabase 架 Letta（Setting up Letta (MemGPT) with Supabase），團隊很熱情地互動、按讚我的貼文，還在 X 上連上。這種社群互動很棒。

挑戰：

還不能上 production： 儘管有進展，Letta 對 mission-critical 應用還差一點。我自己的專案一直在等他們的 SaaS，還在開發中。雖然「公開打造」策略對透明度很加分，時程也可能拉很長。
Agent 本質與 LLM 依賴： 跟另外兩家不同，Letta 比較像 agent 框架。整體效果很吃所用 LLM 的「智慧」和推理能力。這套做法未來更強的模型可能很猛，但今天會覺得有點野心過頭——現有 LLM 未必能穩定驅動 Letta 想啟用的複雜行為，實務表現可能不如較受限的記憶做法。
資源分配？ Desktop app 和對多種模型/資料庫的廣泛支援對 accessibility 很好，但有時會擔心資源是否太分散。核心記憶功能或許需要更聚焦的開發，才能在複雜情境下真的 robust。

Mem0：Production-Ready 的 SaaS 打法

有 Y Combinator 加持，Mem0 把自己定位成目前最成熟、最 ready for production 的記憶方案，尤其是 SaaS。

優勢：

相對可靠： 跟其他兩家比，Mem0 的 SaaS 平台感覺最穩、最適合真實世界。如果你現在就需要，它可能是最佳選擇。
整合簡單、維運輕鬆： API 設計直白，整合相對不痛。SaaS 平台也有實用的 dashboard 監控記憶用量、理解 agent 行為。API 文件還算可以。

挑戰：

「開源」但有但書： 核心是 Apache 2.0，但很明顯重心在 SaaS。self-host 文件稀少，依社群回報和缺乏專門支援，要跑穩 self-hosted 實例似乎很難。他們也沒積極讓這件事變簡單。
定價與試用限制： SaaS 評估用的免費額度很有限，很難在付費前徹底確認是否符合專案需求。定價也可能很貴，尤其對小團隊或 indie 開發者。雖然最近有 $19/月的 Starter，跳到 $249/月的 Pro 落差很大，Starter 對早期專案也可能覺得貴。

Zep：研究導向的深度探索

Zep 對 AI 記憶問題採取更學術、研究驅動的路線，強調技術深度和效能 benchmark。

優勢：

技術深度與透明度： Zep 發了篇 paper 比較他們跟其他人（含 Letta）在 LongMemEval、DMR 等 benchmark 的表現。paper 本身有瑕疵（下面會說），但至少顯示他們願意做正式評估。他們也把核心演算法以 graphiti 專案開源（Apache 2.0），聲稱這些驅動他們的 SaaS。
有深度的內容： Zep 的技術 blog 很棒——三家裡 arguably 最好。他們深入記憶系統的工程難題， genuinely 有洞見的文章，很適合學習。
做法夠精緻： 讀他們的材料，會覺得 Zep 在 AI 記憶的硬問題上想很多，目標比單純向量召回更進階。

挑戰：

那篇「Paper」： 老實說，Zep 的 paper 是我遇過最裝、最沒資訊量的「學術」文件之一。讀起來像 superficial 的行銷稿包一層方程式， vaguely 比劃解法卻沒實質內容（像 GPT-4 technical report 那種）。數學符號常常很勉強，甚至有點好笑。太努力看起來嚴謹，卻幾乎沒透露什麼。
graphiti 不是 plug-and-play： 開源核心演算法值得肯定，但 graphiti 本身不是現成可用的記憶系統。你得花很大力氣才能圍繞它做出能用的方案。
SaaS 還不成熟： 從免費方案體驗來看，Zep 的 SaaS 目前離 polished、可靠還很遠。很明顯還在開發中，可能優先大企業客戶，而不是小用戶的即時可用性。別期待開箱就順。

並排比較

建議：哪種 Memory Layer 適合你？

選 Letta 如果： 你重視真正開源、愛跟活躍社群互動、沒有緊迫的 production deadline、願意跟專案一起成長。這是愛好者的選擇。
選 Mem0 如果： 你現在就需要能用的 AI 記憶方案、偏好 managed SaaS、預算撐得住他們的方案。要有心理準備依賴他們的雲端服務，因為 self-host 對他們來說像是次要議題。關鍵是，自己徹底測過，確認符合你的可靠度和效能需求。
研究 Zep 如果： 你的主要目標是學習 AI 記憶系統的最前線。讀他們的 blog、挖 graphiti 程式碼、批判性地看他們的 paper（或許邊笑邊看）。即使產品還不能上線，對理解進階概念仍是很有價值的資源。

結論

AI memory layer 這個領域很動態，也是解鎖下一階 AI 應用能力的關鍵。Letta、Mem0、Zep 代表三種不同哲學：社群主導的開源、務實的 SaaS、研究驅動的精緻。

你今天的選擇很吃時程、預算、對粗糙邊緣的容忍度，以及你優先的是立即部署、開放生態，還是學進階技術。三邊都要盯——版圖變很快，幾個月後最適合你的解法可能又換了。

原文發表於 Medium。