跳至主要內容
8.635 分鐘閱讀

從 Beta 到實戰:Letta、Mem0 和 Zep 該怎麼選?

大型語言模型(LLM)的革命毋庸置疑,但它們無狀態的本質仍是重大障礙。就像《海底總動員》裡的 Dory,常常忘記先前互動的 context,難以真正個人化、長期對話或任務。

  • ai memory
  • llm agent
  • rags
從 Beta 到實戰:Letta、Mem0 和 Zep 該怎麼選?

大型語言模型(LLM)的革命毋庸置疑,但它們無狀態的本質仍是重大障礙。就像《海底總動員》裡的 Dory,常常忘記先前互動的 context,難以真正個人化、長期對話或任務。這就是 AI Memory 層登場的原因——專門給 AI 應用持久、可搜尋的 context。

這個領域越來越熱,也冒出幾個有趣的玩家。今天來比較三個 prominent 方案:社群驅動的 Letta、主打 production 的 Mem0,以及研究導向的 Zep

先說一下:我之前寫過一篇 文章 深入測 Mem0(The AI Memory Challenge, Part 1: We Asked Mem0 to Remember Five Things)。你可能會問,為什麼沒有 Part 2 用同樣 benchmark 比 Letta 和 Zep?老實說,依我的評估,Letta 和 Zep 都還不太適合那種 production 取向的壓力測試。這篇因此聚焦在它們目前的狀態、哲學和潛力上的高層比較。

我們會從成熟度、開放程度、開發者體驗、核心做法等角度來看。

Letta:社群驅動的開源希望

Letta 的亮點是真正開源的承諾(跟另外兩家比;後面再說)。目標是超好上手,文件夠用、開箱就能跑。他們一度試過雲端 Agent Development Environment(ADE),後來明智地拿掉這個要求,還做了好用的 Desktop UI。

優勢:

  • 真的開放又容易上手: 就是能跑。文件對初期架設很 solid,Desktop app 也大幅降低門檻。

活躍社群: 這是 Letta 的超能力。Discord 超熱鬧。有問題?跳進去,很可能有人懂(常常是 cpakcer、swooders 這類核心貢獻者)很快幫你。我親身經歷過——幾週前寫了篇 文章 講用 Supabase 架 Letta(Setting up Letta (MemGPT) with Supabase),團隊很熱情地互動、按讚我的貼文,還在 X 上連上。這種社群互動很棒。

挑戰:

  • 還不能上 production: 儘管有進展,Letta 對 mission-critical 應用還差一點。我自己的專案一直在等他們的 SaaS,還在開發中。雖然「公開打造」策略對透明度很加分,時程也可能拉很長。
  • Agent 本質與 LLM 依賴: 跟另外兩家不同,Letta 比較像 agent 框架。整體效果很吃所用 LLM 的「智慧」和推理能力。這套做法未來更強的模型可能很猛,但 今天 會覺得有點野心過頭——現有 LLM 未必能穩定驅動 Letta 想啟用的複雜行為,實務表現可能不如較受限的記憶做法。
  • 資源分配? Desktop app 和對多種模型/資料庫的廣泛支援對 accessibility 很好,但有時會擔心資源是否太分散。核心記憶功能或許需要更聚焦的開發,才能在複雜情境下真的 robust。

Mem0:Production-Ready 的 SaaS 打法

有 Y Combinator 加持,Mem0 把自己定位成目前最成熟、最 ready for production 的記憶方案,尤其是 SaaS。

優勢:

  • 相對可靠: 跟其他兩家比,Mem0 的 SaaS 平台感覺最穩、最適合真實世界。如果你 現在 就需要,它可能是最佳選擇。
  • 整合簡單、維運輕鬆: API 設計直白,整合相對不痛。SaaS 平台也有實用的 dashboard 監控記憶用量、理解 agent 行為。API 文件還算可以。

挑戰:

  • 「開源」但有但書: 核心是 Apache 2.0,但很明顯重心在 SaaS。self-host 文件稀少,依社群回報和缺乏專門支援,要跑穩 self-hosted 實例似乎很難。他們也沒積極讓這件事變簡單。
  • 定價與試用限制: SaaS 評估用的免費額度很有限,很難在付費前徹底確認是否符合專案需求。定價也可能很貴,尤其對小團隊或 indie 開發者。雖然最近有 $19/月的 Starter,跳到 $249/月的 Pro 落差很大,Starter 對早期專案也可能覺得貴。

Zep:研究導向的深度探索

Zep 對 AI 記憶問題採取更學術、研究驅動的路線,強調技術深度和效能 benchmark。

優勢:

  • 技術深度與透明度: Zep 發了篇 paper 比較他們跟其他人(含 Letta)在 LongMemEval、DMR 等 benchmark 的表現。paper 本身有瑕疵(下面會說),但至少顯示他們願意做正式評估。他們也把核心演算法以 graphiti 專案開源(Apache 2.0),聲稱這些驅動他們的 SaaS。
  • 有深度的內容: Zep 的技術 blog 很棒——三家裡 arguably 最好。他們深入記憶系統的工程難題, genuinely 有洞見的文章,很適合學習。
  • 做法夠精緻: 讀他們的材料,會覺得 Zep 在 AI 記憶的硬問題上想很多,目標比單純向量召回更進階。

挑戰:

  • 那篇「Paper」: 老實說,Zep 的 paper 是我遇過最裝、最沒資訊量的「學術」文件之一。讀起來像 superficial 的行銷稿包一層方程式, vaguely 比劃解法卻沒實質內容(像 GPT-4 technical report 那種)。數學符號常常很勉強,甚至有點好笑。太努力看起來嚴謹,卻幾乎沒透露什麼。
  • graphiti 不是 plug-and-play: 開源核心演算法值得肯定,但 graphiti 本身不是現成可用的記憶系統。你得花很大力氣才能圍繞它做出能用的方案。
  • SaaS 還不成熟: 從免費方案體驗來看,Zep 的 SaaS 目前離 polished、可靠還很遠。很明顯還在開發中,可能優先大企業客戶,而不是小用戶的即時可用性。別期待開箱就順。

並排比較

建議:哪種 Memory Layer 適合你?

  • 選 Letta 如果: 你重視真正開源、愛跟活躍社群互動、沒有緊迫的 production deadline、願意跟專案一起成長。這是愛好者的選擇。
  • 選 Mem0 如果:現在 就需要能用的 AI 記憶方案、偏好 managed SaaS、預算撐得住他們的方案。要有心理準備依賴他們的雲端服務,因為 self-host 對他們來說像是次要議題。關鍵是,自己徹底測過,確認符合你的可靠度和效能需求。
  • 研究 Zep 如果: 你的主要目標是學習 AI 記憶系統的最前線。讀他們的 blog、挖 graphiti 程式碼、批判性地看他們的 paper(或許邊笑邊看)。即使產品還不能上線,對理解進階概念仍是很有價值的資源。

結論

AI memory layer 這個領域很動態,也是解鎖下一階 AI 應用能力的關鍵。Letta、Mem0、Zep 代表三種不同哲學:社群主導的開源、務實的 SaaS、研究驅動的精緻。

你今天的選擇很吃時程、預算、對粗糙邊緣的容忍度,以及你優先的是立即部署、開放生態,還是學進階技術。三邊都要盯——版圖變很快,幾個月後最適合你的解法可能又換了。


原文發表於 Medium