Chroma

資料

通過對話自動化 Chroma 工作流程 — Neotask 使用 OpenClaw 來簡化 Chroma。

您可以做什麼

執行語義搜尋

告訴 Neotask 在您的 Chroma 集合中搜尋與給定查詢相似的文件。OpenClaw 處理嵌入和最近鄰查找,返回帶有元數據和距離分數的語義相關結果。

管理集合

請 Neotask 建立新的 Chroma 集合、列出所有現有集合、新增帶有元數據的文件,或刪除不再需要的集合。

新增文件和嵌入

貼上文字或結構化數據,並要求 Neotask 將其添加到您的 Chroma 集合中,並附上適當的元數據標籤。OpenClaw 自動處理分塊、嵌入生成和 upsert 操作。

檢查並稽核您的向量儲存庫

請 Neotask 顯示集合中的文件總數、查看存儲文件的樣本,或透過 ID 檢索特定條目。

建立並測試 RAG 管道

使用 Neotask 製作檢索增強生成流程的原型。新增文件、執行查詢、調整相似性閾值,並檢查特定提示會檢索到什麼內容。

試著這樣問

  • "在我的 \'knowledge-base\' Chroma 集合中搜尋有關退款政策的文件"
  • "將這 5 份文件添加到我的 Chroma 集合中,並附上元數據標籤:[貼上文件]"
  • "建立一個名為 \'product-docs\' 的新 Chroma 集合,使用餘弦距離"
  • "我的 \'support-tickets\' 集合中有多少文件?"
  • "在 FAQ 集合中顯示與 \'如何取消訂閱\' 最相似的 3 個結果"
  • "列出我所有的 Chroma 集合及其文件數量"
  • 專業提示

  • 豐富的元數據過濾 — 新增文件時務必包含來源、日期和類別元數據;結合元數據與語義搜尋過濾,可以大幅提高精確度。
  • 分塊大小影響召回率 — 將長文件拆分為 300 至 500 個 token 的塊;較短的塊以更多向量為代價,提升了檢索精確度。
  • 餘弦距離 vs L2 距離 — 對於文字嵌入,餘弦距離幾乎總是優於 L2;建立新集合時,請確認集合的距離函數。
  • 更新時使用 upsert — 重新導入文件時務必使用 upsert 而非 add,以防止重複條目。
  • Works Well With