Chroma

資料

通過對話自動化 Chroma 工作流程 — Neotask 使用 OpenClaw 來簡化 Chroma。

您可以做什麼

告訴 Neotask 在您的 Chroma 集合中搜尋與給定查詢相似的文件。OpenClaw 處理嵌入和最近鄰查找，返回帶有元數據和距離分數的語義相關結果。

請 Neotask 建立新的 Chroma 集合、列出所有現有集合、新增帶有元數據的文件，或刪除不再需要的集合。

貼上文字或結構化數據，並要求 Neotask 將其添加到您的 Chroma 集合中，並附上適當的元數據標籤。OpenClaw 自動處理分塊、嵌入生成和 upsert 操作。

請 Neotask 顯示集合中的文件總數、查看存儲文件的樣本，或透過 ID 檢索特定條目。

使用 Neotask 製作檢索增強生成流程的原型。新增文件、執行查詢、調整相似性閾值，並檢查特定提示會檢索到什麼內容。

"在我的 \'knowledge-base\' Chroma 集合中搜尋有關退款政策的文件"

"將這 5 份文件添加到我的 Chroma 集合中，並附上元數據標籤：[貼上文件]"

"建立一個名為 \'product-docs\' 的新 Chroma 集合，使用餘弦距離"

"我的 \'support-tickets\' 集合中有多少文件？"

"在 FAQ 集合中顯示與 \'如何取消訂閱\' 最相似的 3 個結果"

"列出我所有的 Chroma 集合及其文件數量"

豐富的元數據過濾 — 新增文件時務必包含來源、日期和類別元數據；結合元數據與語義搜尋過濾，可以大幅提高精確度。

分塊大小影響召回率 — 將長文件拆分為 300 至 500 個 token 的塊；較短的塊以更多向量為代價，提升了檢索精確度。

餘弦距離 vs L2 距離 — 對於文字嵌入，餘弦距離幾乎總是優於 L2；建立新集合時，請確認集合的距離函數。

更新時使用 upsert — 重新導入文件時務必使用 upsert 而非 add，以防止重複條目。

docker - Deploy Chroma vector database with Docker for scalable AI embeddings. Containerize your vector search workflows and ship...
firebase - Connect Chroma and Firebase with Neotask to build AI-powered apps with vector search and real-time data synced seamlessl...