Chroma
資料
通過對話自動化 Chroma 工作流程 — Neotask 使用 OpenClaw 來簡化 Chroma。
- 透過自然語言在 Chroma 集合中儲存、查詢和管理向量嵌入,無需編寫 API 呼叫
- 在您的文件集合中執行語義相似性搜尋,立即找出最相關的結果
- 透過對話建立並配置 Chroma 集合、新增帶有元數據的文件,以及刪除過期條目
您可以做什麼
執行語義搜尋
告訴 Neotask 在您的 Chroma 集合中搜尋與給定查詢相似的文件。OpenClaw 處理嵌入和最近鄰查找,返回帶有元數據和距離分數的語義相關結果。
管理集合
請 Neotask 建立新的 Chroma 集合、列出所有現有集合、新增帶有元數據的文件,或刪除不再需要的集合。
新增文件和嵌入
貼上文字或結構化數據,並要求 Neotask 將其添加到您的 Chroma 集合中,並附上適當的元數據標籤。OpenClaw 自動處理分塊、嵌入生成和 upsert 操作。
檢查並稽核您的向量儲存庫
請 Neotask 顯示集合中的文件總數、查看存儲文件的樣本,或透過 ID 檢索特定條目。
建立並測試 RAG 管道
使用 Neotask 製作檢索增強生成流程的原型。新增文件、執行查詢、調整相似性閾值,並檢查特定提示會檢索到什麼內容。
試著這樣問
"在我的 \'knowledge-base\' Chroma 集合中搜尋有關退款政策的文件"
"將這 5 份文件添加到我的 Chroma 集合中,並附上元數據標籤:[貼上文件]"
"建立一個名為 \'product-docs\' 的新 Chroma 集合,使用餘弦距離"
"我的 \'support-tickets\' 集合中有多少文件?"
"在 FAQ 集合中顯示與 \'如何取消訂閱\' 最相似的 3 個結果"
"列出我所有的 Chroma 集合及其文件數量"專業提示
豐富的元數據過濾 — 新增文件時務必包含來源、日期和類別元數據;結合元數據與語義搜尋過濾,可以大幅提高精確度。
分塊大小影響召回率 — 將長文件拆分為 300 至 500 個 token 的塊;較短的塊以更多向量為代價,提升了檢索精確度。
餘弦距離 vs L2 距離 — 對於文字嵌入,餘弦距離幾乎總是優於 L2;建立新集合時,請確認集合的距離函數。
更新時使用 upsert — 重新導入文件時務必使用 upsert 而非 add,以防止重複條目。
Works Well With
- docker - Deploy Chroma vector database with Docker for scalable AI embeddings. Containerize your vector search workflows and ship...
- firebase - Connect Chroma and Firebase with Neotask to build AI-powered apps with vector search and real-time data synced seamlessl...