Databricks

資料

通過對話自動化 Databricks 工作流程 — Neotask 使用 OpenClaw 來簡化 Databricks。

您可以做什麼

對您的資料湖倉執行 SQL 查詢

請 Neotask 查詢 Unity Catalog 資料表、聚合 Delta Lake 數據集中的數據,或在您的 Databricks SQL Warehouse 中聯接多個資料表。OpenClaw 將您的自然語言問題轉換為 SQL 並返回結果。

管理叢集和運算資源

請 Neotask 啟動叢集、檢查哪些叢集目前正在執行、終止閒置運算,或獲取過去 30 天使用的運算費用。

執行和監控工作

請 Neotask 觸發 Databricks 工作執行、檢查正在執行的工作狀態,或獲取失敗工作執行的輸出和日誌。

探索 Schema 和資料表

請 Neotask 列出您 Unity Catalog 中的所有目錄、Schema 和資料表、描述特定資料表的 Schema,或顯示數據集的樣本數據。

管理筆記本和工作區

請 Neotask 列出工作區目錄中的筆記本、檢索筆記本內容,或獲取特定筆記本的執行歷史。

試著這樣問

  • "顯示 \'sales.transactions\' 資料表中金額超過 1000 美元的最後 100 筆記錄"
  • "我的 Databricks 工作區中目前有哪些叢集在執行?"
  • "執行 \'daily-etl\' 工作並在完成時通知我"
  • "\'data-pipeline\' 工作昨晚失敗了 — 給我錯誤日誌"
  • "列出 \'analytics\' Schema 中的所有資料表及其行數"
  • 專業提示

  • SQL Warehouse vs 叢集 — 對於互動式 SQL 查詢,使用 SQL Warehouse;對於筆記本和 Spark 工作負載,使用通用叢集。針對您的查詢選擇正確的運算類型。
  • Delta 快取 — 如果相同資料表的重複查詢速度緩慢,請檢查您的叢集是否啟用了 Delta 快取;快取的資料表回應速度大幅提升。
  • Photon 用於大型查詢 — 為針對大型數據集的分析工作負載在您的 SQL Warehouse 上啟用 Photon 加速;它能顯著減少查詢時間。
  • Unity Catalog 權限 — 當查詢因權限錯誤而失敗時,在修改查詢之前先檢查該目錄或 Schema 的 Unity Catalog 授予。
  • Works Well With