Databricks

Gegevens

Voer notebooks uit, beheer clusters en bevraag uw Databricks-lakehouse via Neotask op OpenClaw — data-engineering en analyses via gesprek.

Wat je kunt doen

SQL-queries uitvoeren op uw Lakehouse

Vraag Neotask om een Unity Catalog-tabel te bevragen, gegevens te aggregeren uit een Delta Lake-dataset, of meerdere tabellen samen te voegen in uw Databricks SQL-warehouse. OpenClaw vertaalt uw vraag in gewone taal naar SQL en retourneert de resultaten.

Clusters en rekenkracht beheren

Vraag Neotask om een cluster te starten, te controleren welke clusters momenteel draaien, inactieve rekenkracht te beëindigen, of de kosten van gebruikte rekenkracht in de afgelopen 30 dagen te bekijken.

Taken uitvoeren en bewaken

Vraag Neotask om een Databricks-taakuitvoering te activeren, de status van een lopende taak te controleren, of de uitvoer en logs van een mislukte taakuitvoering op te halen.

Schema's en tabellen verkennen

Vraag Neotask om alle catalogi, schema's en tabellen in uw Unity Catalog te tonen, het schema van een specifieke tabel te beschrijven, of voorbeeldgegevens uit een dataset te tonen.

Notebooks en werkruimten beheren

Vraag Neotask om notebooks in een werkruimtemap te tonen, de inhoud van een notebook op te halen, of de uitvoergeschiedenis voor een specifiek notebook te bekijken.

Probeer te vragen

  • "Toon me de laatste 100 rijen van de 'sales.transactions'-tabel waar het bedrag hoger is dan €1000"
  • "Welke clusters draaien momenteel in mijn Databricks-werkruimte?"
  • "Voer de 'daily-etl'-taak uit en laat het me weten wanneer die klaar is"
  • "De 'data-pipeline'-taak is gisteravond mislukt — geef me de foutlogs"
  • "Lijst alle tabellen in het 'analytics'-schema met hun rij-aantallen"
  • Pro-tips

  • SQL-warehouse vs. cluster — gebruik voor interactieve SQL-queries een SQL-warehouse; gebruik voor notebook- en Spark-workloads een algemeen cluster. Kies het juiste rekenkrachttype voor uw query.
  • Delta-cache — als herhaalde queries op dezelfde tabel traag zijn, controleer dan of Delta-cache is ingeschakeld op uw cluster; gecachete tabellen reageren dramatisch sneller.
  • Photon voor grote queries — schakel Photon-versnelling in op uw SQL-warehouse voor analytische werkloads op grote datasets; dit vermindert de querytijd aanzienlijk.
  • Unity Catalog-machtigingen — als een query mislukt met een machtigingsfout, controleer uw Unity Catalog-toewijzingen voor die catalogus of dat schema vóór het aanpassen van de query.
  • Works Well With