Databricks

Datos

Ejecuta notebooks, gestiona clústeres y consulta tu lakehouse de Databricks: ingeniería de datos y análisis a través de conversación

Qué puedes hacer

Ejecute consultas SQL en su Lakehouse

Solicite a Neotask que consulte una tabla de Unity Catalog, agregue datos de un conjunto de datos de Delta Lake o una varias tablas en su almacén de Databricks SQL. OpenClaw traduce su pregunta en inglés simple a SQL y devuelve los resultados.

Administrar clústeres y computación

Solicite a Neotask que inicie un clúster, verifique qué clústeres se están ejecutando actualmente, finalice el procesamiento inactivo u obtenga el costo del procesamiento utilizado en los últimos 30 días.

Ejecutar y monitorear trabajos

Solicite a Neotask que active la ejecución de un trabajo de Databricks, verifique el estado de un trabajo que se está ejecutando actualmente u obtenga la salida y los registros de una ejecución de trabajo fallida.

Explorar esquemas y tablas

Pídale a Neotask que enumere todos los catálogos, esquemas y tablas en su catálogo de Unity, describa el esquema de una tabla específica o muestre datos de muestra de un conjunto de datos.

Administrar cuadernos y espacios de trabajo

Pídale a Neotask que enumere los cuadernos en un directorio del espacio de trabajo, recupere el contenido de un cuaderno u obtenga el historial de ejecución de un cuaderno específico.

Intenta preguntar

  • "Muéstrame las últimas 100 filas de la tabla \'sales.transactions\' donde el monto supera los $1000"
  • "¿Qué clústeres se ejecutan actualmente en mi área de trabajo de Databricks?"
  • "Ejecute el trabajo \'daily-etl\' y avíseme cuando se complete"
  • "El trabajo \'data-pipeline\' falló anoche; consígueme los registros de errores"
  • "Enumera todas las tablas en el esquema \'analytics\' con su número de filas"
  • Consejos profesionales

  • SQL almacén frente a clúster: para consultas SQL interactivas, utilice un almacén SQL; para cargas de trabajo de portátiles y Spark, utilice un clúster multiuso. Elija el tipo de proceso correcto para su consulta.
  • Caché delta: si las consultas repetidas en la misma tabla son lentas, verifique si el caché delta está habilitado en su clúster; las tablas almacenadas en caché responden mucho más rápido.
  • Photon para consultas grandes: habilite la aceleración de Photon en su almacén SQL para cargas de trabajo analíticas en grandes conjuntos de datos; Reduce significativamente el tiempo de consulta.
  • Permisos de Unity Catalog: cuando una consulta falla con un error de permisos, verifique las concesiones de Unity Catalog para ese catálogo o esquema antes de modificar la consulta.
  • Works Well With