Databricks

Datos

Ejecuta notebooks, gestiona clústeres y consulta tu lakehouse de Databricks: ingeniería de datos y análisis a través de conversación

Ejecutar consultas SQL contra tu almacén SQL de Databricks y tablas de Unity Catalog mediante lenguaje natural
Gestionar clústeres, trabajos y notebooks: iniciar, detener y monitorear el cómputo
Consultar tablas de Delta Lake, inspeccionar esquemas y analizar datos sin escribir código Spark

Qué puedes hacer

Ejecute consultas SQL en su Lakehouse

Solicite a Neotask que consulte una tabla de Unity Catalog, agregue datos de un conjunto de datos de Delta Lake o una varias tablas en su almacén de Databricks SQL. OpenClaw traduce su pregunta en inglés simple a SQL y devuelve los resultados.

Administrar clústeres y computación

Solicite a Neotask que inicie un clúster, verifique qué clústeres se están ejecutando actualmente, finalice el procesamiento inactivo u obtenga el costo del procesamiento utilizado en los últimos 30 días.

Ejecutar y monitorear trabajos

Solicite a Neotask que active la ejecución de un trabajo de Databricks, verifique el estado de un trabajo que se está ejecutando actualmente u obtenga la salida y los registros de una ejecución de trabajo fallida.

Explorar esquemas y tablas

Pídale a Neotask que enumere todos los catálogos, esquemas y tablas en su catálogo de Unity, describa el esquema de una tabla específica o muestre datos de muestra de un conjunto de datos.

Administrar cuadernos y espacios de trabajo

Pídale a Neotask que enumere los cuadernos en un directorio del espacio de trabajo, recupere el contenido de un cuaderno u obtenga el historial de ejecución de un cuaderno específico.

Intenta preguntar

"Muéstrame las últimas 100 filas de la tabla \'sales.transactions\' donde el monto supera los $1000"

"¿Qué clústeres se ejecutan actualmente en mi área de trabajo de Databricks?"

"Ejecute el trabajo \'daily-etl\' y avíseme cuando se complete"

"El trabajo \'data-pipeline\' falló anoche; consígueme los registros de errores"

"Enumera todas las tablas en el esquema \'analytics\' con su número de filas"

Consejos profesionales

SQL almacén frente a clúster: para consultas SQL interactivas, utilice un almacén SQL; para cargas de trabajo de portátiles y Spark, utilice un clúster multiuso. Elija el tipo de proceso correcto para su consulta.

Caché delta: si las consultas repetidas en la misma tabla son lentas, verifique si el caché delta está habilitado en su clúster; las tablas almacenadas en caché responden mucho más rápido.

Photon para consultas grandes: habilite la aceleración de Photon en su almacén SQL para cargas de trabajo analíticas en grandes conjuntos de datos; Reduce significativamente el tiempo de consulta.

Permisos de Unity Catalog: cuando una consulta falla con un error de permisos, verifique las concesiones de Unity Catalog para ese catálogo o esquema antes de modificar la consulta.

Works Well With

google-contacts - Automate databricks google contacts automation with Neotask. Sync contact data pipelines, streamline your data lakehouse...
smartsheet - Connect Context7 and Google Classroom with Neotask to deliver accurate, version-specific documentation directly into cou...
snowflake - Connect Databricks ML pipelines and Spark workloads directly to Snowflake's data warehouse. Neotask bridges your lakehou...
supabase - Connect Databricks and Supabase to sync your data lakehouse with Postgres. Automate analytics pipelines and eliminate ma...