Databricks
Datos
Ejecuta notebooks, gestiona clústeres y consulta tu lakehouse de Databricks: ingeniería de datos y análisis a través de conversación
- Ejecutar consultas SQL contra tu almacén SQL de Databricks y tablas de Unity Catalog mediante lenguaje natural
- Gestionar clústeres, trabajos y notebooks: iniciar, detener y monitorear el cómputo
- Consultar tablas de Delta Lake, inspeccionar esquemas y analizar datos sin escribir código Spark
Qué puedes hacer
Ejecute consultas SQL en su Lakehouse
Solicite a Neotask que consulte una tabla de Unity Catalog, agregue datos de un conjunto de datos de Delta Lake o una varias tablas en su almacén de Databricks SQL. OpenClaw traduce su pregunta en inglés simple a SQL y devuelve los resultados.
Administrar clústeres y computación
Solicite a Neotask que inicie un clúster, verifique qué clústeres se están ejecutando actualmente, finalice el procesamiento inactivo u obtenga el costo del procesamiento utilizado en los últimos 30 días.
Ejecutar y monitorear trabajos
Solicite a Neotask que active la ejecución de un trabajo de Databricks, verifique el estado de un trabajo que se está ejecutando actualmente u obtenga la salida y los registros de una ejecución de trabajo fallida.
Explorar esquemas y tablas
Pídale a Neotask que enumere todos los catálogos, esquemas y tablas en su catálogo de Unity, describa el esquema de una tabla específica o muestre datos de muestra de un conjunto de datos.
Administrar cuadernos y espacios de trabajo
Pídale a Neotask que enumere los cuadernos en un directorio del espacio de trabajo, recupere el contenido de un cuaderno u obtenga el historial de ejecución de un cuaderno específico.
Intenta preguntar
"Muéstrame las últimas 100 filas de la tabla \'sales.transactions\' donde el monto supera los $1000"
"¿Qué clústeres se ejecutan actualmente en mi área de trabajo de Databricks?"
"Ejecute el trabajo \'daily-etl\' y avíseme cuando se complete"
"El trabajo \'data-pipeline\' falló anoche; consígueme los registros de errores"
"Enumera todas las tablas en el esquema \'analytics\' con su número de filas"Consejos profesionales
SQL almacén frente a clúster: para consultas SQL interactivas, utilice un almacén SQL; para cargas de trabajo de portátiles y Spark, utilice un clúster multiuso. Elija el tipo de proceso correcto para su consulta.
Caché delta: si las consultas repetidas en la misma tabla son lentas, verifique si el caché delta está habilitado en su clúster; las tablas almacenadas en caché responden mucho más rápido.
Photon para consultas grandes: habilite la aceleración de Photon en su almacén SQL para cargas de trabajo analíticas en grandes conjuntos de datos; Reduce significativamente el tiempo de consulta.
Permisos de Unity Catalog: cuando una consulta falla con un error de permisos, verifique las concesiones de Unity Catalog para ese catálogo o esquema antes de modificar la consulta.
Works Well With
- google-contacts - Automate databricks google contacts automation with Neotask. Sync contact data pipelines, streamline your data lakehouse...
- smartsheet - Connect Context7 and Google Classroom with Neotask to deliver accurate, version-specific documentation directly into cou...
- snowflake - Connect Databricks ML pipelines and Spark workloads directly to Snowflake's data warehouse. Neotask bridges your lakehou...
- supabase - Connect Databricks and Supabase to sync your data lakehouse with Postgres. Automate analytics pipelines and eliminate ma...