Integración de Spark con Kudu para manipulación de datos
La combinación de Apache Spark y Kudu ofrece soporte para múltiples funcionalidades:
Operaciones DDL (creación y eliminación de tablas)
RDD nativo de Kudu
Fuante de datos nativa para integración con DataFrames
Lectura directa desde Kudu
Ejecución de inserciones, actualizaciones, upserts y eliminaciones
Optimización mediante predicate pushdown
...
Publicado el 6-20 21:11