Guía de Uso del Registro de Imágenes de Contenedores de Alibaba Cloud

Descripción de Versiones

Versión Descripción
hadoop-1.3 Imagen monocapa de Hadoop para despliegue rápido de un entorno standalone. También permite crear múltiples contenedores con confgiuraciones mínimas para formar un cluster de alta disponibilidad.
hadoop-1.4 Construida sobre la imagen base de Hadoop standalone. Incluye Hive data warehouse instalado y configurado con Iceberg, lista para usar.
hadoop-1.5 Construida sobre la imagen base de Hadoop standalone. Incluye el framework Spark preinstalado y configurado, lista para usar.

Conifguración para hadoop-1.3

Equipo Windows: Configuración necesaria

Editar el archivo hosts y actualizar la resolución DNS:

192.168.195.128(IP del-host-CentOS)		hadoop

Ejecutar comando para limpiar caché DNS:

ipconfig /flushdns

Servidor CentOS: Pasos de configuración

  1. Instalar Docker``` yum install -y docker docker --version vim /etc/docker/daemon.json {"registry-mirrors": ["https://d8b3zdiw.mirror.aliyuncs.com"]} systemctl restart docker docker pull 675361896/hadoop:etiqueta

  2. Ejecutar el contenedor``` docker run -itd --privileged --hostname hadoop -p9870:9870 -p8088:8088 -p8020:8020 -p9868:9868 -p19888:19888 -p9864:9864 --name hadoop --user root 921cad23e02d /usr/sbin/init

  3. Operaciones dentro del contenedor``` source /etc/profile /usr/local/hadoop-3.2.4/sbin/start-all.sh

    
    

Acceso Web:

  • NameNode HDFS: http://[IP-Host-CentOS]:9870
  • ResourceManager YARN: http://[IP-Host-CentOS]:8088

Configuración para hadoop-1.4

  1. Repetir los pasos de hadoop-1.3

  2. Ejecutar el contenedor con puertos adicionales para Hive: ``` docker run -itd --privileged --hostname hadoop -p9870:9870 -p8088:8088 -p8020:8020 -p9868:9868 -p19888:19888 -p9864:9864 -p9083:9083 -p10000:10000 -p10002:10002 --name iceberg --user root 921cad23e02d /usr/sbin/init

  3. Iniciar servicios de Hive```

    Iniciar servicio de metadatos

    ./hive --service metastore &

    Iniciar servidor Thrift

    ./hive --service hiveserver2 -hiveconf hive.server2.thrift.port=10000 &

    Inicializar esquema de metadatos

    schematool --initSchema -dbType derby

    Conectar al servicio Hive

    ./beeline -u jdbc:hive2://hadoop:10000 -n root

    
    

Acceso Web:

  • Interfaz de Hive: http://[IP-Host-CentOS]:10002

Configuración para hadoop-1.5

  1. Repetir los pasos de hadoop-1.3

  2. Ejecutar el contenedor con puertos adicionales para Spark: ``` docker run -itd --privileged --hostname hadoop -p9870:9870 -p8088:8088 -p8020:8020 -p9868:9868 -p19888:19888 -p9864:9864 -p9083:9083 -p10000:10000 -p10002:10002 -p4040:4040 --name spark --user root 921cad23e02d /usr/sbin/init

  3. Iniciar servicio PySpark``` /usr/local/spark/bin/pyspark

    
    

Acceso Web:

  • Estado de Driver/Ejecutor Spark: http://[IP-Host-CentOS]:4040

Etiquetas: alibaba-cloud container-registry Hadoop Docker hive

Publicado el 6-27 05:40