Documentación despliegue « Clúster Big Data

Deshabilitar Transparent Huge Pages (THP) reduce el uso elevado de CPU que causa. Se realiza mediante la gestión del servicio asociado.

# systemctl daemon-reload
# systemctl start disable-transparent-huge-pages
# cat /sys/kernel/mm/transparent_hugepage/enabled 
always madvise [never]
# cat /sys/kernel/mm/transparent_hugepage/defrag 
always defer defer+madvise madvise [never]
# systemctl enable disable-transparent-huge-pages
Created symlink /etc/systemd/system/basic.target.wants/disable-transparent-huge-pages.services.service. /etc/systemd/system/disable-transparent-huge-page

# systemctl daemon-reload

# systemctl start disable-transparent-huge-pages

# cat /sys/kernel/mm/transparent_hugepage/enabled

always madvise [never]

# cat /sys/kernel/mm/transparent_hugepage/defrag

always defer defer+madvise madvise [never]

# systemctl enable disable-transparent-huge-pages

Created symlink /etc/systemd/system/basic.target.wants/disable-transparent-huge-pages.services.service. /etc/systemd/system/disable-transparent-huge-page

Si dicho servicio no existe, habrá que crear previamente su archivo de definición de servicio para poder manejarlo:

[Unit]
Description=Disable Transparent Huge Pages (THP)
DefaultDependencies=no
After=sysinit.target local-fs.target

[Service]
Type=oneshot
ExecStart=/bin/sh -c 'echo never | tee /sys/kernel/mm/transparent_hugepage/enabled &gt; 
/dev/null &amp;&amp; echo never | tee /sys/kernel/mm/transparent_hugepage/defrag &gt; /dev/null'

[Install]
WantedBy=basic.target

[Unit]

Description=Disable Transparent Huge Pages (THP)

DefaultDependencies=no

After=sysinit.target local-fs.target

[Service]

Type=oneshot

ExecStart=/bin/sh -c 'echo never | tee /sys/kernel/mm/transparent_hugepage/enabled >

/dev/null && echo never | tee /sys/kernel/mm/transparent_hugepage/defrag > /dev/null'

[Install]

WantedBy=basic.target

Se recomienda la reducción del swapping en todos los nodos, así como la deshabilitación del protocolo IP versión 6.

# /etc/sysctl.conf - Configuration file for setting system variables 
# See /etc/sysctl.d/ for additional system variables.
# See sysctl.conf (5) for information.
#
#kernel.domainname = example.com
# Uncomment the following to stop low-level messages on console 
#kernel.printk = 3 4 1 3
#########################################################
# Configuration for hadoop cluster deployment
# To help detect unreachable nodes with less latency
net.ipv4.tcp_retries2=5
# To reduce swapping 
vm.swappiness=1
# To disable IPv6
net.ipv6.conf.all.disable_ipv6 = 1 
net.ipv6.conf.default.disable_ipv6: = 1 
net.ipv6.conf.lo.disable_ipv6= 1

# /etc/sysctl.conf - Configuration file for setting system variables

# See /etc/sysctl.d/ for additional system variables.

# See sysctl.conf (5) for information.

#kernel.domainname = example.com

# Uncomment the following to stop low-level messages on console

#kernel.printk = 3 4 1 3

#########################################################

# Configuration for hadoop cluster deployment

# To help detect unreachable nodes with less latency

net.ipv4.tcp_retries2=5

# To reduce swapping

vm.swappiness=1

# To disable IPv6

net.ipv6.conf.all.disable_ipv6 = 1

net.ipv6.conf.default.disable_ipv6: = 1

net.ipv6.conf.lo.disable_ipv6= 1

La configuración por defecto del firewall es demasiado restrictiva para cualquier despliegue de Hadoop. Si el clúster de Big Data dispone de una red propia, asegurada y aislada no hay necesidad de un cortafuegos adicional en cada sistema.

# ufw status 
Status: inactive
# iptables -L
Chain INPUT (policy ACCEPT)
target prot opt source           destination
Chain FORWARD (policy ACCEPT)
target prot opt source           destination
Chain OUTPUT (policy ACCEPT)
target prot opt source           destination

# ufw status

Status: inactive

# iptables -L

Chain INPUT (policy ACCEPT)

target prot opt source destination

Chain FORWARD (policy ACCEPT)

target prot opt source destination

Chain OUTPUT (policy ACCEPT)

target prot opt source destination

Ajustar el parámetro tcp_retries para la red del sistema permite una detección más rápida de nodos que fallan. En cada nodo, establecer el valor de este parámetro a 5 puede ayudar a detectar nodos inaccesibles con menos latencia. La configuración se realiza en el archivo /etc/sysctl.conf.

#
# /etc/sysctl.conf - Configuration file for setting system variables 
# See /etc/sysctl.d/ for additional system variables.
# See sysctl.conf (5) for information.
#
#kernel.domainname = example.com
# Uncomment the following to stop low-level messages on console #kernel.printk = 3 4 1 3
###########################
# Configuration for hadoop cluster deployment to help detect #unreachable nodes with less latency 
net.ipv4.tcp_retries2=5
###########################
# Functions previously found in netbase
#

# /etc/sysctl.conf - Configuration file for setting system variables

# See /etc/sysctl.d/ for additional system variables.

# See sysctl.conf (5) for information.

#kernel.domainname = example.com

# Uncomment the following to stop low-level messages on console #kernel.printk = 3 4 1 3

###########################

# Configuration for hadoop cluster deployment to help detect #unreachable nodes with less latency

net.ipv4.tcp_retries2=5

###########################

# Functions previously found in netbase

# vim /etc/sysctl.conf
# sysctl -w net.ipv4.tcp_retries2=5 
net.ipv4.tcp_retries2 = 5
# sysctl net.ipv4.tcp_retries2
net.ipv4.tcp_retries2 = 5

# vim /etc/sysctl.conf

# sysctl -w net.ipv4.tcp_retries2=5

net.ipv4.tcp_retries2 = 5

# sysctl net.ipv4.tcp_retries2

net.ipv4.tcp_retries2 = 5

AppArmor debe estar deshabilitado durante la instalación y configuración del clúster. Puede habilitarse posteriormente, después de la instalación y mientras el clúster está corriendo.

# systemctl disable apparmor
Synchronizing state of apparmor.service with SysV service script with
 /lib/systemd/systemd-sysv-install. Executing: /lib/systemd/systemd-sysv-install disable apparmor
Removed /etc/systemd/system/sysinit.target.wants/apparmor.service.
# reboot

# systemctl disable apparmor

Synchronizing state of apparmor.service with SysV service script with

/lib/systemd/systemd-sysv-install. Executing: /lib/systemd/systemd-sysv-install disable apparmor

Removed /etc/systemd/system/sysinit.target.wants/apparmor.service.

# reboot

# service apparmor status
• apparmor.service- Load AppArmor profiles
Loaded: loaded (/lib/systemd/system/apparmor.service; disabled; vendor preset: enabled) 
  Active: inactive (dead)
    Docs: man: apparmor(7)
     https://gitlab.com/apparmor/apparmor/wikis/home/
# apparmor_status
apparmor module is loaded.
15 profiles are loaded.
15 profiles are in enforce mode.
/snap/snapd/18357/usr/lib/snapd/snap-confine
/snap/snapd/18357/usr/lib/snapd/snap-confine//mount-namespace-capture-helper
snap-update-ns.lxd
snap.lxd.activate
snap.1xd.benchmark
snap.lxd.buginfo
snap.lxd.check-kernel
snap.1xd.daemon
snap.1xd.hook.configure
snap.lxd.hook.install
snap.1xd.hook.remove
snap.1xd.1xc
snap.lxd.lxc-to-lxd snap.1xd.lxd
snap.lxd.migrate
0 profiles are in complain mode.
0 processes have profiles defined. 
0 processes are in enforce mode.
0 processes are in complain mode.
0 processes are unconfined but have a profile defined.

# service apparmor status

• apparmor.service- Load AppArmor profiles

Loaded: loaded (/lib/systemd/system/apparmor.service; disabled; vendor preset: enabled)

Active: inactive (dead)

Docs: man: apparmor(7)

https://gitlab.com/apparmor/apparmor/wikis/home/

# apparmor_status

apparmor module is loaded.

15 profiles are loaded.

15 profiles are in enforce mode.

/snap/snapd/18357/usr/lib/snapd/snap-confine

/snap/snapd/18357/usr/lib/snapd/snap-confine//mount-namespace-capture-helper

snap-update-ns.lxd

snap.lxd.activate

snap.1xd.benchmark

snap.lxd.buginfo

snap.lxd.check-kernel

snap.1xd.daemon

snap.1xd.hook.configure

snap.lxd.hook.install

snap.1xd.hook.remove

snap.1xd.1xc

snap.lxd.lxc-to-lxd snap.1xd.lxd

snap.lxd.migrate

0 profiles are in complain mode.

0 processes have profiles defined.

0 processes are in enforce mode.

0 processes are in complain mode.

0 processes are unconfined but have a profile defined.

En cada nodo, ulimit -n especifica el número de i-nodos que pueden abrirse simultáneamente. Con el valor por defecto de 1024, el sistema parece que no dispone de espacio en disco y muestra que no tiene i-nodos disponibles. Este valor debería establecerse a 64000 en cada nodo. El archivo a configurar es /etc/security/limits.conf.

#[domain]      [type]      [item]       [value]
#
#*            soft         core         0
#root         hard         core         100000
#*            hard         rss          10000
#@student     hard         nproc        20
#@faculty     soft         nproc        20
#@faculty     hard         nproc        50
#ftp          hard         nproc        0
#ftp          -            chroot       /ftp
#@student     -            maxlogins    4

root         soft          nofile       64000
root         hard          nofile       64000

#[domain] [type] [item] [value]

#* soft core 0

#root hard core 100000

#* hard rss 10000

#@student hard nproc 20

#@faculty soft nproc 20

#@faculty hard nproc 50

#ftp hard nproc 0

#ftp - chroot /ftp

#@student - maxlogins 4

root soft nofile 64000

root hard nofile 64000

Syslog debe estar habilitado en cada nodo del clúster para preservar los archivos de log referidos a procesos y trabajos finalizados de firma abrupta o que han fallado.

# service rsyslog status
•rsyslog.service System Logging Service
Loaded: loaded (/lib/systemd/system/rsyslog.service; enabled; vendor preset: enabled) 
Active: active (running) since Tue 2023-12-19 10:59:38 UTC; 1h 56min ago
TriggeredBy: syslog.socket
Docs: man: rsyslogd (8)
https://www.rsyslog.com/doc/
Main PID: 1604 (rsyslogd)
Tasks: 4 (limit: 308999)
Memory: 3.6M
CGroup: /system.slice/rsyslog.service
L1604 /usr/sbin/rsyslogd -n -iNONE
Dec 19 10:59:38 hadoop-worker3 systemd[1]: Starting System Logging Service...
Dec 19 10:59:38 hadoop-worker3 rsyslogd[1604]: imuxsock: Acquired UNIX socket
 '/run/systemd/journal/syslog' Dec 19 10:59:38 
hadoop-worker3 rsyslogd[1604]: rsyslogd's groupid changed to 110
Dec 19 10:59:38 hadoop-worker3 rsyslogd[1604]: rsyslogd's userid changed to 104
Dec 19 10:59:38 hadoop-worker3 rsyslogd[1604]: [origin software="rsyslogd"
 swVersion="8.2001.0" x-pid="1604" Dec 19 10:59:38
 hadoop-worker3 systemd[1]: Started System Logging Service.

# service rsyslog status

•rsyslog.service System Logging Service

Loaded: loaded (/lib/systemd/system/rsyslog.service; enabled; vendor preset: enabled)

Active: active (running) since Tue 2023-12-19 10:59:38 UTC; 1h 56min ago

TriggeredBy: syslog.socket

Docs: man: rsyslogd (8)

https://www.rsyslog.com/doc/

Main PID: 1604 (rsyslogd)

Tasks: 4 (limit: 308999)

Memory: 3.6M

CGroup: /system.slice/rsyslog.service

L1604 /usr/sbin/rsyslogd -n -iNONE

Dec 19 10:59:38 hadoop-worker3 systemd[1]: Starting System Logging Service...

Dec 19 10:59:38 hadoop-worker3 rsyslogd[1604]: imuxsock: Acquired UNIX socket

'/run/systemd/journal/syslog' Dec 19 10:59:38

hadoop-worker3 rsyslogd[1604]: rsyslogd's groupid changed to 110

Dec 19 10:59:38 hadoop-worker3 rsyslogd[1604]: rsyslogd's userid changed to 104

Dec 19 10:59:38 hadoop-worker3 rsyslogd[1604]: [origin software="rsyslogd"

swVersion="8.2001.0" x-pid="1604" Dec 19 10:59:38

hadoop-worker3 systemd[1]: Started System Logging Service.

El protocolo Network Time Protocol (NTP) se utiliza para sincronizar la hora y fecha de todos los nodos dentro del clúster. La configuración de NTP es crítica para cualquier clúster de Hadoop. Cualquier falta de sincronismo en los servidores puede desembocar en serios problemas con HBase y otros servicios. En nuestro caso vamos a instalar… Continue reading →

Los servicios a ejecutar en el clúster necesitan Java. Por ello se instala el kit de desarrollo de Java en todos los nodos del clúster. El stack de Hadoop que se va a instalar requiere Java 8.

# apt-get update
Hit: 1 http://archive.ubuntu.com/ubuntu focal InRelease
Get:2 http://archive.ubuntu.com/ubuntu focal-updates InRelease [114 kB] 
Hit: 3 http://archive.ubuntu.com/ubuntu focal-backports InRelease
Hit:4 http://archive.ubuntu.com/ubuntu focal-security InRelease Fetched 114 kB in 1s (88.9 kB/s)
Reading package lists... Done
# apt-get install openjdk-8-jdk
Reading package lists... Done
Building dependency tree
Reading state information... Done
The following additional packages will be installed:
adwaita-icon-theme at-spi2-core ca-certificates-java fontconfig 
fontconfig-config 
fonts-dejavu-core fonts-dejavu-extra gtk-update-icon-cache 
hicolor-icon-theme humanity-icon-theme 
java-common libasyncnse libatk-bridge2.0-0 libatk-wrapper-java
libatk-wrapper-java-jni libatk1.0-0 libatk1.0-data libatspi2.0-0 libavahi-client3 
libavahi-common-data libavahi-common3 libcairo-gobject2 libcairo2 libcups2 libdatrie1
libdrm-amdgpul libdrm-intel1 libdrm-nouveau2 libdrm-radeon1 libflac8 libfontconfigl 
libfontenc1 libgail-common libgail18 libgdk-pixbuf2.0-0 libgdk-pixbuf2.0-bin 
libgdk-pixbuf2.0-common libgif7 libgl1 libgl1-mesa-dri libgl1-mesa-glx 
libglapi-mesa libglvnde libglx-mesae libglxe libgraphite2-3 libgtk2.0-0 
libgtk2.0-bin libgtk2.0-common libharfbuzzeb libice-dev libice6 libjbige
libjpeg-turbo8 libjpeg8 liblcms2-2 libllvm12 libpango-1.0-0 libpangocairo-1.0-0 
libpangoft2-1.0-0 libpciaccesse libpcsclitel libpixman-1-0 libpthread-stubse-dev 
libpulsee librsvg2-2 librsvg2-common libsensors-config libsensors5 libsm-dev 
libsm6 libsndfilel libthai-data libthaie libtiff5 libvorbisenc2 libvulkan1 
libwayland-cliente libwebp6 libx11-dev libx11-xcb1 libxau-dev libxaw7 
libxcb-dri2-0 libxcb-dri3-0 libxcb-glxe libxcb-presente libxcb-randre 
libxcb-rendere libxcb-shape libxcb-shme libxcb-sync1 libxcb-xfixese 
libxcb1-dev libxcomposite1 libxcursor1 libxdamage1 libxdmcp-dev 
libxfixes3 libxft2 libxi6 libxineramal libxkbfilel libxmu6 libxpm4 
libxrandr2 libxrender1 libxshmfencel libxt-dev libxt6 libxtst6 
libxv1 libxxf86dgal libxxf86vm1 mesa-vulkan-drivers openjdk-8-jdk-headless 
openjdk-8-jre openjdk-8-jre-headless ubuntu-mono x11-common x11-utils
 x11proto-core-dev x11proto-dev xorg-seml-doctools xtrans-dev

# apt-get update

Hit: 1 http://archive.ubuntu.com/ubuntu focal InRelease

Get:2 http://archive.ubuntu.com/ubuntu focal-updates InRelease [114 kB]

Hit: 3 http://archive.ubuntu.com/ubuntu focal-backports InRelease

Hit:4 http://archive.ubuntu.com/ubuntu focal-security InRelease Fetched 114 kB in 1s (88.9 kB/s)

Reading package lists... Done

# apt-get install openjdk-8-jdk

Reading package lists... Done

Building dependency tree

Reading state information... Done

The following additional packages will be installed:

adwaita-icon-theme at-spi2-core ca-certificates-java fontconfig

fontconfig-config

fonts-dejavu-core fonts-dejavu-extra gtk-update-icon-cache

hicolor-icon-theme humanity-icon-theme

java-common libasyncnse libatk-bridge2.0-0 libatk-wrapper-java

libatk-wrapper-java-jni libatk1.0-0 libatk1.0-data libatspi2.0-0 libavahi-client3

libavahi-common-data libavahi-common3 libcairo-gobject2 libcairo2 libcups2 libdatrie1

libdrm-amdgpul libdrm-intel1 libdrm-nouveau2 libdrm-radeon1 libflac8 libfontconfigl

libfontenc1 libgail-common libgail18 libgdk-pixbuf2.0-0 libgdk-pixbuf2.0-bin

libgdk-pixbuf2.0-common libgif7 libgl1 libgl1-mesa-dri libgl1-mesa-glx

libglapi-mesa libglvnde libglx-mesae libglxe libgraphite2-3 libgtk2.0-0

libgtk2.0-bin libgtk2.0-common libharfbuzzeb libice-dev libice6 libjbige

libjpeg-turbo8 libjpeg8 liblcms2-2 libllvm12 libpango-1.0-0 libpangocairo-1.0-0

libpangoft2-1.0-0 libpciaccesse libpcsclitel libpixman-1-0 libpthread-stubse-dev

libpulsee librsvg2-2 librsvg2-common libsensors-config libsensors5 libsm-dev

libsm6 libsndfilel libthai-data libthaie libtiff5 libvorbisenc2 libvulkan1

libwayland-cliente libwebp6 libx11-dev libx11-xcb1 libxau-dev libxaw7

libxcb-dri2-0 libxcb-dri3-0 libxcb-glxe libxcb-presente libxcb-randre

libxcb-rendere libxcb-shape libxcb-shme libxcb-sync1 libxcb-xfixese

libxcb1-dev libxcomposite1 libxcursor1 libxdamage1 libxdmcp-dev

libxfixes3 libxft2 libxi6 libxineramal libxkbfilel libxmu6 libxpm4

libxrandr2 libxrender1 libxshmfencel libxt-dev libxt6 libxtst6

libxv1 libxxf86dgal libxxf86vm1 mesa-vulkan-drivers openjdk-8-jdk-headless

openjdk-8-jre openjdk-8-jre-headless ubuntu-mono x11-common x11-utils

x11proto-core-dev x11proto-dev xorg-seml-doctools xtrans-dev

Una vez instalado se configuran las variables de entorno necesarias en el sistema:

# update-alternatives --config java
There is only one alternative in link group java (providing /usr/bin/java):
 /usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java
Nothing to configure.
# echo JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/jre &gt;&gt; /etc/environment 
# cat /etc/environment 
PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin" 
JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/jre/

# update-alternatives --config java

There is only one alternative in link group java (providing /usr/bin/java):

/usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java

Nothing to configure.

# echo JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/jre >> /etc/environment

# cat /etc/environment

PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin"

JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64/jre/

La resolución de nombres local del clúster es sumamente importante (tiene, por ejemplo, implicaciones en el correcto despliegue de los agentes de ambari a los nodos del clúster). Los nombres de cada nodo deben ser nombres FQDN y debe además comprobarse que el comando hostname -f devuelve el nombre FQDN de cada hosts.

# cat /etc/hosts
127.0.0.1       localhost
#127.0.1.1      hadoop-master1

# Hadoop cluster nodes
10.22.87.215    hadoop-master1.tartangalh.eus   hadoop-master1
10.22.87.216    hadoop-worker1.tartangalh.eus   hadoop-worker1
10.22.87.217    hadoop-worker2.tartangalh.eus   hadoop-worker2
10.22.87.218    hadoop-worker3.tartangalh.eus   hadoop-worker3
10.22.87.219    hadoop-admin1.tartangalh.eus    hadoop-admin1

# The following lines are desirable for IPv6 capable hosts
::1     ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters

# cat /etc/hosts

127.0.0.1 localhost

#127.0.1.1 hadoop-master1

# Hadoop cluster nodes

10.22.87.215 hadoop-master1.tartangalh.eus hadoop-master1

10.22.87.216 hadoop-worker1.tartangalh.eus hadoop-worker1

10.22.87.217 hadoop-worker2.tartangalh.eus hadoop-worker2

10.22.87.218 hadoop-worker3.tartangalh.eus hadoop-worker3

10.22.87.219 hadoop-admin1.tartangalh.eus hadoop-admin1

# The following lines are desirable for IPv6 capable hosts

::1 ip6-localhost ip6-loopback

fe00::0 ip6-localnet

ff00::0 ip6-mcastprefix

ff02::1 ip6-allnodes

ff02::2 ip6-allrouters

# cat /etc/hosts
127.0.0.1       localhost
#127.0.1.1      hadoop-worker1

# Hadoop cluster nodes
10.22.87.215    hadoop-master1.tartangalh.eus   hadoop-master1
10.22.87.216    hadoop-worker1.tartangalh.eus   hadoop-worker1
10.22.87.217    hadoop-worker2.tartangalh.eus   hadoop-worker2
10.22.87.218    hadoop-worker3.tartangalh.eus   hadoop-worker3
10.22.87.219    hadoop-admin1.tartangalh.eus    hadoop-admin1

# The following lines are desirable for IPv6 capable hosts
::1     ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters

# cat /etc/hosts

127.0.0.1 localhost

#127.0.1.1 hadoop-worker1

# Hadoop cluster nodes

10.22.87.215 hadoop-master1.tartangalh.eus hadoop-master1

10.22.87.216 hadoop-worker1.tartangalh.eus hadoop-worker1

10.22.87.217 hadoop-worker2.tartangalh.eus hadoop-worker2

10.22.87.218 hadoop-worker3.tartangalh.eus hadoop-worker3

10.22.87.219 hadoop-admin1.tartangalh.eus hadoop-admin1

# The following lines are desirable for IPv6 capable hosts

::1 ip6-localhost ip6-loopback

fe00::0 ip6-localnet

ff00::0 ip6-mcastprefix

ff02::1 ip6-allnodes

ff02::2 ip6-allrouters

… Continue reading →

Clúster Big Data

Conoce y accede a toda la información sobre el clúster Hadoop de Tartanga

Category Archives: Documentación despliegue

Tarea I.8: Configuración pre-despliegue, THP

Tarea I.7: Configuración pre-despliegue, swapping e IPv6

Tarea I.6: Configuración pre-despliegue, firewall

Tarea I.5: Configuración pre-despliegue, tcp_retries

Tarea I.4: Configuración pre-despliegue, AppArmor

Tarea I.3: Configuración pre-despliegue, ulimit

Tarea I.2: Configuración pre-despliegue, syslog

Tarea I.1: Configuración pre-despliegue, NTP

Tarea H: Instalación de Java

Tarea C: Configuración de la resolución de nombres local