🐘 Apache Hadoop — 🧮 Exemplo contapalabras
Imos empregar o .jar de exemplo para demostrar a operación de mapreduce contando palabras sobre un arquivo presente no HDFS.
Este arquivo .jar de exemplo podémolo executar directamente en Apache Hadoop:
/opt/cloudera/parcels/CDH-6.1.1-1.cdh6.1.1.p0.875250/jars/hadoop-mapreduce-examples-3.0.0-cdh6.1.1.jar
Preparando o contorno
-
Creamos un arquivo coa lista da compra:
-
Creamos o directorio
compras
no HDFS e subimos o arquivo ese directorio: -
Comprobamos que temos subido correctamente o arquivo:
-
Executamos o comando
yarn jar
con estes parámetros:
Debería terse creado en resumo_contas
o conteo de palabras dos arquivos que estivesen dentro do directorio compras
.