Apache Hadoop es un framework Open Source que permite a otras herramientas de procesos de Big Data trabajar con miles de nodos y petabytes de datos. Utiliza un sistema de archivos distribuidos propio, HDFS, lo que hace que su optimización sea máxima aún cuando trabaja con ingentes cantidades de datos. Ventajas de Apache Hadoop para […]
Apache Spark es una plataforma de código abierto (Open Source) dirigida al procesamiento paralelo de clusters de datos con clara vocación Big Data Rapidez de procesamiento, esa es la clave de esta solución de Apache, que además incorpora una librería de Machine Learning, Spark MLlib, formada por Spark ML y por la original Spark MLlib […]
Kafka es una de las grandes herramientas utilizadas en procesos de Big Data. Utilizada para análisis y procesos de grandes volúmenes de datos que generen flujos de información en tiempo real Ventajas de Apache Kafka para BIG DATA Kafka tiene un mayor rendimiento, fiabilidad y potencial de replicación , lo que la hace ideal para […]