Balza Guerrero, HolmanFlorez Amaris, KevinMercado Lopez, LeonardoMendoza Mendoza, Rony2022-07-152022-07-152022https://hdl.handle.net/20.500.12442/10260El siguiente documento consta de una problemática con referencia a la evolución del software de la app y de los programas web que tiene un amplio flujo de datos estos estaban presentando retrasos a la hora de lectura perdida de información entre otras y es donde nace Apache Spark, siendo una de las herramientas BigData con mayor crecimiento y adopción en la actualidad, esta representa una gran oportunidad para las organizaciones de obtener los beneficios del análisis de datos a gran escala. Apache Spark ha emergido recientemente para integrarse y quedarse en el dominio del análisis de datos a gran escala.The following document consists of a problem with reference to the evolution of the app software and web programs that have a large flow of data, these were presenting delays when reading lost information, among others, and that is where Apache Spark was born. Being one of the Big Data tools with the highest growth and adoption today, it represents a great opportunity for organizations to obtain the benefits of large-scale data analysis. Apache Spark has recently emerged to enter and remain in the domain of large-scale data analysis.pdfspaAttribution-NonCommercial-NoDerivatives 4.0 InternacionalApache SparkBig DataAnalítica de datosMapReduceHadoopClústerApache SparkBig DataData AnalyticsMapReduceHadoopClusterPropuesta de Apache Spark para consultas de grandes cantidades de datosinfo:eu-repo/semantics/restrictedAccessinfo:eu-repo/semantics/bachelorThesisApache Spark proposal for large data queries