Pulpo y la necesidad de un ambiente colaborativo para el estudio del cómputo paralelo en México
Palabras clave:
Cómputo paralelo, planificación de tareas, algoritmos heurísticosResumen
Aplicaciones complejas emergentes se caracterizan por requerir una cantidad considerable de recursos computacionales (CPU, memoria y almacenamiento). Resolver estas aplicaciones en computadoras secuenciales pudiera generar costos considerables en términos de desempeño y tiempo. Por otro lado, avances recientes en tecnologías de redes permiten a un conjunto de computadoras conectadas en red, colaborar en la solución de un problema particular. Esto ha promovido el cómputo paralelo en red como una alternativa viable en la solución de aplicaciones complejas. La idea es particionar una tarea compleja en tareas más pequeñas que pueden ejecutarse simultáneamente entre las diferentes computadoras de la red. Los algoritmos de asignación de tareas a computadoras se vuelven fundamentales al buscar reducir el tiempo de ejecución de la aplicación particionada. Este artículo busca fomentar el estudio del cómputo paralelo entre las instituciones de educación superior en México. Pulpo es una herramienta de simulación creada para evaluar algoritmos de asignación de tareas en plataformas distribuidas. Se pretende que pulpo sea una herramienta útil a la comunidad académica interesada en el área y a su vez permita crear un ambiente colaborativo en el estudio del cómputo paralelo. Proporcionamos resultados experimentales y enseñamos a utilizar las librerías de pulpo con un ejemplo. Palabras clave:Descargas
Citas
Adam, T., Chandy, K., and Dickson, J. A. (1974). Comparison of list scheduling for parallel processing systems. Communications of the ACM, 17(12):685–690.
Agarwal, T., Sharma, A., and Kale, L (2006). Topology-aware task mapping for reducing communication contention on large parallel machines. IEEE/IPDPS, page 10 pp. ..
Beaumont, O., Legrand, A., Marchal, L., and Robert, Y. (2005). Independent and divisible tasks scheduling on heterogeneous star-shaped platforms with limited memory. Proceedings of the Conference on Parallel,Distributed and Network-Based Processing(Euromicro-PDP’05), pages 179–186.
Chervenak, A., Foster, I., Kesselman, C., Salisbury, C., & Tuecke, S. (2000). The data grid: Towards an architecture for the distributed management and analysis of large scientific datasets. Journal of network and computer applications, 23(3), 187-200.
Eshaghian, M. and Wu, Y. (1997). Mapping heterogeneous task graphs onto heterogeneous system graphs. In Proceedings of Heterogeneous Computing Workshop (HCW’97), pages 147–160,
Eun-Kyu B., Yang-Suk K., Jin-Soo K., Deelman, E. (2011). BTS: Resource capacity
estimate for time-targeted science workflows, Journal of Parallel Distrib. Comput. (JPDC), 71(6): 848-862
Foster, I., Kesselman, C., & Tuecke, S. (2001). The anatomy of the grid: Enabling scalable virtual organizations. International journal of high performance computing applications, 15(3), 200-222.
Gerasoulis, A. and Yang, T. (1992), “A comparison of clustering heuristics for scheduling directed acyclic graphs on multiprocessors”, Journal of Parallel and Distributed Computing, 16(4):276– 291
GridSim. (2010). The GridSim project homepage, En línea: http://www.cloudbus.org/gridsim/.
Hernandez, I. and Cole, M. (2007a). “Reactive grid scheduling of dag applications”, In Proceedings of the 25th IASTED(PDCN), Acta Press, pages 92–97.
Hernandez, I. and Cole, M. (2007b), Reliable DAG scheduling with rewinding and migration, In Proc.of the First International Conference on Networks for Grid Applications (GridNets), ACM Press, pages 1-8,2007b.
Kwok, Y. and Ahmad, I. (1999). Static algorithms for allocating directed task graphs to multiprocessors, ACM Computing Surveys, 31(4):406–471.
Mell, P., & Grance, T. (2011). The NIST definition of cloud computing. National Institute of Standards and Technology Special Publication 800145, 7 pages.
Olteanu A., Pop F., Dobre C. (2011) Rescheduling and Error Recovering algorithm for Distributed Environments .Sci. Bull., Series C., 73(1).
Olteanu A., Pop F., Dobre C (2012). A dynamic rescheduling algorithm for resource management in large scale dependable distributed systems. Elsevier Computers & Mathematics with Applications, 63(9): 1409-1423.
Pacheco P. (2011), An Introduction to Parallel Computing. ISBN-10: 0123742609, Morgan Kaufmann, 1st edition.
Razdan S. (2014, August). Fundamentals of Parallel Computing. ISBN-10: 1842658808, Alpha Science International Ltd, 1st edition.
Simgrid. (2009). The simgrid project homepage, http://simgrid.gforge.inria.fr/.
Sven K., Riddle S. and Zinn D. (2011). Improving Workflow Fault Tolerance through Provenance-Based Recovery. Scientific and Statistical Database Management, Lecture Notes in Computer Science 6809: 207-224
Topcuoglu, H. (2002). Performanceeffective and low-complexity task scheduling for heterogeneous computing, IEEE Transactions on Parallel and Distributed Systems, 13(3):260–274.
Vouk, M. A., & Mouallem, P. A. (2011, November). On high-assurance scientific workflows. In High-Assurance Systems Engineering (HASE), 2011 IEEE 13th International Symposium on (pp. 7382). IEEE.
Publicado
Cómo citar
Número
Sección
Licencia
Todos los contenidos de CULCYT se distribuyen bajo una licencia de uso y distribución “Creative Commons Reconocimiento-No Comercial 4.0 Internacional” (CC-BY-NC). Puede consultar desde aquí la versión informativa de la licencia.
Los autores/as que soliciten publicar en esta revista, aceptan los términos siguientes: a) los/las autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra; y b) se permite y recomienda a los/las autores/as agregar enlaces de sus artículos en CULCYT en la página web de su institución o en la personal, debido a que ello puede generar intercambios interesantes y aumentar las citas de su obra publicada.