Proyectos Universitarios
Complejidad y la minería de datos: Aplicaciones a la salud pública y las ciencias sociales
Christopher Rhodes Stephens
Instituto de Ciencias Nucleares
Área de las Ciencias Físico Matemáticas y de las Ingenierías

Datos curatoriales

Nombre de la colección

Proyectos Universitarios PAPIIT (PAPIIT)

Responsables de la colección

Ing. César Núñez Hernández; L.I. Ivonne García Vázquez

Colección asociada

@collection_name_full1@

Responsables de la colección asociada

@collection_responsible@

Dependencia

Dirección de Desarrollo Académico, Dirección General de Asuntos del Personal Académico (DGAPA)

Institución

Universidad Nacional Autónoma de México (UNAM)

Identificador único (URN)

DGAPA:PAPIIT:IN113414

Datos del proyecto

Nombre del proyecto

Complejidad y la minería de datos: Aplicaciones a la salud pública y las ciencias sociales

Responsables

Christopher Rhodes Stephens

Año de convocatoria

2014

Clave del proyecto

IN113414

Dependencia participante

Instituto de Ciencias Nucleares

Palabras clave

@keywords@

Área

Área de las Ciencias Físico Matemáticas y de las Ingenierías

Disciplina

Física

Especialidad

Sistemas complejos

Modalidad

a) Proyectos de investigación

Síntesis

Los sistemas complejos adaptativos (SCA) desafian la ciencia actual. El éxito de las herramientas y conceptos de las ciencias exactas como la física no se ha transferido al dominio de la complejidad. Sin embargo todos los grandes problematicas de México son intrinsicamente complejos; es decir que se caracterizan por muchos grados de libertad efectivos relevantes que forman una jerarquía de bloques constructores desde el micro hasta el macro. Además, distinto a la física, hay ciclos de retroalimentación entre los distintos niveles de la jeraquía en ambas direcciones, desde el micro hasta el macro y vice versa. Este fenómeno complica particularmente la identificación de causa y efecto. Aunque actualmente hay much actividad en el área de los SCA, mucho usa los métodos y conceptos tradicionales de la física que, propondría, no son los adecuados. Dos fundamentos importantes de la ciencia son la fenomenología y la taxonomía, siendo elementos cruciales antes de poder desarrollar marcos teóricos. La fenomenología de los SCA se complica por la gran cantidad de variables a diferentes escalas que los caracterizan. En contraste en las ciencias exactas los fenómenos suelen ser controlados por pocas variables relevantes que pueden ser experimentalmente a una escala definida. La situación es muy distinta para los SCA. Sin embargo la revolución de datos que ha occurrido en los últimos 20-30 años tiene como consecuencia que hoy en día existen bases de datos que contienen información sobre los SCA. Desafortunadamente los datos necesarios para una descripción multi-escala suelen estar ubicados en diferentes bases y la gestión y integración de estos datos es, en su turno, sumamente complejo. Sin embargo, la existencia de tales bases de datos significa que hay muchas posibilidades para estudiar la fenomenología de los SCA. Los mercados financieros es un ejemplo relevante donde la econofísica ha sido basado en la fenomenología. La existencia de bases de datos grandes ha dado luz a la minería de datos como una herramienta para descubrir conocimiento en tales bases. Ha sido un campo desarrollado principalmente por los compútologos con fines prácticos para contestar preguntas definidas para un sistema particular. No ha sido considerado hasta ahora como una herramienta para la modelación de los SCA o para el desarrollo de un entendimiento más profundo de la complejidad. En este proyecto se usará la minería de datos para investigar algunas bases de datos de la salud pública y las ciencias sociales. Hay dos propósitos principales: uno para desarrollar un mejor entendimiento y herramientas para la investigación de los SCA; y otro es desarrollar entendimiento de factores de riesgo y modelos predictivos concretos en algunos problemas de gran importancia social tal que el conocimiento desarrollado puede tener un impacto más allá que lo académico. Los problemas que estudiarán son: i) la diabetes mellitus tipo 2, que probablemente es la enfermedad de mayor importancia en México; ii) la relación entre fragilidad (envejecimiento), mortalidad y enfermedades como la diabetes y los derrames; iii) enfermedades emergentes como Leishmaniasis y la enfermedad de Chagas, considerando el ciclo de transmisión ecológico y la evolución del patógeno; iv) delitos y su relación a factores socio-económicos y socio-demográficos. Cabe mencionar que se tiene en mano las bases de datos correspondientes para estos problemas y se cuenta con resultados preliminares. Este proyecto se trata de una extensión significativa de una linea de investigación ya en camino.

Contribución

Loa problematicas más importantes que se enfrenta el país son por definición complejos. Involucran un gran número de variables relevantes que cubren un muy amplio espectro de escalas. Distinto a los sistemas físicos es un gran reto simplemente obtener datos que son suficientemente representativos de la fenomenología de los SCA para ofrecer una descripción adecuado. Hoy en día con el gran aumento de capacidad de almancenamiento de los datos a través de las bases de datos electronicos es más factible obtener y integrar datos de distintas fuentes así obteniendo una fenomenología mucha más rica con que se puede desarrollar un mejor entendimiento de los SCA y la complejidad en sí. En este proyecto se utilizará varias bases de datos asociados con problemas de gran impacto social de la salud pública y las ciencias sociales que en sí son SCA. Se estudiará su fenomenología y desarrollar modelos predictivos usando la minería de datos como marco conceptual y herramienta principal. Hasta el momento la minería de datos ha sido usado principalmente por los compútologos para contestar preguntas definidas sobre sistemas particulares más que considerarla como una técnica general con que estudiar y modelar los SCA y la complejidad. Una contribución importante de este proyecto será seguir con el desarrollo de la minería de datos como herramienta particularmente adecuada para el análisis y modelación de los SCA. Las técnicas y conocimiento desarrollado será de utilidad general en el área de los SCA. Se desarrollará el marco teórico a través de la investigación de algunos SCA definidos que representan áreas de gran impacto social. Entre ellos serán la diabetes mellitus tipo 2 y sus factores de riesgo, inclyendo la relación de obesidad y nutrición y el efecto de estilo de vida. Otra área será la de la criminalidad, donde se relacionará la incidencia de diferentes tipos de delito a factores socio-demográficos y socio-económicos. En el área de las enfermedades emergentes se considerará la construcción del nicho ecológico de las enfermedades emergentes usando como ejemplos Leishmaniasis y la enfermedad de Chagas. Se considerará el vínculo entre el macro y el micro por investigar tanto la genética de los patógenos como su dispersión geográfico a través de los reservorios y vectores con que esta asociado. Así a través de estudiar ejemplos de SCA de gran relevancia social los resultados tendrán un impacto que va más allá que lo académico. Se utilizará vínculos ya establecidos con el sector público, como el IMSS y el Gobierno del D.F., para asegurar que los resultados del proyecto pueden ser difundidas y aprovechados en el sector público.

Información general

Cómo citar esta página

Dirección de Desarrollo Académico, Dirección General de Asuntos del Personal Académico (DGAPA). %%Complejidad y la minería de datos: Aplicaciones a la salud pública y las ciencias sociales%%, Proyectos Universitarios PAPIIT (PAPIIT). En %%Portal de datos abiertos UNAM%% (en línea), México, Universidad Nacional Autónoma de México.
Disponible en: http://datosabiertos.unam.mx/DGAPA:PAPIIT:IN113414
Fecha de actualización: 2019-02-08 00:00:00.0
Fecha de consulta:

Políticas de uso de los datos

@publication_policy@

Contacto de la colección

Para más información sobre los Proyectos PAPIIT, favor de escribir a: Dra. Claudia Cristina Mendoza Rosales, directora de Desarrollo Académico (DGAPA). Correo: ccmendoza #para# dgapa.unam.mx



* Descripción:



Correo electrónico: