Herramienta de chequeo de registro xml obtenido desde SEDICI (UNLP)

XML

<oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><identifier>I19-R120-10915-136673</identifier><datestamp>2022-05-20T20:01:13Z</datestamp>
<dc:identifier>http://sedici.unlp.edu.ar/handle/10915/136673</dc:identifier>
<dc:identifier>isbn:978-950-34-2109-3</dc:identifier>
<dc:title>Datos abiertos: gestión de datos de investigación</dc:title>
<dc:creator>Sucar Succar, Enrique</dc:creator>
<dc:date>2021-10</dc:date>
<dc:date>2021</dc:date>
<dc:date>2022-05-20T18:40:58Z</dc:date>
<dc:language>es</dc:language>
<dc:subject>Bibliotecología</dc:subject>
<dc:subject>Informática</dc:subject>
<dc:subject>Bases de datos</dc:subject>
<dc:subject>Datos abiertos</dc:subject>
<dc:subject>COVID-19</dc:subject>
<dc:subject>Modelos causales</dc:subject>
<dc:subject>Descubrimiento causal</dc:subject>
<dc:description>Las bases de datos (BD) son el «oro» de la investigación científica, por lo que es importante hacerlas accesibles a la comunidad; sin embargo, en algunos campos, como la medicina, es díficil encontrar bases de datos abiertas. No obstante, es posible «pre-procesar» estas BD para hacerlas accesibles y a su vez proteger los datos sensibles. Un buen ejemplo de esto es la Base de Datos Mexicana de COVID-19, resultado de la colaboración de la Secretaría de Salud y la Universidad Nacional Autonóma de México. Cuenta con 6,5 millones de individuos con 97 variables y se actualiza diariamente. Dicha BD está accesible para fines de investigación y presenta información de carácter público recopilada a través de la Dirección General de Epidemiología de la Secretaría de Salud, que es curada y divulgada por la UNAM. LA BD incluye información de pruebas, hospitalización y decesos de 5.186 unidades públicas y privadas distribuidas en los tres niveles del sistema de salud mexicano. El proceso de curación de esta BD consistió, en primer lugar, en la eliminación de toda la información sensible (especialmente datos de identidad de los individuos), por parte de un equipo de expertos de la UNAM. Luego, se realizaron distintas tareas de estandarización de los datos, que facilitaron los procesos de minería de datos y otros que la vuelven accesible con fines de investigación. La BD accesible contiene 97 campos que pueden agruparse en Información general del paciente, Síntomas, Comorbilidades, Diagnóstico y tratamiento y Resultados. Para el análisis se seleccionaron 47 variables, a partir de las cuales se pueden obtener estadísticas (se muestran ejemplos con distintos gráficos):&#13;
evolución de la pandemia; número de casos por ocupación; número de casos por síntomas; recuperados y defunciones por comorbilidades; riesgo de fallecimiento por edad y comorbilidades. Modelos causales: en las técnicas tradicionales de minería de datos se obtienen asociaciones o correlaciones entre las variables que pueden ser engañosas; para evitar esto e ir más allá, es necesario aprender sobre relaciones causales, lo que se conoce como «descubrimiento causal». Se trata del co-factor (o causa común) que puede haber entre dos variables y que explicaría la correlación encontrada. En general, los humanos pensamos en términos causales (tal cosa causa tal otra), por lo que la ciencia de la causalidad procura entender este mecanismo de razonamiento causal formalmente, para emularlo luego en las computadoras.&#13;
En los últimos años ha habido importantes avances en este sentido, especialmente en los modelos gráficos causales: representación del conocimiento causal e inferencia causal (poder predecir el efecto de determinadas intervenciones o imaginar escenarios alternativos). Hay tres niveles de causalidad: asociación (regularidad); intervención (predicción de efectos) y contrafactuales (imaginación, introspección). Los modelos estadísticos tradicionales sólo permiten hacer asociaciones, mientras que los modelos causales permiten la intervención y los escenarios contrafactuales. En este sentido, se destacan las redes bayesianas causales, que son modelos gráficos que representan variables causales (arcos) entre variables (nodos) e implican suposiciones más fuertes que las redes bayesianas y permiten hacer razonamientos causales. Para aprender entonces relaciones causales es preciso hacer experimentos; por ejemplo, lo que se ha hecho con las vacunas contra el COVID; pero no siempre es posible hacer estos experimentos. En cambio, es posible obtener modelos causales a partir de datos observacionales, que abundan en muchos dominios. Para ello, se debe incluir una serie de suposiciones (suficiencia causal, por ejemplo), asumir cierto tipo de distribuciones de los datos (modelos lineales gaussianos), tener un gran conocimiento previo de los datos y realizar algunas intervenciones para distinguir entre modelos equivalentes, estadísticamente hablando. Para esto último, se utiliza el cálculo de efectos causales, en el que se interviene una variable y se estima el efecto en otras. Actualmente, se está tratando de encontrar información causal en la Base de Datos Mexicana de COVID-19, de modo que pueda servir para ayudar a los investigadores. Para ello, se aplicaron diversos algoritmos de aprendizaje causal en la BD, se enfocó en la relación de ciertas variables con la mortalidad y se analizaron los datos de las tres principales olas de la pandemia en México para tratar en entender mejor el fenómeno y las diferencias entre las etapas. Se muestran algunos resultados para las ciudades de Yucatán y CDMX. Esta investigación, todavía en curso, demuestra que la BD es un buen ejemplo de lo que puede obtenerse con estas técnicas, que permitirán desarrollar sistemas inteligentes más robustos y explicables, así como generar conocimiento útil para la toma de decisiones.&#13;
Para el trabajo a futuro, se continuará analizando la BD, se incluirá información sobre la genética del virus y se realizarán nuevos modelos de sujetos y de grupos específicos para poder hacer una mejor transferencia de conocimiento.</dc:description>
<dc:description>Ibero-American Science and Technology Education Consortium</dc:description>
<dc:type>Objeto de conferencia</dc:type>
<dc:type>Objeto de conferencia</dc:type>
<dc:rights>http://creativecommons.org/licenses/by-nc-sa/4.0/</dc:rights>
<dc:rights>Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)</dc:rights>
<dc:format>application/pdf</dc:format>
<dc:format>28-30</dc:format>
</oai_dc:dc>

Datos convertidos

{
    "id": "I19-R120-10915-136673",
    "record_format": "dspace",
    "institution": [
        "Universidad Nacional de La Plata"
    ],
    "institution_str": "I-19",
    "repository_str": "R-120",
    "collection": [
        "SEDICI (UNLP)"
    ],
    "language": [
        "Espa\u00f1ol"
    ],
    "topic": [
        "Bibliotecolog\u00eda",
        "Inform\u00e1tica",
        "Bases de datos",
        "Datos abiertos",
        "COVID-19",
        "Modelos causales",
        "Descubrimiento causal"
    ],
    "spellingShingle": [
        "Bibliotecolog\u00eda",
        "Inform\u00e1tica",
        "Bases de datos",
        "Datos abiertos",
        "COVID-19",
        "Modelos causales",
        "Descubrimiento causal",
        "Sucar Succar, Enrique",
        "Datos abiertos: gesti\u00f3n de datos de investigaci\u00f3n"
    ],
    "topic_facet": [
        "Bibliotecolog\u00eda",
        "Inform\u00e1tica",
        "Bases de datos",
        "Datos abiertos",
        "COVID-19",
        "Modelos causales",
        "Descubrimiento causal"
    ],
    "description": "Las bases de datos (BD) son el \u00aboro\u00bb de la investigaci\u00f3n cient\u00edfica, por lo que es importante hacerlas accesibles a la comunidad; sin embargo, en algunos campos, como la medicina, es d\u00edficil encontrar bases de datos abiertas. No obstante, es posible \u00abpre-procesar\u00bb estas BD para hacerlas accesibles y a su vez proteger los datos sensibles. Un buen ejemplo de esto es la Base de Datos Mexicana de COVID-19, resultado de la colaboraci\u00f3n de la Secretar\u00eda de Salud y la Universidad Nacional Auton\u00f3ma de M\u00e9xico. Cuenta con 6,5 millones de individuos con 97 variables y se actualiza diariamente. Dicha BD est\u00e1 accesible para fines de investigaci\u00f3n y presenta informaci\u00f3n de car\u00e1cter p\u00fablico recopilada a trav\u00e9s de la Direcci\u00f3n General de Epidemiolog\u00eda de la Secretar\u00eda de Salud, que es curada y divulgada por la UNAM. LA BD incluye informaci\u00f3n de pruebas, hospitalizaci\u00f3n y decesos de 5.186 unidades p\u00fablicas y privadas distribuidas en los tres niveles del sistema de salud mexicano. El proceso de curaci\u00f3n de esta BD consisti\u00f3, en primer lugar, en la eliminaci\u00f3n de toda la informaci\u00f3n sensible (especialmente datos de identidad de los individuos), por parte de un equipo de expertos de la UNAM. Luego, se realizaron distintas tareas de estandarizaci\u00f3n de los datos, que facilitaron los procesos de miner\u00eda de datos y otros que la vuelven accesible con fines de investigaci\u00f3n. La BD accesible contiene 97 campos que pueden agruparse en Informaci\u00f3n general del paciente, S\u00edntomas, Comorbilidades, Diagn\u00f3stico y tratamiento y Resultados. Para el an\u00e1lisis se seleccionaron 47 variables, a partir de las cuales se pueden obtener estad\u00edsticas (se muestran ejemplos con distintos gr\u00e1ficos):\r\nevoluci\u00f3n de la pandemia; n\u00famero de casos por ocupaci\u00f3n; n\u00famero de casos por s\u00edntomas; recuperados y defunciones por comorbilidades; riesgo de fallecimiento por edad y comorbilidades. Modelos causales: en las t\u00e9cnicas tradicionales de miner\u00eda de datos se obtienen asociaciones o correlaciones entre las variables que pueden ser enga\u00f1osas; para evitar esto e ir m\u00e1s all\u00e1, es necesario aprender sobre relaciones causales, lo que se conoce como \u00abdescubrimiento causal\u00bb. Se trata del co-factor (o causa com\u00fan) que puede haber entre dos variables y que explicar\u00eda la correlaci\u00f3n encontrada. En general, los humanos pensamos en t\u00e9rminos causales (tal cosa causa tal otra), por lo que la ciencia de la causalidad procura entender este mecanismo de razonamiento causal formalmente, para emularlo luego en las computadoras.\r\nEn los \u00faltimos a\u00f1os ha habido importantes avances en este sentido, especialmente en los modelos gr\u00e1ficos causales: representaci\u00f3n del conocimiento causal e inferencia causal (poder predecir el efecto de determinadas intervenciones o imaginar escenarios alternativos). Hay tres niveles de causalidad: asociaci\u00f3n (regularidad); intervenci\u00f3n (predicci\u00f3n de efectos) y contrafactuales (imaginaci\u00f3n, introspecci\u00f3n). Los modelos estad\u00edsticos tradicionales s\u00f3lo permiten hacer asociaciones, mientras que los modelos causales permiten la intervenci\u00f3n y los escenarios contrafactuales. En este sentido, se destacan las redes bayesianas causales, que son modelos gr\u00e1ficos que representan variables causales (arcos) entre variables (nodos) e implican suposiciones m\u00e1s fuertes que las redes bayesianas y permiten hacer razonamientos causales. Para aprender entonces relaciones causales es preciso hacer experimentos; por ejemplo, lo que se ha hecho con las vacunas contra el COVID; pero no siempre es posible hacer estos experimentos. En cambio, es posible obtener modelos causales a partir de datos observacionales, que abundan en muchos dominios. Para ello, se debe incluir una serie de suposiciones (suficiencia causal, por ejemplo), asumir cierto tipo de distribuciones de los datos (modelos lineales gaussianos), tener un gran conocimiento previo de los datos y realizar algunas intervenciones para distinguir entre modelos equivalentes, estad\u00edsticamente hablando. Para esto \u00faltimo, se utiliza el c\u00e1lculo de efectos causales, en el que se interviene una variable y se estima el efecto en otras. Actualmente, se est\u00e1 tratando de encontrar informaci\u00f3n causal en la Base de Datos Mexicana de COVID-19, de modo que pueda servir para ayudar a los investigadores. Para ello, se aplicaron diversos algoritmos de aprendizaje causal en la BD, se enfoc\u00f3 en la relaci\u00f3n de ciertas variables con la mortalidad y se analizaron los datos de las tres principales olas de la pandemia en M\u00e9xico para tratar en entender mejor el fen\u00f3meno y las diferencias entre las etapas. Se muestran algunos resultados para las ciudades de Yucat\u00e1n y CDMX. Esta investigaci\u00f3n, todav\u00eda en curso, demuestra que la BD es un buen ejemplo de lo que puede obtenerse con estas t\u00e9cnicas, que permitir\u00e1n desarrollar sistemas inteligentes m\u00e1s robustos y explicables, as\u00ed como generar conocimiento \u00fatil para la toma de decisiones.\r\nPara el trabajo a futuro, se continuar\u00e1 analizando la BD, se incluir\u00e1 informaci\u00f3n sobre la gen\u00e9tica del virus y se realizar\u00e1n nuevos modelos de sujetos y de grupos espec\u00edficos para poder hacer una mejor transferencia de conocimiento.",
    "format": [
        "Objeto de conferencia",
        "Objeto de conferencia"
    ],
    "author": [
        "Sucar Succar, Enrique"
    ],
    "author_facet": [
        "Sucar Succar, Enrique"
    ],
    "author_sort": "Sucar Succar, Enrique",
    "title": "Datos abiertos: gesti\u00f3n de datos de investigaci\u00f3n",
    "title_short": "Datos abiertos: gesti\u00f3n de datos de investigaci\u00f3n",
    "title_full": "Datos abiertos: gesti\u00f3n de datos de investigaci\u00f3n",
    "title_fullStr": "Datos abiertos: gesti\u00f3n de datos de investigaci\u00f3n",
    "title_full_unstemmed": "Datos abiertos: gesti\u00f3n de datos de investigaci\u00f3n",
    "title_sort": "datos abiertos: gesti\u00f3n de datos de investigaci\u00f3n",
    "publishDate": [
        "2021"
    ],
    "url": [
        "http:\/\/sedici.unlp.edu.ar\/handle\/10915\/136673"
    ],
    "work_keys_str_mv": [
        "AT sucarsuccarenrique datosabiertosgestiondedatosdeinvestigacion"
    ],
    "_version_": 1734878541897531392,
    "spelling": [
        "I19-R120-10915-1366732022-05-20T20:01:13Z http:\/\/sedici.unlp.edu.ar\/handle\/10915\/136673 isbn:978-950-34-2109-3 Datos abiertos: gesti\u00f3n de datos de investigaci\u00f3n Sucar Succar, Enrique 2021-10 2021 2022-05-20T18:40:58Z es Bibliotecolog\u00eda Inform\u00e1tica Bases de datos Datos abiertos COVID-19 Modelos causales Descubrimiento causal Las bases de datos (BD) son el \u00aboro\u00bb de la investigaci\u00f3n cient\u00edfica, por lo que es importante hacerlas accesibles a la comunidad; sin embargo, en algunos campos, como la medicina, es d\u00edficil encontrar bases de datos abiertas. No obstante, es posible \u00abpre-procesar\u00bb estas BD para hacerlas accesibles y a su vez proteger los datos sensibles. Un buen ejemplo de esto es la Base de Datos Mexicana de COVID-19, resultado de la colaboraci\u00f3n de la Secretar\u00eda de Salud y la Universidad Nacional Auton\u00f3ma de M\u00e9xico. Cuenta con 6,5 millones de individuos con 97 variables y se actualiza diariamente. Dicha BD est\u00e1 accesible para fines de investigaci\u00f3n y presenta informaci\u00f3n de car\u00e1cter p\u00fablico recopilada a trav\u00e9s de la Direcci\u00f3n General de Epidemiolog\u00eda de la Secretar\u00eda de Salud, que es curada y divulgada por la UNAM. LA BD incluye informaci\u00f3n de pruebas, hospitalizaci\u00f3n y decesos de 5.186 unidades p\u00fablicas y privadas distribuidas en los tres niveles del sistema de salud mexicano. El proceso de curaci\u00f3n de esta BD consisti\u00f3, en primer lugar, en la eliminaci\u00f3n de toda la informaci\u00f3n sensible (especialmente datos de identidad de los individuos), por parte de un equipo de expertos de la UNAM. Luego, se realizaron distintas tareas de estandarizaci\u00f3n de los datos, que facilitaron los procesos de miner\u00eda de datos y otros que la vuelven accesible con fines de investigaci\u00f3n. La BD accesible contiene 97 campos que pueden agruparse en Informaci\u00f3n general del paciente, S\u00edntomas, Comorbilidades, Diagn\u00f3stico y tratamiento y Resultados. Para el an\u00e1lisis se seleccionaron 47 variables, a partir de las cuales se pueden obtener estad\u00edsticas (se muestran ejemplos con distintos gr\u00e1ficos): evoluci\u00f3n de la pandemia; n\u00famero de casos por ocupaci\u00f3n; n\u00famero de casos por s\u00edntomas; recuperados y defunciones por comorbilidades; riesgo de fallecimiento por edad y comorbilidades. Modelos causales: en las t\u00e9cnicas tradicionales de miner\u00eda de datos se obtienen asociaciones o correlaciones entre las variables que pueden ser enga\u00f1osas; para evitar esto e ir m\u00e1s all\u00e1, es necesario aprender sobre relaciones causales, lo que se conoce como \u00abdescubrimiento causal\u00bb. Se trata del co-factor (o causa com\u00fan) que puede haber entre dos variables y que explicar\u00eda la correlaci\u00f3n encontrada. En general, los humanos pensamos en t\u00e9rminos causales (tal cosa causa tal otra), por lo que la ciencia de la causalidad procura entender este mecanismo de razonamiento causal formalmente, para emularlo luego en las computadoras. En los \u00faltimos a\u00f1os ha habido importantes avances en este sentido, especialmente en los modelos gr\u00e1ficos causales: representaci\u00f3n del conocimiento causal e inferencia causal (poder predecir el efecto de determinadas intervenciones o imaginar escenarios alternativos). Hay tres niveles de causalidad: asociaci\u00f3n (regularidad); intervenci\u00f3n (predicci\u00f3n de efectos) y contrafactuales (imaginaci\u00f3n, introspecci\u00f3n). Los modelos estad\u00edsticos tradicionales s\u00f3lo permiten hacer asociaciones, mientras que los modelos causales permiten la intervenci\u00f3n y los escenarios contrafactuales. En este sentido, se destacan las redes bayesianas causales, que son modelos gr\u00e1ficos que representan variables causales (arcos) entre variables (nodos) e implican suposiciones m\u00e1s fuertes que las redes bayesianas y permiten hacer razonamientos causales. Para aprender entonces relaciones causales es preciso hacer experimentos; por ejemplo, lo que se ha hecho con las vacunas contra el COVID; pero no siempre es posible hacer estos experimentos. En cambio, es posible obtener modelos causales a partir de datos observacionales, que abundan en muchos dominios. Para ello, se debe incluir una serie de suposiciones (suficiencia causal, por ejemplo), asumir cierto tipo de distribuciones de los datos (modelos lineales gaussianos), tener un gran conocimiento previo de los datos y realizar algunas intervenciones para distinguir entre modelos equivalentes, estad\u00edsticamente hablando. Para esto \u00faltimo, se utiliza el c\u00e1lculo de efectos causales, en el que se interviene una variable y se estima el efecto en otras. Actualmente, se est\u00e1 tratando de encontrar informaci\u00f3n causal en la Base de Datos Mexicana de COVID-19, de modo que pueda servir para ayudar a los investigadores. Para ello, se aplicaron diversos algoritmos de aprendizaje causal en la BD, se enfoc\u00f3 en la relaci\u00f3n de ciertas variables con la mortalidad y se analizaron los datos de las tres principales olas de la pandemia en M\u00e9xico para tratar en entender mejor el fen\u00f3meno y las diferencias entre las etapas. Se muestran algunos resultados para las ciudades de Yucat\u00e1n y CDMX. Esta investigaci\u00f3n, todav\u00eda en curso, demuestra que la BD es un buen ejemplo de lo que puede obtenerse con estas t\u00e9cnicas, que permitir\u00e1n desarrollar sistemas inteligentes m\u00e1s robustos y explicables, as\u00ed como generar conocimiento \u00fatil para la toma de decisiones. Para el trabajo a futuro, se continuar\u00e1 analizando la BD, se incluir\u00e1 informaci\u00f3n sobre la gen\u00e9tica del virus y se realizar\u00e1n nuevos modelos de sujetos y de grupos espec\u00edficos para poder hacer una mejor transferencia de conocimiento. Ibero-American Science and Technology Education Consortium Objeto de conferencia Objeto de conferencia http:\/\/creativecommons.org\/licenses\/by-nc-sa\/4.0\/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application\/pdf 28-30"
    ]
}