Show simple item record

dc.contributor.authorKrallinger, Martin 
dc.contributor.authorIntxaurrondo, Ander
dc.contributor.authorPrimo-Peña, Elena 
dc.contributor.authorBojo Canales, Cristina 
dc.contributor.authorNentidis, A.
dc.contributor.authorVillegas, M.
dc.date.accessioned2019-04-15T10:10:00Z
dc.date.available2019-04-15T10:10:00Z
dc.date.issued2019-04
dc.identifier.citationIniciativas de evaluación para la indización semántica de literatura médica en español: PLANTL, LILACS, IBECS Y BIOASQ. Bibliosalud 2019es_ES
dc.identifier.urihttp://hdl.handle.net/20.500.12105/7459
dc.descriptionXVI Jornadas Nacionales de Información y Documentación en Ciencias de la Salud. Oviedo, 4-5 de abril de 2019es_ES
dc.description.abstractEl proyecto Faro de Sanidad del Plan de Impulso de las Tecnologías del Lenguaje (PlanTL) pretende fomentar el desarrollo de sistemas de procesamiento del lenguaje natural (PLN), minería de textos y traducción automática para español y lenguas cooficiales. Una actividad importante del PlanTL es la organización de campañas de evaluación de sistemas de PLN y minería de textos, un mecanismo que no sólo es clave para evaluar la calidad de los resultados obtenidos por sistemas y algoritmos predictivos, sino que representa un motor fundamental para fomentar el desarrollo de herramientas y recursos de tecnologías del lenguaje. Debido a la importancia de la literatura para la toma de decisiones en medicina y el volumen considerable de publicaciones en español, el Plan TL, en colaboración con el BSC, el CNIO, la BNCS y la iniciativa BioASQ ha lanzado una tarea competitiva relacionada con la indización automática de la literatura médica en español con términos DeCS. Su fin es generar recursos de etiquetado semántico que sirvan de ayuda a la indización manual. La tarea BioASQ (bioasq.org) de indización semántica biomédica en español se realizará usando resúmenes de artículos de revistas contenidas en las bases de datos LILACS (Literatura Lationamericana en Ciencias de la Salud) y IBECS1 (Índice Bibliográfico Español en Ciencias de la Salud) como conjunto básico etiquetado y, a partir de ellos, desarrollar los algoritmos de indización automática, facilitando así el desarrollo de modelos de inteligencia artificial. La evaluación de los sistemas se realiza con la plataforma de BioASQ, mediante un sistema de evaluación continua. En él, se solicita a los participantes que asignen automáticamente términos DeCS a los registros nuevos añadidos a las bases de datos a medida que se hacen públicos, y antes de que se haya completado la indización manual. El rendimiento de indización se calcula comparando indización automática y manual. Gracias a los resultados de ediciones previas de BioASQ para la indización de PubMed, se ha mejorado este proceso en dicho recurso. Esta tarea de indización biomédica en español servirá para generar recursos comparables para indizar LILACS e IBECS y otros conjuntos documentales.es_ES
dc.description.abstractThe health flagship project of the Plan for the Advancement of Language Technology (PlanTL) tries to promote the development of natural language processing systems (NLP), text mining and machine translation resources for Spanish and co-official languages. There is a growing demand for a better exploitation of datasets generated by clinicians, especially electronic health records, as well as the integration and management of this kind of data in personalized medicine platforms integrating also information extracted from the literature. In this context, the PlanTL collaborates in the organization of evaluation efforts of clinical NLP and text mining systems, a key mechanism to evaluate the quality of results obtained by such automated systems and a fundamental mechanism to promote the development of tools and resources related to language technologies. Given the importance of literature for medical decision-making and the growing volume of Spanish medical publications, the TL Plan, in collaboration with the BSC, CNIO, the Biblioteca Nacional de Ciencias de la Salud and the BioASQ team have launched a shared task on automatic indexing of abstracts in Spanish with DeCS terms. The aim of this tracks is to generate semantic annotation resources that can be used to assist manual indexing. The Spanish biomedical semantic indexing track of BioASQ (bioasq.org) will rely on abstracts of journals contained in the LILACS databases as a basic Gold Standard manually labeled benchmark set for the development of automatic indexing algorithms particularly those based on artificial intelligence language models. The evaluation of participating systems is done through the BioASQ platform, which requests results in a continuous evaluation process, i.e. automatically asking for DeCS term assignment for newly added documents to LILACS, as they are made public, and before the manual indexing results are publicly released. The indexing performance in BioASQ is calculated by comparing automatic indexing against manual annotations. Thanks to the results of previous editions of BioASQ for indexing PubMed, the MeSH indexing process of this resource was considerably improved. This novel effort on medical indexing in Spanish will serve to generate comparable resources to semantically index not only LILACS but also other health databases and repositories in Spanish.
dc.language.isospaes_ES
dc.relation.isreferencedbyVillegas, Marta, et al. "Esfuerzos para fomentar la minería de textos en biomedicina más allá del inglés: el plan estratégico nacional español para las tecnologías del lenguaje." Procesamiento del Lenguaje Natural 59 (2017): 141-144.es_ES
dc.relation.isreferencedbyHuang, Chung-Chi, and Zhiyong Lu. "Community challenges in biomedical text mining over 10 years: success, failure and the future." Briefings in bioinformatics 17.1 (2015): 132-144es_ES
dc.relation.isreferencedbyChapman, Wendy W., et al. "Overcoming barriers to NLP for clinical text: the role of shared tasks and the need for additional creative solutions." (2011): 540-543.es_ES
dc.relation.isreferencedbyPrimo-Peña, Elena, and José-Manuel Estrada-Lorenzo. "Las bases de datos bibliográficas españolas, un instrumento para el conocimiento y la difusión de la producción científica." Seminarios de la Fundación Española de Reumatología 10.4 (2009): 132-141es_ES
dc.relation.isreferencedbyMariani J, Paroubek P, Francopoulo G, Hamon O. Rediscovering 15 years of discoveries in language resources and evaluation: The LREC anthology analysis. InProceedings of LREC 2014 May (pp. 26-31).es_ES
dc.relation.isreferencedbyTsatsaronis G, Balikas G, Malakasiotis P, Partalas I, Zschunke M, Alvers MR, Weissenborn D, Krithara A, Petridis S, Polychronopoulos D, Almirantis Y. Anoverview of the BIOASQ large-scale biomedical semantic indexing and question answering competition. BMC bioinformatics. 2015 Dec;16(1):138.es_ES
dc.relation.isreferencedbyMork JG, Demner-Fushman D, Schmidt S, Aronson AR. Recent Enhancements to the NLM Medical Text Indexer. InCLEF (Working Notes) 2014 Sep 15 (pp. 1328-1336).es_ES
dc.relation.isreferencedbyAronson AR, Mork JG, Gay CW, Humphrey SM, Rogers WJ. The NLM indexing initiative's medical text indexer. Medinfo. 2004 Sep;89es_ES
dc.relation.isreferencedbySoares F, Becker K. UFRGS Participation on the WMT Biomedical Translation Shared Task. InProceedings of the Third Conference on Machine Translation: Shared Task Papers 2018 (pp. 662-666).es_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/*
dc.subjectSemantic annotationes_ES
dc.subjectText mininges_ES
dc.subjectAutomatic indexinges_ES
dc.subjectIndización automática de textoses_ES
dc.subjectAnotación semánticaes_ES
dc.subjectMinería de textoses_ES
dc.titleIniciativas de evaluación para la indización semántica de literatura médica en español: PLANTL, LILACS, IBECS Y BIOASQes_ES
dc.typeComunicaciónes_ES
dc.rights.licenseAtribución-NoComercial-CompartirIgual 4.0 Internacional*
dc.description.peerreviewedNoes_ES
dc.repisalud.centroISCIII::Biblioteca Nacional de Ciencias de la Saludes_ES
dc.repisalud.institucionISCIIIes_ES
dc.repisalud.orgCNIOCNIOes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES


Files in this item

Acceso Abierto
Thumbnail
Acceso Abierto
Thumbnail
Acceso Abierto
Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial-CompartirIgual 4.0 Internacional
This item is licensed under a: Atribución-NoComercial-CompartirIgual 4.0 Internacional