Cómo se creó: La base de datos nació a petición de la Oficina de Política Científica y Tecnológica de EE. UU. (OSTP, por sus siglas en inglés) a través de una colaboración entre tres organizaciones. La Biblioteca Nacional de Medicina (NLM) de los Institutos Nacionales de Salud de EE. UU. proporcionó acceso a las publicaciones ya existentes científicas; Microsoft usó sus algoritmos de búsqueda para encontrar artículos relevantes; y el Instituto Allen de Inteligencia Artificial (AI2), una organización sin ánimo de lucro, convirtió las páginas web y archivos PDF en un formato estructurado que puede ser procesado por algoritmos. La base de datos ya está disponible en el sitio web Semantic Scholar de AI2 .
nLo que se ha hecho ya: como parte del servicio Semantic Scholar de AI2, que permite a la comunidad científica buscar fácilmente entre la literatura académica, la organización ya ha procesado este nuevo corpus mediante las mismas técnicas de extracción y análisis de información que aplica a todas las investigaciones nuevas. La base ofrece los detalles más importantes de la información, como los autores, métodos, datos y citas, para que los científicos puedan evaluar rápidamente cómo cada artículo se ajusta a la investigación existente.
nTambién utiliza modelos de lenguaje natural de última generación como ELMo y BERT para mapear las similitudes entre los documentos. Este mapa ya ha impulsado una nueva característica en Semantic Scholar que permite a los investigadores crear una fuente de investigación personalizada basada en sus intereses.
nPor qué es importante: los científicos trabajan a contrarreloj para responder a las preguntas urgentes sobre la naturaleza del virus con la esperanza de detener su propagación. La base de datos no solo les ayuda a consolidar la investigación existente en un solo lugar, sino que también hace que la literatura sea más fácil de extraer para obtener información con los algoritmos de procesamiento de lenguaje natural. La OSTP ha lanzado una convocatoria abierta para que los investigadores de inteligencia artificial desarrollen nuevas técnicas para la extracción de texto y datos que ayudarían a la comunidad médica a analizar más rápidamente la gran cantidad de información.
n