El análisis de la cultura científica a través de los medios (prensa digital)

Fuente: Iberoamérica Divulga

29 de mayo de 2016

Se trabaja con grandes cantidades de noticias (por el momento ABC, El Mundo, El País, 2002-2015) que son tratadas mediante técnicas automáticas de text mining a fin de obtener indicadores que permitan evaluar diferentes aspectos de la cultura científica de un país.
Estos indicadores también permiten seleccionar noticias y textos significativos desde diversos puntos de vista, susceptibles de ser analizados de forma cualitativa.

A grandes rasgos, pueden distinguirse varias fases:

  • descarga masiva de noticias de periódicos digitales; implica el uso de técnicas automáticas para dicha descarga y también para la limpieza de dichas noticias (eliminación de publicidad, etc. …)
  • aplicación de un categorizador automático que discrimine y separe las noticias de contenido científico/técnico de las de otros tipos de contenidos; esta fase requiere la elaboración manual de muestras de noticias que puedan servir para entrenar el categorizador. Este programa de categorización, después de un cuidadoso proceso de entrenamiento, consigue una ratio del 94.5 % de aciertos.
  • Aplicación de programas de Topic Detecting, capaces de descubrir los temas acerca de los cuales tratan las noticias científicas, y agrupar o clasificar esas noticias temáticamente.
  • Aplicación de programas de detección de entidades, capaces de identificar y extraer de los textos (noticias) las personas, empresas, organizaciones y lugares geográficos que aparecen. Las listas de estas entidades han sido sometidas aun procesi de revisión manual, corrigiendo errores y normalizando nombres, así como haciendo una clasificación bastante más precisa de las categorías o tipos básicos de entidades.

Las técnicas e instrumentos tecnológicos (fundamentalmente software) han sido diseñados en su mayor parte por investigadores del ECyT a partir de componentes de software libre y están listos para su uso.

El modelo, que está ya en explotación, es fácilmente extensible a otros periódicos digitales y a otros países.

Una descripción más extensa puede encontrarse en:

The vision of Science through the Spanish general Press, http://grulla.usal.es/ciberica

Tamar Groves, Carlos G. Figuerola, and Miguel A. Quintanilla (2015): Ten years of science news: A longitudinal analysis of scientific culture in the Spanish digital press, Public Understanding of Science, DOI 0.1177/0963662515576864, URL: http://pus.sagepub.com/content/early/2015/04/02/0963662515576864.full.pdf?ijkey=z5fpkzzGzzb5kZH&keytype=finite

Esta investigación está siendo financiado parcialmente en la actualidad por FECYT (ref. FCT-15-10287)

Instituto ECyT: http://ecyt.usal.es/

Palabras clave:

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s