home  
 
  ARG
^

SACT

Período 2009-2012
Producción de literatura científica bajo el término descriptor anemia, indizada en Lilacs
En el marco de un plan de capacitación, personal del SACT realizó una serie de cursos online organizados por el Centro Redes y avalados por el CONICET, que generaron diversas actividades. Una de ellas dio lugar al material que se difunde en este número de FABAInforma, relacionado con un trabajo final para uno de los cursos mencionados. En números próximos se continuará con esta tarea de difusión, que complementará otras actividades como cursos breves cuyo dictado ya fue iniciado en  el mes de diciembre de 2013, en FABA



Grisel Tenaglia -
Bibiotecóloga
Prof. Dra. Nilda E. Fink -
Directora SACT

Introducción

El objetivo del presente estudio fue analizar la producción de literatura científica indizada en la base de datos Lilacs correspondiente a la temática Anemias. LILACS es el más importante y abarcador índice de la literatura científica y técnica en Salud de América Latina y de Caribe, indizando, hasta la fecha 867 revistas científicas y asentando un total de 664.310 registros de artículos científicos, tesis y monografías. El período de tiempo de las publicaciones analizadas fue el correspondiente a los años 2009 a 2012.

Material y Métodos

La estrategia de búsqueda utilizada para recuperar los documentos analizados fue la siguiente:
tw:(anemia) AND db:(“LILACS”) AND year_cluster:(“2009” OR “2011” OR “2010” OR “2012”) AND type:(“article”), la cual corresponde a artículos publicados en la base de datos Lilacs, dentro de los años 2009 a 2012, con al menos uno de sus descriptores equivalente al término “anemia”. Cabe señalar que un descriptor es una palabra clave normalizada que define el contenido de un documento, y permite localizarlo en un archivo y recuperarlo. El número de artículos recuperados al aplicarse esta estrategia de búsqueda ascendió a 996.


Gráfico 1. Cantidad de artículos relacionados con la temática “anemia” resultantes de la búsqueda por año de publicación

Gráfico 2. Cantidad de artículos relacionados con la temática "anemia" resultantes de la búsqueda por país y año de publicación, para los cinco países con más producción.

Los resultados, en paquetes de 100 registros, se exportaron en archivos XML, y fueron procesados y estructurados mediante un archivo .bat que reagrupó y normalizó los datos en 5 campos: Título, Resumen, Autor-Afiliación, Revista, Fecha y Descriptores. Todos estos archivos individuales fueron copiados y pegados en una hoja de cálculo de OpenOffice, un paquete de aplicaciones de oficina, similar al paquete Office de Microsoft, de software libre y de código abierto. Por último, se importó la información, ya contenida en una hoja de cálculo, a una base de datos de OpenOffice. Al tener una base de datos con todos los registros, se pudo efectuar las primeras consultas y la extracción de los primeros indicadores, tal como la producción total por año.
Para la extracción de indicadores bibliométricos más complejos y no normalizados, se exportó la base de datos a un formato Excel, y se procesó con la interfaz gráfica Spoon, un diseñador gráfico de transformaciones y trabajos asociado con el sistema de ETL (del inglés, extracción, transformación y carga) Pentaho Data Integration, también conocido como Kettle. Tras aplicar cadenas de procesamiento de texto para los registros de la base de datos, pudimos obtener archivos XLS que agrupaban campos repetibles asociados al registro base, para los descriptores, títulos de revistas, y autor, afiliación y país. Se normalizaron los datos, especialmente para las tablas de país de afiliación y para los descriptores. Estos archivos por separados se importaron nuevamente a la base de datos como tablas. Se establecieron las relaciones entre cada tabla para ligarlas y posteriormente poder efectuar las consultas correspondientes. Se calcularon los indicadores a analizar, y en los casos en que fue posible hacerlo, se aplicaron las leyes bibliométricas correspondientes.

Resultados

A partir del cálculo de los indicadores, abajo detallados, se pudo obtener los siguientes resultados del cuerpo de datos descargado tras la búsqueda bibliográfica en Lilacs para los documentos relacionados a la temática Anemia, publicados en los años 2009-2012.

Indicadores de productividad

*Gráfico 3: Mediante la aplicación de la Ley de Lotka. La Ley de Lotka, o Ley de Crecimiento Exponencial, fue enunciada por Alfred Lotka en el año 1926. Esta Ley enuncia una relación cuantitativa entre los autores y las contribuciones que ellos producen, en un determinado campo y en un determinado período de tiempo. Según esta Ley, un mayor número de autores va a publicar el menor número de trabajos, mientras que un menor número de autores va a publicar un mayor número de trabajos. Esta Ley muestra que existe una distribución desigual y una relación inversa con respecto a la productividad de los autores.

Indicadores de dinámica y colaboración científica


Gráfico 4a. Cantidad de artículos producidos sobre la temática "anemia" por Argentina en colaboración con otros países.


Gráfico 4b. Cantidad de artículos sobre la temática "anemia" para Argentina publicados en colaboración con otros países por año.


Indicadores de especialización Cientifica


Gráfico 5a. Frecuencia de los descriptores (significativos a la temática*).

* En el gráfico 5a se muestran solamente los 10 primeros descriptores significativos que aportan una visión realista de las líneas de investigación de los artículos resultantes de esta búsqueda, dejando de lado descriptores como Humanos, Femenino, Masculino, Adulto, Niño, Adolescente, entre otros.

*Mediante la aplicación de la Ley de Zipf. Esta Ley fue enunciada en 1935 por el lingüista George Kingsley Zipf. Si se enlistan las palabras de un texto de mayor a menor frecuencia de aparición, se percibe la relación existente entre la frecuencia de una palabra y su rango: mientras mayor sea el rango de una palabra, menor será la frecuencia con la que aparece en el texto. La Ley de Zipf enuncia, de manera similar a la Ley de Lotka, que dentro de un texto habrá un pequeño número de palabras que serán utilizadas con mucha frecuencia, mientras que frecuentemente ocurre que un gran número de palabras son poco empleadas. El mayor impacto de este principio es que dejó establecido que el lenguaje natural cumple con patrones estadísticos identificables. Esto dio lugar a la posibilidad de analizar el lenguaje natural desde una perspectiva cuantificable.

Gráfico 5b. Distribución de las frecuencias de los descriptores.


Conclusiones

Este simple análisis ha permitido tener una amplia visión sobre el acervo documental indizado en la base de datos Lilacs para la temática Anemias en el período de 2009 a 2012.
Si bien no es posible observar la producción total correspondientes a las regiones geográficas listadas, en esta temática, Brasil se erige nuevamente como el actor con más producción en literatura científica.
En notable observar también la colaboración entre países latinoamericanos con países europeos y del resto de América. Esto es debido a la creciente copublicación de trabajos que se han desarrollado en colaboración con diferentes instituciones, localizadas en diferentes puntos geográficos, incentivado este fenómeno por los desarrollos en las nuevas tecnologías de comunicación e información, ampliamente explotadas en la actualidad.
Se pudo comprobar la aplicación y el cumplimiento de las leyes de Lotka y de Zipf para el cuerpo de datos analizados.

 



Variabilidad de resultados en las pruebas de carga viral

Producción de literatura científica bajo el término descriptor anemia, indizada en Lilacs

Optimizado para 1024x768px l Recomendado: Explorer 5.0 ó superior.
Soporte Técnico: webmaster@fbpba.org.ar l Diseño:
info@naranhaus.com
Copyrigth © 2003 l Federación Bioquímica de la Provincia de Buenos Aires: secpres@fbpba.org.ar