domingo 22 de noviembre de 2009

El repositorio arXiv sera mas interactivo

El repositorio arXiv será más interactivo
17 nov 2009

ArXiv, el repositorio de física, electrónica, informática,
matemáticas, estadística y finanzas, iniciado por Los Alamos National
Laboratory y actualmente gestionado por la Cornell University,
convertirá su base de datos en un sistema más interactivo. Será un
lugar donde autores, artículos, bases de datos y lectores se
comuniquen entre sí para ayudar a los usuarios a identificar los
principales conceptos de las obras, ver los informes de investigación
en su contexto y encontrar fácilmente trabajos relacionados. Se
desarrollará durante 3 años gracias a una subvención de la National
Science Foundation de 883.000 dólares, estimulada por la American
Recovery and Reinvestment Act (ARRA) (Ley Americana de Recuperación y
Reinversión).

ArXiv contiene actualmente 600.000 artículos, con un aumento de 5.000
mensuales. En general, los investigadores depositan en él sus trabajos
como "borradores" antes de su publicación oficial en revistas o congresos .

Las nuevas herramientas que se implementarán unirán los documentos
mediante conceptos, y no sólo por las citas que contienen. Con ello se
espera ayudar a los usuarios sin conocimientos técnicos avanzados, y
personas de fuera de la comunidad científica a comprender la
importancia y el interés de las nuevas investigaciones. El sistema
también señalará las bases de datos relacionadas y comentarios.

Con la informática podemos buscar documentos mediante palabras o
frases específicas, pero los conceptos no siempre se describen con las
mismas palabras exactas, y algunas palabras significan cosas distintas
en lugares diferentes. Se diseñarán nuevos algoritmos que utilizarán
un enfoque "más difuso" (fuzzier), infiriendo los conceptos a partir
de cómo se usan los términos, y harán un seguimiento de otros
documentos relacionados a lo largo de cinco o diez años. Por
consiguiente los usuarios podrán ver la "genealogía" de las ideas. Los
nuevos documentos estarán vinculados a definiciones y reglas que
permitirán a las máquinas "razonar" sobre ellos, e inferir relaciones.

Entre otras mejoras también se ofrecerá interoperabilidad con otros
sitios de investigación, tales como PubMedCentral, y disposiciones que
permitan a los científicos contribuir con nuevos formatos de texto más
flexibles.

Nota de prensa original:
http://www.news.cornell.edu/stories/Nov09/ARRAarXiv.html

Traducción: Tomàs Baiget

http://elprofesionaldelainformacion.com

----------------------------------------------------
Archivos de INCYT: http://listserv.rediris.es/archives/incyt.html
------------------------------------------------------

lunes 16 de noviembre de 2009

Modelos de evaluacion de calidad y prediccion de impacto (TBaiget)

Me llega esta noticia, que me suena un poco a ciencia ficción, pero el
sitio web parece serio:
http://www.nyuinformatics.org/research/labs/eirsl

El New York University - Center for Health Informatics and
Bioinformatics (Chibi) tiene un laboratorio llamado Evidence based
medicine information retrieval and scientometrics lab (Eirsl) que dice
haber desarrollado un método de filtrado basado en el reconocimiento
de patrones que puede identificar automáticamente el contenido y la
calidad tanto de páginas web como de artículos científicos. Los
modelos aceleran la búsqueda y la síntesis de la literatura,
centrándose en el contenido de artículos específicos de más calidad
metodológica.

El trabajo del Eirsl ha demostrado que es posible aumentar las medidas
tradicionales de calidad bibliométricas, como el recuento de citas y
factor de impacto, utilizando enfoques de aprendizaje de máquina. En
particular, los métodos de aprendizaje de máquina predicen con
exactitud el número de citas en un horizonte de 10 años después de la
publicación, utilizando sólo los datos disponibles en el momento de la
publicación. La predicción de citas podría ser un potente filtro para
centrar la atención en las publicaciones recientes que tienen más
probabilidades de influir en los nuevos avances científicos y clínicos.

Los métodos de aprendizaje de máquina también puede caracterizar con
precisión la naturaleza de una cita como esencial o no. El númerode
citas se ajusta descartando las que no son importantes para los
documentos citados, ya que muchos de ellos reciben citas por otras
causas que no tienen nada que ver con su calidad (por ejemplo, pueden
ser citados para su refutación, etc.) Eirsl hará avanzar el estado del
arte en estas áreas, ampliando el número y el alcance de estos modelos
y su entrega a los investigadores y los pacientes a través de
colaboraciones con la Ehrman Medical Library para evaluar la eficacia
de estos métodos y para orientar sus futuras mejoras.

Eirsl también desarrollará nuevas tecnologías basadas en el
reconocimiento de patrones para identificar con precisión el contenido
y la calidad de Medline, y documentos web. El objetivo es identificar
rápidamente los resultados de investigación de mayor impacto y de
mayor calidad, a fin de acelerar su uso tanto para la investigación
como para la atención clínica.

Resumen de diapositivas de los métodos Eirsl:
-Modelos de reconocimiento de patrones para predecir las citas. Ver
esquema del proceso:
http://www.nyuinformatics.org/files/chibi/attachments/Intro.pdf
-Modelos de reconocimiento de patrones para identificar artículos y
páginas web de alta y baja calidad. Ver esquema del proceso:
http://webdoc.nyumc.org/nyumc/files/chibi/attachments/Filters.pdf


Tomàs Baiget
http://elprofesionaldelainformacion.com

lunes 12 de octubre de 2009

Nueva guia de SPARC sobre la publicacion en OA (TBaiget)

La Scholarly Publishing and Academic Resources Coalition (SPARC) ha
publicado la versión definitiva de una guía que examina la cuestión de
la sostenibilidad para los editores actuales y futuros en acceso
abierto. La guía 'Income models for Open Access: An overview of
current practice' (modelos de ingresos para el Open Access: Una visión
general de las prácticas actuales), examina las formas de obtener
dinero por parte de los editores (como tasas de proceso de artículo,
publicidad) y por parte de los lectores (según la versión, pago por
uso, etc.). La guía proporciona una visión general de los modelos de
ingresos actualmente en uso para financiar las revistas de acceso
abierto, con descripción de cada modelo, junto con ejemplos de
revistas que actualmente lo emplean.

Desde su creación, SPARC ha apoyado modelos y políticas de publicación
que amplíen el acceso a resultados de la investigación revisados por
pares, y ha reconocido que esto tiene implicaciones financieras para
la sociedad y otros editores sin fines de lucro. La guía SPARC tiene
como objetivo apoyar el desarrollo de modelos sólidos de negocio para
el OA ofreciendo un panorama general de las prácticas actuales, así
como una guía práctica para que los editores evalúen la viabilidad y
el potencial financiero de los modelos de ingresos seleccionados.

El desarrollo de un modelo de negocio sólido es una preocupación
fundamental para todos los editores y el proceso puede ser
especialmente difícil para aquellos que están considerando la
distribución de acceso abierto. La guía reconoce que las necesidades
de las revistas individuales difieren, y que los editores pueden
aplicar una variedad de modelos de ingresos para suvencionar la
distribución en acceso abierto. El modelo correcto debe tener en
cuenta no sólo las necesidades de la editorial de cubrir los gastos,
sino también los objetivos y la misión de la organización, tamaño,
recursos de gestión empresarial, y otros factores.

"Modelos de ingresos para el Open Access: Una visión general de la
práctica actual" está disponible gratuitamente para leer o descargar
en línea.
La guía se complementa con una web, que invita a la discusión
comunitaria sobre los modelos descritos, así como a contribuciones
correspondientes a otros nuevos modelos.

La guía está disponible en línea en:
http://www.arl.org/sparc/publisher/incomemodels/

Traducción rápida de Tomàs Baiget
http://elprofesionaldelainformacion.com

viernes 2 de octubre de 2009

SPARC apoya planes de financiacion de publicacion en OA (TBaiget)

SPARC apoya planes de financiación de publicación en OA
24 de septiembre 2009
http://www.arl.org/sparc/media/09-0924.shtml

La Scholarly Publishing and Academic Resources Coalition (SPARC) ha puesto de relieve los enfoques para establecer y mantener fondos para acceso abierto (OA). La coalición también está preparando una iniciativa para proporcionar asesoramiento e información detallando opciones para otras instituciones que puedan estar considerando establecer tales fondos.

El año pasado, la Universidad de California en Berkeley y la Universidad de Calgary fueron algunas entre un puñado de instituciones que establecieron fondos de dinero, a través de sus bibliotecas, para cubrir el costo de las tasas de publicar en revistas OA. Este enfoque --destinado a apoyar un nuevo modelo de publicación académica que en última instancia, podría aliviar, al menos, parte de la carga de suscripciones a revistas- ha sido bien recibido por los investigadores de esos dos campus.

En la UC Berkeley, la Berkeley Research Impact Initiative (BRII) prové a los profesores, estudiantes de post-doc y de postgrado de hasta 3.000 dólares para cubrir el costo de publicar un artículo en una publicación OA. También ofrece hasta $ 1.500 para dejar en abierto un artículo del que se exija la transferencia de derechos de autor a la editorial. Durante el proyecto piloto de 18 meses, el fondo cubrió el coste de 52 artículos a un promedio de 1.500 dólares para las publicaciones OA y 1.280 dólares para los
artículos que requieren la transferencia de derechos de autor. Durante los primeros 13 meses de Calgary, el Open Access Authors Fund de su biblioteca subvencionó 67 artículos para cubrir los honorarios de OA, a un costo promedio de $ 1.538 (en dólares canadienses).

El costo de suscripciones a revistas a veces es agobiante para las bibliotecas, y la universidad canadiense quiso experimentar una forma diferente de alentar el OA. La iniciativa de Berkeley se propuso fomentar un entorno más sostenible de la comunicación académica. Las recomendaciones de la SPARC para el OA se darán a conocer este otoño.

Traducido por Tomàs Baiget
http://elprofesionaldelainformacion.com

martes 29 de septiembre de 2009

Revistas científicas españolas y fraude bibliometrico. Arechaga (TBaiget 11 sept)

Las revistas científicas españolas y el fraude bibliométrico
"Son muchos los problemas que continúan teniendo nuestras publicaciones para competir internacionalmente", dice el autor
JUAN ARÉCHAGA 11/09/2009

http://www.elpais.com/articulo/sociedad/revistas/cientificas/espanolas/fraude/bibliometrico/elpepusoc/20090911elpepusoc_7/Tes

El reciente informe 2008 Journal Citation Reports Science Edition (JCR, Institute for Scientific Information, Thomson Reuters, 2009) ofrece algunas novedades de interés, como el incremento, más bien escaso, de revistas españolas entre las 6.598 seleccionadas (0,56% del total) y un nuevo parámetro bibliométrico, denominado 5-Year Impact Factor, que mejora notablemente ediciones precedentes. Con toda seguridad, el último JCR ha sido espoleado por su nuevo competidor, conocido como SCImago Journal & Country Rank,
desarrollado íntegramente en España sobre la base de datos SCOPUS de la multinacional holandesa Elsevier. Así, este repertorio amplía su análisis ya a 16.033 revistas científicas y, entre ellas, 227 (1,4%) españolas...¡No hay nada mejor que la competencia para renovar productos y servicios! Pero, también, el 2008JCR dedica un espacio importante al tema de las auto-referencias (no confundir con las autocitas de los propios autores, que esto es harina de otro costal), un aspecto que suele pasar desapercibido para
muchos, pero que merece una especial atención por su trascendencia en España.

Un porcentaje elevado de auto-referencias en una revista profesional puede significar, al menos, cuatro cosas: antigüedad de la misma, escasez de publicaciones en el área, uso pobre de la literatura o, finalmente, un fraude bibliométrico inducido, lo que se ha venido en llamar ingeniería del factor de impacto. Las revistas de edad media -es decir, de más o menos 50 años- suelen tener entre un 3% y un 7 % de citas de la propia publicación. Porcentajes menores los solemos encontrar en revistas jóvenes pero,
mayores de un 10%, nos ponen sobre la pista de una posible adulteración del famoso JCR Impact Factor, un índice bibliométrico reverenciado por todos (investigadores, editores, centros académicos, comisiones de selección, sociedades profesionales, bibliómetras, sociólogos, periodistas científicos, políticos de la ciencia y diletantes de variada estirpe). Las cifras referidas este año a España son, a primera vista, preocupantes: de las 29 revistas con más de cinco años de antigüedad en el 2008JCR, nada menos que
16 pasan del 10% de auto-referencias y cinco de ellas superan el 50%, llegando, en un caso, ¡al 64%! Todo es más sonrojante aún si se añaden estos datos al escaso número de artículos por revista publicados en 2008 (sólo hay siete publicaciones que superan el centenar) y sus menguadas posibilidades de ser citados por revistas extranjeras influyentes o a través de redes de interacciones entre revistas, al estar, en su mayoría, escritos en español (el 2008JCR incluye ahora los Article Influence Score y Eigenfactor
Score para estos fines). La escasa visibilidad en Internet y la pobre funcionalidad de las páginas web de la revistas científicas españolas no ayudan tampoco en este sentido.
Son muchos los problemas que continúan teniendo nuestras revistas científicas para competir internacionalmente. Sobresalen el desdén institucional y de nuestros investigadores (lo importante, dicen, es "publicar fuera" para mejorar el ranking de nuestros centros, proyectos, sexenios, etcétera), la marginación de los bibliotecarios a la hora de repartir sus fondos (lo cómodo y demandado es adquirir paquetes de publicaciones a las multinacionales de la edición científica), la falta de inversiones específicas (la
gran industria editorial española y los planes plurianuales I+D+i nos ignoran) y el insuficiente personal de apoyo, que sigue siendo testimonial en la mayoría de los casos. Lo compensamos, a duras penas, con la dedicación masoquista de sus Consejos Editoriales y Referees o el entusiasmo de sus Directores, que se vuelcan en una labor sin beneficios académicos, sin estímulos a su actividad profesional y sin retornos económicos. No empeoremos aún más el panorama, fomentando las auto-referencias para ganar impacto
bibliométrico o una ficticia competitividad en el sector. Con ello, lo único que conseguiremos es dañar la integridad de nuestras publicaciones, y ésto es algo muy difícil de restaurar en el futuro. Al parecer, una revista española ha sido excluida recientemente del JCR por sus excesivas auto-referencias, cuando las barbas de tu vecino veas pelar...

Juan Aréchaga (juan.arechaga@ehu.es) es catedrático de la Universidad del País Vasco y director de The International Journal of Developmental Biology

Nuevos datos sobre ghostwriting (TBaiget 11 sept)

Los editores del Journal of the American Medical Association (JAMA)
http://jama.ama-assn.org/
han hecho público un nuevo estudio sobre la prevalencia de la escritura de textos anónimos que falsean la realidad para favorecer a laboratorios farmacéuticos. El estudio se ha realizado después que informes recientes han demostrado que la investigación científica ha sido contaminada por escritores fantasma financiados por compañías farmacéuticas.

Según el estudio, seis de las principales revistas médicas publicaron un número significativo de artículos de escritores fantasma en 2008. Autores de 630 artículos rellenaron un cuestionario en línea de cuyo análisis ha resultado que un 7,8% reconoce haber aceptado en sus artículos contribuciones suficientemente importantes como para que sus autores hubieran figurado como co-autores pero que sin embargo no fueron mencionados.

Los autores que respondieron indicaron una tasa de 10,9% de tales textos en el New England Journal of Medicine (NEJM), la tasa más alta entre las revistas. Un representante de la NEJM ha cuestionado la metodología del estudio, pero informó que la publicación ahora está controlando mejor el ghostwriting. El correspondiente porcentaje fue del 7,9 en JAMA y del 4,9 en los Annals of Internal Medicine.

Se halló que los autores fantasma aparecen más en los artículos de investigación, y menos en comentarios de opinión o editoriales. El nuevo estudio, todavía no revisado por pares ni publicado en una revista médica, se hizo público ayer en el Sixth International Congress on Peer Review and Biomedical Publication que se está celebrando en Vancouver (10-12 septiembre 2009):
http://www.ama-assn.org/public/peer/peerhome.htm?home

El ghostwriting se refiere a los escritores de temas médicos --en este caso- que, patrocinados por los fabricantes de medicamentos o de productos sanitarios, investigan y realizan contribuciones para artículos que luego se publican bajo los nombres de otros autores académicos.
Tomàs Baiget
http://elprofesionaldelainformacion.com

Jacso analiza los fallos de GS como herramienta (TBaiget) 25 sept

Newswire analysis: Google Scholar's ghost authors, lost authors, and other problems
Por qué la popular herramienta no puede ser utilizada para analizar el rendimiento y el impacto de la publicación de los investigadores.
Peter Jacsó, University oh Hawaii at Manoa - Library Journal, Sept 24 2009

http://www.libraryjournal.com/article/CA6698580.html?&rid=1105906703&source=title

Os traduzco el principio:

El ensayo de Geoffrey Nunberg criticando la búsqueda de libros de Google (Book Search), que subtituló "un desastre para los académicos", dejó claro que los errores preocupantes son endémicos en Google:

Google's Book Search: a disaster for scholars
By Geoffrey Nunberg, August 31, 2009
http://chronicle.com/article/Googles-Book-Search-A/48245/

Nunberg afirma que para que la mayoría de sus productos Google dice: "no nos importan ... los metadatos proporcionados por los catálogos de biblioteca". En tal vez su punto más desalentador, Nunberg observa que el equipo de Google acusa a las bibliotecas y los editores de datos incorrectos.

Todos esto concuerda perfectamente con mi experiencia trabajando con otro de los grandes productos de búsqueda: Google Scholar (GS). Con GS, sin embargo, yo culpo a los desarrolladores. Decidieron, muy imprudentemente, no utilizar los metadatos generosamente ofrecidos por los editores académicos y los servicios de indexación / resúmenes, sino que optaron por tratar de descifrarlos mediante robots aparentemente inteligentes y programas de análisis.

Así, los investigadores y bibliotecarios especializados que trabajan con GS en contraste con sus propios metadatos se enfrentan a datos erróneos, cosa que tiene graves consecuencias en la evaluación de la productividad y el impacto de las publicaciones académicas de investigadores, instituciones, revistas, e incluso países. Millones de registros tienen metadatos erróneos, así como datos hinchados de publicación y de citación.

Como herramienta gratuita, Google Scholar se ha convertido en el recurso más conveniente para encontrar unos pocos buenos artículos académicos, a menudo con el texto completo gratuito, incluso en los temas más esotéricos. Para realizar búsquedas con palabras clave, GS es valioso, pero no se puede utilizar para analizar el rendimiento y el impacto de la publicación de los investigadores.


Aprovecho para enviaros un artículo sobre este tema que se acaba de publicar en El profesional de la información:

Torres-Salinas, Daniel; Ruiz-Pérez, Rafael; Delgado-López-Cózar, Emilio. "Google Scholar como herramienta para la evaluación científica". El profesional de la información, 2009, septiembre-octubre, v. 18, n. 5, pp. 501-510. DOI: 10.3145/epi.2009.sep.03

Lo hemos dejado 1 semana en abierto y os lo podéis bajar de aquí:

http://elprofesionaldelainformacion.metapress.com/app/home/contribution.asp?referrer=parent&backto=issue,3,14;journal,1,67;homemainpublications,1,1;