Utilizamos cookies

Este sitio web utiliza cookies propias y de terceros para mantener la sesión y obtener datos estadísticos de navegación de los usuarios. Para más información vea la Política de cookies.

Imagen subsite INTA
arrow_upward

Clasigramas y tendigramas

El clasigrama “una métrica para la información”.

El clasigrama es un recurso básico para representar grandes volúmenes de información por medio de taxonomías. No le hemos encontrado antecedentes en la literatura, y por lo tanto entendemos que pudiera tratarse de una aportación innovadora a la Analítica Visual.

En términos estadísticos, un clasigrama es una representación de la frecuencia de ocurrencia de las categorías de la taxonomía para un determinado volumen de información. Para los no familiarizados con la terminología estadística, el clasigrama se explica como una representación bidimensional de la información respecto de dos ejes ortogonales. A lo largo del eje horizontal se despliegan de manera secuencial las categorías de la taxonomía (i.e. códigos de clasificación). En el eje vertical se representa el número de veces que una categoría de la taxonomía es utilizada en la clasificación de los distintos elementos de información que están bajo análisis.

Taxonomía - Representación gráfica

En la figura se muestra paso a paso cómo se generaría un clasigrama. Las categorías o códigos de clasificación de los niveles 1, 2 y 3 de nuestra taxonomía las asociamos a las coordenadas del eje horizontal. En el eje vertical representamos la frecuencia de ocurrencia de los códigos de clasificación del volumen de información representado. El resultado es un gráfico que nos recuerda a un histograma clásico, con la diferencia de que nuestro eje horizontal, lejos de estar asociado a una única magnitud o concepto, está vinculado a una estructura cognitiva completa.

La siguiente figura muestra un clasigrama real. Se trata de un análisis de resúmenes de artículos y actas de congresos de elipsometría espectroscópica, una técnica física de caracterización óptica de materiales. Están representados más de 25.000 códigos de clasificación correspondientes a más de 10.000 registros de la base de datos INSPEC (del IET británico) ¡un gran volumen de información visto a través de una única gráfica! En el eje horizontal están los códigos de clasificación de la taxonomía de la Física que tiene la propia base de datos INSPEC. En el eje vertical está representada la frecuencia de ocurrencia de los códigos de clasificación. En cierto modo, el clasigrama nos recuerda al espectro de una molécula: el “espectro de la elipsometría espectroscópica”. Para alguien especializado en esta disciplina, los “picos altos” del clasigrama no le aportarían nada nuevo, porque le resultarían evidentes. No le haría falta este análisis taxonómico para evidenciar lo que ya le era obvio. Sin embargo, lo interesante está en el agrupamiento de pequeños picos en ciertas zonas, que seguramente le aportarán visiones que antes no tenía. Con esta representación se facilita una visión de conjunto de toda una disciplina, algo imposible de alcanzar con otras técnicas.

clasigrama

 

En este clasigrama, como en los de la nanotecnología, la taxonomía empleada es la de la propia base de datos. La información representada en el clasigrama alcanza una potencia especial cuando la taxonomía asociada está hecha “a la carta”, ad hoc para el tema bajo estudio. Lo veremos en el caso del ejemplo de la meteorología espacial.

 

El clasigrama diferencial “comparando peras con manzanas”.

La métrica que establece la taxonomía permite comparar grandes volúmenes de información muy dispares. Lo consideramos también como algo novedoso dentro de las técnicas de Analítica Visual. El ejemplo lo tenemos en la figura. Se hizo un estudio de las publicaciones de la UE en el periodo 2000-2003 sobre nanotecnología. Se quiso comparar temáticamente, de manera normalizada, las publicaciones españolas respecto de las europeas. La taxonomía es el sistema de clasificación de la base de datos INSPEC. El resultado es el primer clasigrama diferencial que desarrollamos, en el que están representadas las temáticas en las que nuestra comunidad destaca con respecto a la europea, y aquellos en los que la actividad (en lo que a publicaciones se refiere) está por debajo de la media. Esta clase de gráficas puede ser un apoyo a los procesos de toma de decisiones. Por ejemplo, nuestra comunidad de nanotecnología mostraba mucha más actividad que la europea en temas de magnetismo y, sin embargo, estaba por debajo en temas de nanotubos de carbono. A la vista de esta clase de informaciones, a quienes les corresponde tomar decisiones de carácter financiador podrían optar por potenciar en lo que sobresalimos, o bien optar por potenciar aquellas áreas en las que somos deficitarios con respecto a Europa. El disponer de una visión de conjunto ayudará sin duda a sopesar las decisiones de manera razonada. En el repositorio de imágenes se muestran varios clasigramas diferenciales en una misma gráfica sobre los trabajos en nanotecnología comparados entre diversas comunidades como son la europea, la estadounidense, la japonesa o el resto del mundo. Es muy curioso ver cómo las comunidades muy grandes realmente se siguen entre sí, salvo en casos puntuales, como el de la japonesa, que con respecto las demás en el momento del estudio eran una clara potencia en la nanotecnología asociada a los nanotubos de carbono y fullerenos. El clasigrama diferencial no deja de ser un elemento que evidencia de manera tasada las debilidades y fortalezas, como si de un análisis DAFO se tratara.

clasigrama_tendigrama_3

El tendigrama “anticipando la evolución”.

Este gráfico, del que no mostramos un ejemplo sino una tabla, proviene de comparar el clasigrama de un tema en un momento determinado (por ejemplo 10 años atrás) con el clasigrama actual. Lo que pone de relevancia, a toro pasado, son las disrupciones que tuvieron lugar en el sistema. La utilidad del tendigrama la encontramos en que si estudiamos cómo se produjeron las disrupciones en el pasado, a la vista de lo que percibimos en el presente a través de una taxonomía, igual podemos anticiparlas. Una especie de entrenamiento para intentar prever la evolución.

clasigrama_tendigrama_4


Ficheros asociados para descarga:

Clasigrama diferencial comparando la producción científica en nanotecnología entre diversas comunidades geográficas.