Procés de treball
- Descàrrega
- Processat
- Visualització
Descàrrega
El número de pàgines indexades és de més de 13.000 i el d’imatges descarregades de més de 7.000.
Per a aquest procés s'ha usat la combinació d'eines de programari lliure Nutch i Solr i s'ha realitzat durant els mesos de Juny i Juliol de 2013.
Processat
- el número d'aparicions de les paraules a cada pàgina
- el percentatge d'aparició d'una paraula en el conjunt de pàgines de cada centre
- el percentatge d'aparició d'una paraula en el conjunt de pàgines que tenen enllaçada cada imatge
En el camp de les imatges s'ha realitzat un filtrat manual eliminant les imatges no rellevants (logotips, molt petites, repetides, ...). Així mateix també s'ha reduit el seu tamany estandaritzant-lo per a la visualització a l'atles.
Visualització
Per als gràfics s'ha usat la llibreria de javascript Highcharts JS, disponible sota una llicència CC BY-NC 3.0 o mitjançant la compra d'una llicència.
El fet de realitzar tot aquest procés informàtic de forma semi-automàtica, l'ús de certes tecnologies i els webs amb contingut multilingüe fan que el resultat pugui no resultar 100% representatiu. A més es treballa sobre els webs dels centres, que alhora poden no ser representatius de la seva activitat real.