ImageNet
ImageNet és una base de dades d’imatges anotades creada per la investigadora Fei-Fei Li amb les universitats de Stanford i Princeton com un recurs per a la recerca en visió artificial. El seu corpus de paraules prové de WordNet, una base de dades del lèxic de l’anglès organitzada jeràrquicament en funció del significat de les paraules. ImageNet recopila una gran quantitat d’imatges per a cada una de les categories, amb la qual cosa transforma WordNet en una mena de diccionari visual.
Però que les paraules tinguin un significat no vol dir que tinguin una equivalència visual. Els límits de la relació entre imatges i paraules es fan evidents per a qualsevol que recorri les categories d’ImageNet relatives a persones: es pot crear un dataset d’imatges per a la categoria bad person?. Els criteris morals són elements que puguin ser visibles en les imatges? En el cas del gènere, les imatges d’ImageNet també són eloqüents: per exemple, en la categoria smasher, stunner, knockout […] (“una dona molt atractiva o seductora”, segons la definició del mateix dataset), que no defineix el contingut de la imatge sinó el tipus de mirada amb què s’ha construït. La retòrica de les imatges –policial en un cas, sexualitzadora en l’altre– és ignorada en tots dos exemples.