Az indexeléssel járó problémák


Amikor 1952-ben Mortimer Taube ismertette az Uniterm-rendszert, úgy tűnt, hogy sikerült megoldani a tájékoztatás minden baját (tetszőleges számú kulcsszót lehet használni, mindenféle szintű dokumentumkezelésnél alkalmazható, a fogalmak kombinálásával az információk nagy pontossággal kereshetők vissza). Hamarosan jelentkeztek azonban a bajok. Taube eredetileg a deszkriptorokat teljesen szabadon használta. A homonimák, szinonimák, többjelentésű szavak válogatás nélküli használata arra vezet, hogy a hasznos információk egy része elvész, és érdektelen dokumentumok is felbukkannak a keresésnél. Az alá- és fölérendeltségi viszonyok tisztázatlansága hasonló hibákat eredményez. Problémák merülnek fel a képzett szavak, az egyes vagy többes számok használata kapcsán is. Ezeket a hibákat csak egy tezaurusz alkalmazásával lehet kiküszöbölni. Ebben feltüntetik a szinonimákat, s megjelölik az indexelésben használt és a tiltott szavakat, a rokonértelmű kifejezéseket és a fogalmak hierarchiáját. Egy tezaurusz elkészítése nagy feladat. Az Engineers Joint Council által kiadott "Thesaurus of Engeneering Terms" 1964-ben megjelent kiadása 131 műszaki szakember és sok könyvtáros, szerkesztő munkájával készült, az 1967-es második kiadás összeállításában már 300 szakember vett részt, és a 23364 deszkriptort másfél millió szakszóból válogatták ki. Mivel az indexelés tezauruszhoz van kötve, ezért nem alkalmas egyetemes, nemzetközi, nyelvtől független rendszer kiépítésére. Ráadásul az egyes nyelvekben használt fogalmak nem pontos tükörképei egymásnak, így a tezauruszt nem lehet automatikusan más nyelvre alkalmazni. További hátrány, hogy az indexelési tevékenység nagyon jól képzett szakembereket és sok időt igényel, persze ez a visszakeresésnél megtérül.
Fülöp G. (1984) nyomán [irodalom.txt -Fülöp]