A szabadszöveges keresés előnyei és hátrányai


A 60-as években sokáig azt gondolták, hogy a legjobb indexelő nyelv maga a természetes nyelv. Később a nagy adatbázisok megjelenésével szükségessé vált a tezauruszok használata. A két technika eredményességét a következő két paraméter vizsgálatával lehet összehasonlítani: releváns találatok száma [def03] Pontosság = --------------------------- összes találatok száma releváns találatok száma Teljesség = ------------------------------- az összes releváns tétel száma Az eredmények ellentmondóak: Henzler úgy találta, hogy a szótárral általában nő a teljesség és a pontosság is, kivéve, ha valamilyen új témáról van szó. Hensey mérései szerint az osztályozó jelzetek 30-40%-kal teljesebb és 15-20%-kal pontosabb eredményt adnak, mint a szabadszöveges keresés. Markey szerint az ERIC adatbázisban a szótár nagyobb pontosságot, a szabadszöveges keresés pedig nagyobb teljességet nyújt. Tenopir vizsgálatai szerint teljesszövegű adatbázisoknál a keresések átlag 74% teljességet és 18% pontosságot nyújtottak szabadszövegesen, a referátumok esetén ezek a számok 19.3% és 35.6%. A szabadszöveges keresés előnyei: - olcsó - egyszerű - a dokumentum teljes információtartalma kereshető - a keresés szempontjából minden szó azonos értékű - nincsenek indexelési hibák - az új kifejezések azonnal kereshetők A szabadszöveges keresés hátrányai: - nagyobb a felhasználó felelőssége - a szövegben implicite módon levő információ elvész - hiányzik és nem használható ki a szűkebb s tágabb fogalmak közti kapcsolat - ismerni kell a szakterület szókészletét A szabályozott szótáras keresés előnyei: - sok szemantikai problémát megold - a generikus kapcsolatok azonosíthatók és kihasználhatók - leképezi a terület fogalmi rendszerét A szabályozott szótáras keresés hátrányai: - drága (indexelési költségek) - esetleg nem fedi le megfelelően az adott szakterületet - emberi hibák fordulnak elő az indexelésnél - a szókészlet elavulhat - nehéz szisztematikusan felépíteni a szavak közti összes releváns kapcsolatot
Forrás: C.P.R. Dubois - Free text vs. controlled vocabulary: a reassessment (magyar nyelvű referátum: TMT 1990. 8-9.)