A szabadszöveges keresés előnyei és hátrányai
A 60-as években sokáig azt gondolták, hogy a legjobb indexelő nyelv maga a
természetes nyelv. Később a nagy adatbázisok megjelenésével szükségessé vált
a tezauruszok használata. A két technika eredményességét a következő két
paraméter vizsgálatával lehet összehasonlítani:
releváns találatok száma [def03]
Pontosság = ---------------------------
összes találatok száma
releváns találatok száma
Teljesség = -------------------------------
az összes releváns tétel száma
Az eredmények ellentmondóak: Henzler úgy találta, hogy a szótárral általában
nő a teljesség és a pontosság is, kivéve, ha valamilyen új témáról van szó.
Hensey mérései szerint az osztályozó jelzetek 30-40%-kal teljesebb és
15-20%-kal pontosabb eredményt adnak, mint a szabadszöveges keresés. Markey
szerint az ERIC adatbázisban a szótár nagyobb pontosságot, a szabadszöveges
keresés pedig nagyobb teljességet nyújt. Tenopir vizsgálatai szerint
teljesszövegű adatbázisoknál a keresések átlag 74% teljességet és 18%
pontosságot nyújtottak szabadszövegesen, a referátumok esetén ezek a
számok 19.3% és 35.6%.
A szabadszöveges keresés előnyei:
- olcsó
- egyszerű
- a dokumentum teljes információtartalma kereshető
- a keresés szempontjából minden szó azonos értékű
- nincsenek indexelési hibák
- az új kifejezések azonnal kereshetők
A szabadszöveges keresés hátrányai:
- nagyobb a felhasználó felelőssége
- a szövegben implicite módon levő információ elvész
- hiányzik és nem használható ki a szűkebb s tágabb fogalmak közti kapcsolat
- ismerni kell a szakterület szókészletét
A szabályozott szótáras keresés előnyei:
- sok szemantikai problémát megold
- a generikus kapcsolatok azonosíthatók és kihasználhatók
- leképezi a terület fogalmi rendszerét
A szabályozott szótáras keresés hátrányai:
- drága (indexelési költségek)
- esetleg nem fedi le megfelelően az adott szakterületet
- emberi hibák fordulnak elő az indexelésnél
- a szókészlet elavulhat
- nehéz szisztematikusan felépíteni a szavak közti összes releváns kapcsolatot
Forrás: C.P.R. Dubois - Free text vs. controlled vocabulary: a reassessment
(magyar nyelvű referátum: TMT 1990. 8-9.)