Tapolcai Ágnes
Országos Széchényi Könyvtár
Magyar Elektronikus Könyvtár Osztály
Kojnok Krisztina
Empolis Magyarország Kft.
A
Magyar Elektronikus Könyvtár (MEK) átgondolva látássérült olvasóinak helyzetét
új, összetett felületén kívül
egyszerűbb
belépési oldalt, letöltésre pedig egyszerű text formátumot kínál, valamint
online felolvasási lehetőséget az erre alkalmas dokumentumokra.
Az
online felolvasás és a text formátum kiinduló pontja egyaránt az XML formátum.
Tekintve, hogy ezek elkészítése nagy munka, igyekeztünk minél szabványosabb
formában, a Text Encoding Initiative (TEI) alapján elkészíteni, hogy később már
gépi konverzióval kinyerhető legyen az e-book vagy más, időközben
felmerülő igény.
A hálózati technológiák fejlődése a vak és csökkentlátó felhasználók számára kedvezőtlen irányba fordult a grafikus felületek térhódításával. Az eredetileg karakteres programokra kidolgozott felolvasó (text to speech) programok segítségével a bonyolult képeket tartalmazó oldalakon már nem lehet eligazodni. Az egér, mint fő navigálási eszköz, a vakok számára alkalmatlan. A fejlődés irányát követve a MEK is áttért összetettebb szolgáltatást nyújtó újabb technológiákra, de, a látássérült olvasók nagy számára való tekintettel, egyidejűleg vakos használatra optimalizált belépési pontot is kíván nyújtani. Ezt a célt szolgálja a http://vmek.oszk.hu internet címen nyíló oldal, az online felolvasás lehetősége, valamint a text formátumban is feltöltött szövegek. Az így kialakított oldal egyben a gyengébb kapcsolattal rendelkező olvasók számára is előnyös a grafikus elemek kis száma miatt.
A tervezés során derült ki, hogy a fejlesztésbe nem érdemes ma már belefogni az XML technológia alkalmazása nélkül. A logikai jelölőkkel ellátott szövegből ugyanis a letöltésre és felolvasásra szánt szövegek éppúgy előállíthatók konverzióval, mint a látók számára is alkalmas HTML oldalak, pdf fájlok, valamint a jövőben várható (esetleg váratlan) igények, mint pl. az e-book.
Az XML (eXtensible Markup Language) 1998 óta W3C ajánlás. Az XML az ISO szabvány SGML (Standard Generalized Markup Language) leszűkítése. Az SGML-ben formális nyelvtan hozható létre egy-egy speciális nyelv leírására. Használata, definíciója azonban igen bonyolult, ezért csak a nagy szervezetek tudják kihasználni az előnyeit. Óriási figyelmet kapott ez a technológia, amikor a World Wide Web elterjedt, mert a HTML nyelv az SGML egyik alkalmazása.
A HTML korlátainak felismerése tette szükségessé az XML kidolgozását, amely az SGML-hez hasonlóan nyelvek leírására alkalmas, de megszabadították az SGML legnehézkesebb, nehezen feldolgozható elemeitől.
Az XML alkalmas strukturált dokumentumok, vagy más adatok leírására, validitási (érvényességi) kritériumok ellenőrzésére. Szabványos, cég- és platformfüggetlen leírónyelv, mely az információ tartalmi struktúrájára koncentrál. Ez teszi oly népszerűvé mind a tartalomkezelésben, mind kommunikációs adatformátumként.
Az XML fontos tulajdonsága, hogy az információ megjelenítéséről nem rendelkezik. Ezt a hozzá kapcsolódó szabványos XML szintakszisú formázónyelvek oldják meg, így a tartalom és a forma tökéletesen elválik egymástól.
A sokoldalú későbbi felhasználás egységes, lehetőleg nemzetközi szabványon alapuló szerkezeti meghatározottságot igényel. Erre a célra a TEI (Text Encoding Initiative, http://www.tei-c.org) ajánlásai alapján készíttetett a MEK minden dokumentumtípusra kiterjedő DTD-t (documentum type definition), amely a későbbiekben az OSZK egyéb digitalizálási projektjeiben is felhasználható lesz, ezért elhelyeztük a MEK szerverén. A DTD szabja meg a logikai jelölők neveit és struktúráját, ez az egységesítés kulcsa.
A DTD-t az Empolis Magyarország készítette, az IHM-ITEM pályázat keretében.
A látássérültek többsége beszélő rendszerrel használja az Intermetet (kivételesen braille kijelzővel)
Általában karakteres böngészőket használnak DOS és Linux alapon, főként a
Kaliforniai Egyetemen kifejlesztett Lynx programot, melyet több platformra is
adaptáltak.
Windows-t is használnak ma már, de DOS vagy Linux alól könnyebb
dolgozni. A „Jaws for Windows”-zal az angol nyelvű honlapokat lehet olvastatni
és ehhez hozzákapcsolható a ma már szabadon terjeszthető magyar nyelvű Multivox
felolvasó. A windows-os használat jóval költségesebb programokat igényel,
azonban bizonyos típusú látásproblémáknál előnyös, és mindenképpen több
információval szolgál.
Tehát a vakok számára is olvasható Web oldal karakteres és grafikus böngészővel egyaránt értelmes.
Egy rövidített lista arról, milyen legyen az ideális Web hely a
WAI (Web Access Initiative) szerint:
1. Az input és
output eszközök minél szélesebb skáláját támogassa. Például egér helyett
billentyűzet, hang használata, outputként karakteres böngésző, esetleg braille
író.
2. Ha olyan
tartalom van a lapon, aminek megjelenítéséhez fejlettebb eszközök kellenek,
alternatív információ elhelyezése ajánlott, pl. kép helyett szöveges leírás.
3. Biztosítsa, hogy
ki lehessen kapcsolni a képek, hangfájlok automatikus letöltődését, ami
megakadályozná, hogy az alapinformációhoz hozzáférjenek azok, akik egyszerűbb
böngészővel rendelkeznek.
4. A szolgáltatás
formája a felhasználó által variálható legyen. Például a színt, betűméretet,
szintetizált beszéd esetén sebességet, hangmagasságot állítani lehessen az
eredeti beállítások felülbírálásával.
5. Általában a
felhasználói felület viselkedése minél inkább állítható legyen a felhasználói
oldalon.
6. Legyenek olyan
felületek benne, melyekhez kapcsolhatók a kisegítő programok, tudjon ezekkel
együttműködni, pl. beszéd szintetizátor.
7. Kövesse a kezelő
felületekről kialakult konvenciókat, pl. a menük, billentyűkombinációk
tekintetében, megkönnyítve így a kezelést.
9. Kínáljon a tartalomhoz többféle módon is hozzáférést, pl.
böngészéssel, kereséssel, többféle struktúra szerinti elhelyezéssel.
10. Adjon
visszajelzést, hol áll éppen a felhasználó navigálás közben.
11. Legyen a
felületről leírás és súgó.
A vakok és csökkentlátók számára használható oldalak ajánlott tulajdonságairól a részletes leírást éppen fordítja a MEK Osztály és a magyar változat hamarosan felkerül a MEK-be.
Az oldalak a következő fő tulajdonságokkal rendelkeznek (1. ábra):
1. A képeket minimalizáltuk;
2. A szövegméret változtatható;
3. Az információ egymás alatti sorokban jelenik meg, még ott is, ahol látszólag táblázat van;
4. Feltördeltük az oldalt kisebb HTML lapokra, ami kiváltja az űrlapos keresés egy részét;
5. Bizonyos részleteket kihagytunk a könnyebb áttekinthetőség végett;
6. Használtuk az ún. accesskey jelenséget, ami alt+betűvel meghatározott helyre ugrik;
7. Minden listát átszerkesztettünk úgy, hogy a lényeges információ legyen elől, tekintve, hogy a sor felolvasását abba lehet hagyatni, de csak a sor elején lehet kezdeni.
Ahol lehetett, letöltésre szánt text formátumot is készítettünk, mivel a mostani felolvasó rendszerekkel ez a legkönnyebben hozzáférhető. Egyszerűsége ellenére ez a szöveg is struktúrált, mégpedig a vakok igényei szerint: A sorok 75 karakteresre tördeltek, a bekezdések között soremelés van, hogy különbözzön az egyszerű sorvégtől, a fejezetek vagy egyéb dokumentumrészek között határolókat helyeztünk el, nevezetesen a fejezetcím és egyben a fejezet elején ***-t, a fejezetcím végét pedig +++ jelzi.
Online felolvasást integráltunk bele, amely felismeri és kezeli a szöveg logikai egységeit, főleg ott, ahol XML formátumból indulhat ki. Az így feldolgozott szövegben navigálni lehet, ami majdnem olyan, mintha lapozgatnánk egy könyvben.
Az igények igen különbözőek a segédprogramok sokfélesége és az olvasók különböző fizikai problémái miatt. Ezért a végleges kialakítást a vak illetve gyengénlátó felhasználókkal történő folyamatos egyeztetés keretében, levelezőlistán tárgyaltuk.
A MEK-ben a következő célok, igények fogalmazódtak meg:
1. A teljes szöveg keresésnél struktúráltabb keresés lehetővé tétele a művekben. (pl. címben, szövegtestben); a struktúrált XML dokumentum teszi lehetővé.
2. Azonos struktúrájú XML dokumentumokat létrehozása, ahol az egyes tartalmi elemek értelmezése és jelölése egységes; ezt a DTD biztosítja.
3. Internetes publikáció különböző formátumokban. E-book publikáció. A publikáláshoz RFT, HTML, PDF, LIT, TXT formátum; XSL/XSLT stíluslapok segítségével.
4. Profivox felolvasó rendszer számára text vagy XML formátum biztosítása; szintén a struktúrált XML dokumentum teszi lehetővé.
A DTD-t szépirodalmi művek és különböző témájú folyóiratok digitalizálásra fejlesztettük. A DTD céljaként a próza, vers és dráma típusú művek szerkezetének leírását és a MEK által meghatározott tartalmi elemek megjelölésére alkalmas elemek meghatározását tűztük ki.
A dokumentum-szerkezet felépítését és a jelölő elemek használatát a „Guidelines for Electronic Text Encoding and Interchange” szerint határozzuk meg.
Szépirodalmi műveknél a legnagyobb egység a digitalizálás alapjául szolgáló kiadvány, a kötet. Így egy egységnek tekintjük a kötetben található művet, és gyűjtemény esetén a kötetben szereplő összes művet is. Egy kötet tartalmazhat azonos műfajú műveket (pl. novellás kötet), és különböző műfajúakat is (pl. antológia). Egy műben előfordulhatnak különböző műfajhoz tartozó szövegrészek (pl. egy regényben versidézetek).
A DTD testreszabásának előkészítéseként kiválasztottuk azokat a szemantikus elemeket, amelyeket az XML dokumentumban meg kell különböztetni. Mind a négy típust (próza, vers, dráma, folyóirat) megvizsgáltuk. A szematikus elemeket két nagy csoportra, struktúra elemekre és tartalmi elemekre bontjuk. A struktúra elemek határozzák meg a digitálizált művek szerkezetét, a tartalmi elemek pedig a mű meghatározott részeit jelölik. A DTD kialakításakor minden szemantikus elemet egy TEI által definiált elemnek feleltettünk meg. Ezekből az elemekből épül fel a MEK DTD-je; 52 szemantikus elem és 78 TEI elem került be a DTD-be.
Végül öt részből álló TEI alapú DTD készült. Mind a négy fő dokumentumtípushoz (próza, vers, dráma, folyóiratcikk) egy-egy önállóan használható DTD rendelhető és létezik egy "mixed" típusú is, amelyben minden elem szerepel. A mixed típusú DTD-t lehet a különböző dokumentumtípusokat tartalmazó művek, pl. antológiák digitalizálásához használni.
Példa egy vers XML feldolgozására és HTML megjelenésére. (2. ábra)
Az XML feldolgozás célja tehát az, hogy a tárolás XML formátumban történjen, így a tartalom újra felhasználható sokféle, előre nem látható célra is.
Ábrák:
1. ábra
A nyitólap
-------------------------------------------------------------------------------------------------
<?xml
version="1.0" encoding="ISO-8859-2"?>
<!DOCTYPE
TEI.2 SYSTEM "C:\dtd\dtd\verse\TEI-MEK-verse.DTD">
<?xml-stylesheet
type="text/xsl" href="C:\mek\xsl\vers2_html.xslt"?>
<TEI.2
id="MEK-00455">
<text type="poem">
<body>
<div>
<head>
<title>WORDSWORTH,
William </title>
</head>
<div>
<head>
<title>A
SZIVÁRVÁNY</title>
</head>
<lg
type="verse">
<l> Ha fenn a szivárvány ragyog,</l>
<l>
megdobban a szivem:</l>
<l>így
volt, hogy kezdtem éltemet,</l>
<l>így
van most, hogy év évre megy,</l>
<l>így
legyen mindig, s meghalok</l>
<l>
inkább, ha nem!</l>
<l>A
férfi apja a gyerek;</l>
<l>hadd
fűzze hát napjaimat</l>
<l>egymáshoz
a természet-áhitat.</l>
<closer>KÁLNOKY
LÁSZLÓ </closer>
</lg>
</div>
</body>
</text>
</TEI.2>
2./a
ábra Vers XML formában
2./b ábra Vers HTML-ként