Ontsluiting van Web sites naar analogie met de inhoudsopgave van een boek:
voordelen en toepassing
R.E. de Vries en N.J.I. Mars
Nederlands Instituut voor Wetenschappelijke Informatiediensten, NIWI
(http://www.niwi.knaw.nl)
Samenvatting
Inhoudelijke ontsluiting van Web sites kent meerdere benaderingen. Hier wordt een
vergelijking tussen gemaakt aan de hand van voorbeelden. De uitkomsten van de vergelijking
wijzen op voordelen van ontsluiting met een handmatig aangelegde alfabetische lijst. Dit
wordt nader uitgewerkt in de case van de Web site van het Nederlands Instituut voor
Wetenschappelijke Informatiediensten (NIWI), dat voor een dergelijke benadering gekozen
heeft.
Inleiding
In toenemende mate worden informatie en daarop geënte diensten over het Internet
beschikbaar gesteld waarbij het World Wide Web de nu meest gekozen vorm is. Dit vergt het
ontwerpen, opzetten en onderhouden van een zogenaamde Web site: een Internet plek waar
een gebruiker langs informatieaanbod geleid wordt en diensten kan afnemen zoals het
doorzoeken van databases en het bestellen van afdrukken van tijdschriftartikelen. Deze sites
verschillen onder andere in hoeveelheid en veelsoortigheid van aangeboden informatie. Om
ook complex aanbod hanteerbaar te houden voor gebruikers, kent het Web hypertext
technieken. Daarmee wordt informatie niet in één keer aangeboden maar opgedeeld en in
samenhang gebracht. Hypertext biedt vervolgens een gebruiker die aanbod op een site wil
beoordelen en lokaliseren , alleen de mogelijkheid dit stap voor stap te doen: het zogenaamde
"navigeren" op een site. En zoals met elk de weg zoeken: verdwalen is niet uitgesloten.
Met inhoudelijke ontsluiting van een Web site wordt een alternatief geboden voor dit
stapsgewijs navigeren en een wegwijzer tegen verdwalen.
Inhoudelijke ontsluiting van Web sites volgt grofweg drie benaderingen:
- bij weinig aangeboden informatie wordt volstaan met een overzicht op de "home page", het
centrale vertrekpunt op een Web site voor verder intern navigeren
- bij een veelheid aan informatie of een complexe structuur wordt ofwel een zoekfaciliteit
geboden op alle inhoud van de site,
- of er is een handmatig aangelegde alfabetische lijst met termen die de informatie
ontsluiten.
De variant waarbij uit alle materiaal op een site geautomatiseerd een index gegenereerd wordt,
is een mengvorm die weinig verschilt van de zoekbenadering omdat de termen niet
inhoudelijk beredeneerd zijn maar bestaan uit de woord- en begripskeus in het Web aanbod
zelf.
Toepassing van inhoudelijke ontsluiting blijkt weinig konsekwent: er zijn voorbeelden van
sites met een veelheid aan informatie terwijl toch met een home page ontsluiting volstaan
wordt, soms ook worden meerdere benaderingen tegelijk ingezet. De zoekfaciliteit wordt veel
aangetroffen, maar waarschijnlijk meer omdat deze geautomatiseerd te realiseren is, zonder
dat een bewuste keus is gemaakt.
De handmatig aangelegde alfabetische lijst daarentegen komt relatief weinig voor, terwijl
deze een gebruiker van een Web site veel meer steun biedt bij het bepalen, vinden of alsnog
vinden van gewenst informatie- of diensten aanbod.
Literatuur is schaars. Het elektronisch gepubliceerde en praktijkgerichte Web Review besteedt
er aandacht aan onder "Web Architect" (1).
Conferentiepapers lijken zich meer op experimenten
te richten, bijvoorbeeld met visualisaties om inhoud van een Web site samen te vatten (2)
. Sites zelf treden zelden buiten de gebaande paden: een weliswaar navigatie georiënteerd voorbeeld
is het ontsluiten van een grote Europese overkoepelende site door de gebruiker een "drie
dimensionele virtuele ruimte" te bieden (3).
Door de benaderingen te vergelijken ten aanzien van de voordelen voor een Web site
gebruiker en de kosten voor de maker van een site, kan de keus voor een bepaalde vorm van
inhoudelijke ontsluiting verder beredeneerd worden.
Vergelijking van vormen van inhoudelijke Web site ontsluiting
Met enkele Internet voorbeelden zijn de drie benaderingen op de volgende categorieën
vergeleken:
- de toegevoegde waarde ten behoeve van navigatie om een Web site bezoeker adekwaat het
aanbod te laten bepalen en lokaliseren
- de mate waarin de benadering een verdwaalde Web site gebruiker een uitweg en alternatief
biedt
- de voor realisatie en onderhoud op de Web site benodigde investering
Inhoudelijke ontsluiting met alleen een overzicht op de home page
Voorbeelden zijn een conferentie site en persoonlijke sites opgezet vanuit vakinteresse: de
"Third Conference on Human Factors & the Web: Designing for the Web" (4)
en het op persoonlijke titel georganiseerde aanbod van Laura Downey (5)
en van Craig Marion (6) op het
terrein van Web design en usability engineering. Daarnaast een voorbeeld van een verzamel
site: de in Nederland gemaakte "SocioSite" (7)
en van een representatie site: die van de International Federation of Library
Organizations - IFLA (8).
Al deze voorbeelden ontsluiten met alleen het overzicht dat op de home page geboden
wordt en de gebruiker staat alleen navigatie ter beschikking. Het is in feite de basissituatie
voor alle Web sites. Bij Downey , Marion en de Human Factors conferentie is de benadering
passend omdat de hoeveelheid aangeboden informatie beperkt en weinig complex van aard is.
De voorbeelden van IFLA en SocioSite daarentegen hebben een hoog informatieaanbod dat
bovendien veelsoortig is en met een reeks vertakkingen: één van de andere twee
benaderingen van inhoudelijke ontsluiting zou hier de gebruiker meer steun kunnen bieden.
-
Bij verdwalen op de site of een verwachting niet beantwoord krijgen, is er in alle
voorbeelden geen ander alternatief dan terug te gaan naar de home page en door navigeren
opnieuw te proberen. De kans hierop is geringer bij de eerste drie voorbeelden (beperkt
informatieaanbod) en groter bij de laatste twee vanwege het complexe aanbod.
-
Realisatie van deze vorm van ontsluiting vergt geen andere investering dan het maken
van een adekwaat home page overzicht, wat toch al moet gebeuren. Dit lijkt aantrekkelijk als
beschikbare middelen beperkt zijn maar vooronderstelt dat zo ontsloten informatie beperkt
en overzichtelijk is.
Een veelheid aan (complexe) informatie: ontsluiting met een zoekfaciliteit
Voorbeelden zijn een commerciële site: Adobe (software onder andere voor electronic
publishing) (9), en een overkoepelende
site: I*M Europe (informatie door de Europese
Commissie op alle terrein van het ontwikkelen van elektronische informatiediensten)
(10).
Beide bieden deze ontsluiting aan op de home page
onder het label "search" en beide kennen
geavanceerde zoekfaciliteiten en begeleiding van de gebruiker bij het zoeken.
-
Adobe gebruikt de home page alleen om een reeks ingangen aan te geven waaronder
een gebruiker het aanbod kan bepalen en gericht verder kan zoeken op de site. Dit vraagt
meerdere navigatie stappen en mogelijk terugkeren om een andere ingang te proberen. De
zoekfaciliteit stelt wèl in één keer alle Adobe Web materiaal ter beschikking maar met de
nadelen die aan alle search engines kleven: hoe algemener de zoekvraag en hoe onbekender
een gebruiker nog is met het informatieaanbod op een site, des te minder geeft deze
ontsluiting een toegevoegde waarde. Gezocht is op "PDF" als voorbeeld van een
gebruikersbehoefte aan algemene oriëntatie en op "Capture" als representatief voor gericht
informatie krijgen. Het eerste is een uitwisselingsformaat van Adobe, het tweede Adobe
software. Voor de ingangen geboden op de home page is "PDF" te algemeen. De search
faciliteit geeft een reeks resultaten maar meerdere van deze documenten zouden ook
doorgekeken moeten worden om relevantie te bepalen. De gebruiker blijft met lege handen
staan. Informatie over de Capture software is evenmin direct met navigatie te vinden maar
hier geeft de search adekwate resultaten. De vraag over "Capture" is dan ook specifiek, sluit
nauw aan op wat de site wil aanbieden en de gebruiker hanteert deze ontsluiting alleen voor
lokalisatie op een complexe Web site. Vergelijkbaar met het Adobe voorbeeld is op I*M
Europe gezocht naar de Europese discussieronde die het "Green Paper on the Role of
Libraries in the Information Society" moet gaan opleveren (algemene vraag) en "Z39.50" als
een specifieke vraag. De home page biedt voor beide vragen voor navigatie geen
aanknopingspunten en gezocht werd op "green paper" omdat een precieze omschrijving een
gebruiker meestal niet bekend is. Dit levert uit de 6231 documenten op de site, 230 hits op.
Pas met "refine search" door het extra woord "libraries" wordt de gewenste informatie
gevonden. De specifieke "Z39.50" vraag geeft direct relevant resultaat. Een belangrijke reden
waarom vergeleken met Adobe, I*M Europe met deze vorm van ontsluiting ook voor
algemene vragen waarde toevoegt ten behoeve van navigatie, is de zorg besteed aan de
presentatie van de zoekresultaten: elk resultaat gaat vergezeld van een kort citaat uit het
document. Dit helpt een gebruiker zonder veel voorkennis, aard en relevantie van het
gebodene sneller te overzien.
-
Bij verdwalen op deze sites kan zowel terug gegaan worden naar de home page als de
zoekfaciliteit benut worden. Gebruikers zouden dan door een "search" met algemene vragen
alsnog hun weg willen vinden. Dit is vergelijkbaar met de voorafgaand besproken situatie
waar een gebruiker een Web site benadert met een algemene vraag en de "search" wil
gebruiken ten behoeve van navigatie. I*M Europe als overkoepelende site is voor navigatie
dermate moeilijk dat bij de weg kwijt raken de zoekfaciliteit toch een uitweg kan bieden. De
Adobe site is eenduidiger (een reeks software producten met daaromheen verkoop en
dienstenaabod) en daardoor gemakkelijker voor navigatie met minder verdwaalkans.
Verdwaalt men toch dan is de gezochte informatie vermoedelijk zo algemeen of zit niet in het
Adobe aanbod, dat ook een "search" nauwelijks hulp biedt. In het algemeen staat een
inhoudelijke ontsluiting met een zoekfaciliteit waar een gebruiker zelf de (zoek)termen voor
moet bedenken, haaks op een situatie waar een Web site bezoeker het juist opgegeven heeft en
verdwaald is.
-
Realisatie vergt éénmalige investering in software voor indexering en in de search
engine, een juiste aanmaak van Web documenten (bijvoorbeeld om een citaat te kunnen tonen
bij zoekresultaten) maar vervolgens kan deze vorm van ontsluiting verregaand
geautomatiseerd verlopen. Het is de vraag of er om die redenen niet vaak voor gekozen wordt
terwijl het gebruikers maar beperkt kan helpen. Alleen bij sites met een zeer divers aanbod en
om die reden moeilijke navigatie of bij ervaren gebruikers die een site kennen en specifieke
informatie willen uitlichten, lijkt een zoekfaciliteit op Web inhoud nut te hebben.
Een veelheid aan (complexe) informatie: ontsluiting met een handmatig aangelegde
alfabetische lijst met termen
Voorbeelden zijn opnieuw de commerciële Adobe site en de overkoepelende site I*Am
Europe . Daarmee is het tevens mogelijk voor één en dezelfde Web site twee benaderingen
van inhoudelijke ontsluiting (lijst en zoekfaciliteit), onderling te vergelijken.
-
Als toevoeging aan navigatie biedt Adobe onder het label "index" een alfabetisch
gerangschikte lijst met termen (11),
waarbij elke term de gebruiker direkt naar een bepaalde
Web pagina of onderdeel van de site kan brengen. Dit versnelt het lokaliseren van specifieke
informatie maar ook het afwegen of de site biedt wat men zoekt gaat gemakkelijker door een
beperkte lijst door te bladeren dan door stapsgewijs verkennen vanaf de home page. Op zich
hebben home page's en lijsten dezelfde mogelijkheden om met goed gekozen bewoordingen
het Web aanbod te structureren maar moet een home page zich beperken tot wat in één
beeldscherm aan een gebruiker getoond kan worden. Bovendien zal de metafoor die men bij
het ontwerpen in gedachten neemt voor home page en lijst verschillen: wordt uitgegaan van
het boek als metafoor dan is de home page eerder de algemene informatie op voor- en
achterkant van een boek, terwijl een lijst een analogie heeft met inhoudsopgave en index van
een boek. Met de ook eerder gebruikte informatievraag naar "PDF" (algemeen) en "Capture"
(specifiek) blijkt de toegevoegde waarde van de Adobe index ten behoeve van navigatie:
waar de home page geen aanknopingspunten heeft, komt PDF in de lijst wel voor en Capture
onder "Acrobat Capture". De I*Am Europe site heeft onder het label "subject index" (12)
een vergelijkbare inhoudelijke ontsluiting maar meer naar analogie met de inhoudsopgave dan de
index van een boek: de lijst bevat de "main subject headings" die zeer algemeen zijn met
daaronder niveaus met gerelateerde, specifiekere termen. Een boek index zoals ook bij Adobe
is een platte lijst die losstaat van hoe een Web site hiërarchisch ingedeeld is. (13)
De informatie over het "green paper" als algemene vraag, is onder "libraries"
in de subject index van I*Am
Europe in twee stappen te vinden. Voor de specifiekere vraag naar "Z39.50" blijkt de index
weinig toe te voegen: een gebruiker moet veel voorkennis hebben om eerst de hoofdterm
"Open Information Interchange Standards" te kiezen en daaronder uit een verder twintigtal een
specifiekere term, waarvan verschillende nauw verwant zijn. Pas op een derde niveau waar
eerst naar toe genavigeerd moet zijn, wordt "Z39.50" gevonden. Zoals het "Capture"
voorbeeld niet onder de letter "c" gevonden werd maar uiteindelijk wel door bladeren in de
Adobe index, zo moet bij I*Am Europe bladeren toch nog telkens met navigeren
gecombineerd worden. Naar analogie van Web aanbod als een boek, heeft de Europe site met
deze ontsluiting meer een inhoudsopgave op het oog en Adobe de index. Bij beiden is de
afbakening niet scherp: I*Am voegt toch detail toe maar verborgen op een apart niveau,
Adobe heeft één lijst met soms ook algemeen beschrijvende termen. Naarmate informatie die
een gebruiker wil lokaliseren specifieker is zal ontsluiting met een handmatig aangelegde lijst
minder waarde toevoegen ten behoeve van navigatie en het type "inhoudsopgave" (per
definitie) minder dan het type "index". Het omgekeerde doet zich voor met algemene vragen
en bepalen wat een Web site te bieden heeft. Een combinatie van beide analogieën
"inhoudsopgave van een boek" en "boek index" tot één door te bladeren alfabetische lijst, lijkt
een goed compromis. Het handmatig aanleggen ervan is daarbij essentieel: een beredeneerde
keuze van termen is nodig om zowel het meer algemene als het detail te ontsluiten en tegelijk
de lijst overzichtelijk te houden voor doorbladeren. Het automatisch laten genereren van een
lijst uit alle woorden van de Web inhoud van een site, komt daarom als alternatief niet in
aanmerking.
-
Bij verdwalen op deze sites is er naast teruggaan naar de home page, de mogelijkheid
van raadplegen van de lijst met termen. Vergeleken met ontsluiting door een zoekfaciliteit,
heeft een gebruiker aan een lijst direct steun: er gaat een reeks suggesties vanuit waar
gezochte informatie met één verdere navigatiestap te vinden is en dient daarmee als snelle
wegwijzer. Doordat de lijst handmatig aangelegd wordt kan bovendien rekening gehouden
worden met omschrijvingen en benoemingen door gebruikers zelf. Dezelfde informatie of
diensten op een Web site kunnen zo door synoniemen met meerdere ingangen beschreven
worden voor meerdere, verschillende gebruikersgroepen. Vergelijkbaar kunnen termen
opgenomen worden die refereren aan informatie die veel op een site geraadpleegd wordt en
dus blijkbaar veel gezocht wordt. De metafoor van Web aanbod als een boek sluit bij uitstek
aan bij situaties waar een gebruiker nog niet of niet meer zijn weg weet te vinden: ieder heeft
ervaring met het vinden van informatie in boeken en het terugvallen op inhoudsopgave of
index is bijna intuïtief. Aan de I*Am Europe "subject index" lijkt handmatig weinig verdere
aandacht besteed, bij Adobe meer - bij samengestelde termen bijvoorbeeld laat men soms
deeltermen elders terugkomen. Zelfs in ruwere vorm bieden beide voorbeelden met deze
ontsluiting toch meer hulp aan een verdwaalde gebruiker dan het lege loket van een
zoekfaciliteit.
-
Realisatie vraagt geen bijzondere software of investeringen, maar wel éénmalig de
analyse van informatie en diensten die geboden worden en vervolgens de aanleg van een lijst
met inhoudelijk beredeneerde termen om dit aanbod te ontsluiten. Daarbij hoort de analyse
naar welke pagina's en onderdelen van de Web site vanuit de lijst het best verband gelegd kan
worden. Verrijking met synoniemen en dergelijke is dan nog een extra inspanning. Wordt
nieuw aanbod op de site aangebracht dan zal ook de lijst moeten veranderen. Daarmee vergt
deze vorm van ontsluiting de meeste en ook terugkerende inzet. Omgekeerd aan de situatie bij
een zoekfaciliteit, kan dit een reden zijn waarom bij complexe en veelsoortige Web informatie
toch weinig tot een handmatige lijst besloten wordt. De vergelijking van de drie vormen van
inhoudelijke ontsluiting laat aan de andere kant juist ook de voordelen voor de gebruiker zien.
De nu volgende case van de Web site van het Nederlands Instituut voor Wetenschappelijke
Informatiediensten (NIWI) illustreert juist deze laatste benadering.
Ontsluiting van de NIWI Web site met een handmatige aangelegde lijst met termen:
gekozen analogie, uitwerking en voordelen
Achtergrond
Het NIWI biedt nationaal wetenschappelijke informatie aan in vier wetenschapsgebieden:
biomedisch, geschiedenis, maatschappijwetenschappen en Nederlandse taal en letteren. Het
type informatie is verder onder te verdelen in: data voor secundaire analyse (data-archieven),
documenten en bibliografische referenties en onderzoekinformatie. De informatiediensten
worden geleverd aan de wetenschappelijke wereld maar ook speelt het NIWI een rol in
kennisoverdracht aan academische professionals, het bedrijfsleven, de media en het algemene
publiek. Daarnaast wordt bijgedragen aan internationale verspreiding van (Nederlandse)
wetenschappelijke informatie.
Omdat het accent gelegd wordt op beschikbaarstelling en dienstverlening over het Internet, is
de NIWI Web site een essentiële schakel in het aanbieden van genoemde informatie en
informatiediensten. (14)
De site is tweetalig: Engels en Nederlands. Een belangrijk kenmerk is
verder de reeks uniforme zoekfaciliteiten die elk type informatie uit de verschillende
wetenschapsgebieden toegankelijk maken. Afzonderlijke Web pagina's dienen in hoofdzaak
om een gebruiker met zo min mogelijk navigatie bij gewenst aanbod te brengen. Bestellingen
of uitleenverzoeken worden vervolgens eveneens via het Web gerealiseerd.
Doordat verschillende gebruikersgroepen aangesproken moeten worden en het NIWI aanbod
complex is in de zin van meerdere wetenschappelijke disciplines en meerdere typen
informatie, wordt gebruikers naast navigatie vanaf de home page ook een inhoudelijke
ontsluiting van de Web site geboden met hulp van een handmatig aangelegde en alfabetisch
gerangschikte lijst met termen. (15) Deze
benadering heeft voorkeur boven ontsluiting met een
zoekfaciliteit om redenen zoals toegelicht bij het vergelijken van de drie benaderingen van
inhoudelijke ontsluiting. Bovendien brengt NIWI de lijst vooral als help faciliteit onder
"verdwaald ?" of "lost ?" en minder als toegevoegde waarde ten behoeve van navigatie. Juist
voor verdwaalde gebruikers heeft een zoekfaciliteit weinig of niets te bieden. Bovendien
ontsluit de NIWI site geen grote aantallen afzonderlijke documenten (zoals bijvoorbeeld
I*Am Europe) maar beheert en maakt informatie toegankelijk met databanken. Een
zoekfaciliteit op NIWI Web pagina's zou geen inhouden te indexeren hebben. Met een
handmatige lijst kan tevens ingespeeld worden op verschillend woord- en begrippengebruik
bij het heterogene publiek dat NIWI bedient.
De lijst met termen is uitgewerkt naar analogie met de index van een boek. De naamgeving
van de Web pagina is voorlopig nog gekozen als "Inhoudsopgave" respectievelijk "Table of
contents" om voor gebruikers een zo vertrouwd mogelijke term te hanteren, als is die strikt
genomen niet juist. De opzet is om bij verdwaald zijn een alternatief te bieden dat aanhaakt bij
de ervaring die ieder heeft om informatieaanbod (een boek, een Web site) snel te overzien,
zowel op hoofdpunten als meer op details, door alfabetisch op te zoeken in een index. Een
ontsluiting naar analogie van de inhoudsopgave van een boek, zou alleen de indeling en
structuur van een Web site weergeven. Dit type overzicht werd met de NIWI home page en
het algemene ontwerp van de site al gerealiseerd. Overwogen wordt nog wel om een
inhoudsopgave aan te bieden als "site map" voor die gebruikers die voor een overzicht meer
visueel dan tekst georiënteerd zijn. Een site map combineert grafische technieken en
tekstelementen om indeling van een Web site samen met hoofdpunten van het aanbod, weer te
geven. Zowel Adobe (16) als
I*Am Europe (17) bieden deze variant aan.
Uitwerking
Uitwerking van de inhoudelijke ontsluiting zoals NIWI die hanteert, behelst drie aktiviteiten:
- het inhoudelijk beredeneren en kiezen van termen,
- het nagaan en bewaken van relevantie van termen voor de verschillende groepen gebruikers
van de NIWI site,
- het praktisch aanleggen en onderhouden van de index, gegeven ook dat de site aan
verandering onderhevig is
-
Het inhoudelijk bepalen van de termen steunt op analyse van het aanbod van NIWI
informatiediensten zoals dat op specifieke Web pagina's vorm krijgt: die termen zijn geschikt
die het aanbod specifiek genoeg verwoorden en (daarmee) vervolgens ook uniek naar een
bepaalde NIWI Web pagina kunnen verwijzen. Opnemen van synoniemen en het geven van
meerdere ingangen aan samengestelde termen, verhogen de waarde van de lijst onder behoud
van die unieke pagina referentie.
Het NIWI onderhoudt bijvoorbeeld databanken met bibliografische bestanden. Deze zijn er
voor verschillende wetenschappelijke disciplines. In de index voor de Web site is daarom de
hoofdterm "bibliografische verwijzingen" opgenomen maar als synoniem ondermeer ook de
hoofdtermen: "tijdschrift artikelen", "boeken" en "auteurs". Subtermen zijn telkens de
relevante disciplines. Verwezen wordt direct naar de pagina waar in de bestanden gezocht kan
worden. Omringende pagina's in het Web design hebben geen verwijzing omdat deze alleen
functioneel zijn bij stapsgewijze navigatie vanaf de home page. De synoniemen proberen
dezelfde informatiedienst voor zowel academische gebruikers als het algemene publiek, te
verwoorden. Een algemeen voorbeeld van synoniemen is de Web pagina met NIWI
prijsinformatie die de termen "kosten", "prijslijst" en "service kosten" heeft.
Soms is aanbod door de tijd heen bekend geraakt onder afkortingen of eigennamen, zoals
"SWTL" of "Grateful Med". Opname van dergelijke termen is waardevol als wegwijzer.
Naast bibliografische bestanden zijn ook data uit onderzoek en onderzoekinformatie
belangrijk in de NIWI informatiediensten. Woordfrequenties over de gehele Web site laten
zien dat er vijftien woorden zijn beginnend met "data" en het woord "data" zelf al meer dan
honderd maal voorkomt. Met "onderzoek" beginnen achttien woorden en de frekwentie voor
"onderzoek" zelf is negenenveertig. Een automatisch gegenereerde index op woordinhoud
van de site, maar ook een zoekfaciliteit als ontsluiting, zouden weinig overzicht of hulp
bieden wanneer een gebruiker meer algemeen in data of onderzoekinformatie geïnteresseerd
is. Dit deel van het NIWI aanbod kon in de handmatige lijst met slechts enkele hoofd- en
subtermen wel specifiek en uniek verwezen worden.
-
De bepaling van de relevantie van termen voor verschillende groepen Web site
gebruikers gebeurt door bijvoorbeeld te vergelijken met woordkeus en begrippengebruik in
door NIWI bestreken wetenschapsgebieden.
Een voorbeeld zijn de data-archieven van NIWI. Gebruikelijke termen in publicaties met
kwantitatieve analyses zijn: "databestanden", "secundaire analyse" en het gebruik van "data
beschikbaar stellen". In de index verwijzen de eerste twee termen naar de Web pagina waar de
catalogus doorzocht kan worden, de derde term naar een registratiefaciliteit voor
databestanden.
Ingeburgerde termen zijn een ander voorbeeld: "lopend onderzoek" is om die reden
opgenomen, waar de Web site uitsluitend het modernere "onderzoekinformatie" hanteert.
Het maken van de Table of Contents kan gebaat zijn bij glossaries.
-
De praktische aanleg en onderhoud van de index zijn beperkt doordat alleen die Web
pagina's verwijzingen hoeven te krijgen waar een (informatie)dienst of aanbod plaats vindt.
Tussenstappen en dergelijke in het Web design, komen daarmee niet in aanmerking.
Nederlandse en Engelse termen worden in een plat ASCII bestand bijgehouden (18),
telkens met
de bestandsnaam van de corresponderende Web pagina. Een Perl programma genereert
hieruit de "Table of Contents" en "Inhoudsopgave" voor de Web site en brengt de termen aan
in de betrokken pagina's zelf volgens HTML MetaTag syntax. (19)
Het laatste anticipeert het
indexeren van NIWI Web aanbod door robots en search engines. Woordenboeken en
synoniemenlijsten zijn vanaf het Internet te gebruiken, wat het deels automatiseren van
onderhoud zal vergemakkelijken: vooral voor de "Table of Contents" zijn zo glossaries voor
bepaalde vakgebieden te raadplegen en het vertalen tussen de Nederlandse en Engelse lijst met
termen kan er suggesties vinden. (20)
Conclusie
De gedane vergelijking van drie benaderingen van inhoudelijke ontsluiting van Web sites,
wijst op sterke voordelen van een handmatig aangelegde alfabetische lijst, vooral wanneer
een gebruiker verdwaald is op een site met complexe informatie.
Uit dezelfde vergelijking blijkt juist deze ontsluiting door het handmatige karakter, meer en
blijvende investering te vergen.
Voor de NIWI Web site is gekozen voor ontsluiting met een alfabetische lijst met termen, die
bovendien nader uitgewerkt is naar analogie met de index van een boek. Termen kunnen
synoniemen hebben en onder meerdere ingangen voorkomen maar verwijzen telkens naar één
unieke Web pagina. Door bij toekenning van termen te redeneren vanuit het dienstenaanbod
van NIWI en niet vanuit elke individuele Web pagina, is het aantal verwijzingen relatief
beperkt. Ook de nadere criteria van specifiekheid en uniek refereren, houden de lijst met
termen beperkt.
Door uitwerking naar analogie met een index, blijken de voordelen voor de gebruiker van
deze wijze van Web site ontsluiting, samen te kunnen gaan met binnen het redelijke blijvende
kosten aan aanleg en onderhoud.
NIWI; November 1997
Noten
1. Web Review en de column Web Architect is te vinden op:
http://webreview.com/universal/previous/arch/index.html
Relevant zijn: October en July 1997 ; September 1996
2. "Visualizing websites using a hierarchical table of contents browser: WebTOC" ; David Nation et al. ;
Conference Proceedings: 3d Conference on Human Factors & the Web, Desigining for the Web, 1997
http://www.uswest.com/web-conference/proceedings/nation.html
3. "navigate in I*Am Europe's contents in a 3D virtual space" ; (dit vergt het ophalen van een browser
uitbreiding) http://www2.echo.lu/ime-virtual.html
4. http://www.uswest.com/web-conference/
5. http://www-nlpir.nist.gov/~downey/
6. http://www.chesco.com/~cmarion/Academic/UseEng.html
7. http://145.18.241.97:80/sociosite/
8. http://www.nlc-bnc.ca/ifla/
9. http://www.adobe.com/ ; search: http://www.adobe.com/misc/search.html
10. http://www2.echo.lu/home.html ; search: http://www2.echo.lu/search.html
11. http://www.adobe.com/ ; index: http://www.adobe.com/misc/siteindex.html
12. http://www2.echo.lu/home.html ; subject index: http://www2.echo.lu/subjhead.html
13. Zie Web Architect (noot 1) July 97, sectie "The User's View of a Site" ; idem September 96, sectie "Second
Commandment" ; idem October 97, sectie "So what are side indexes.."
14. De NIWI Web Site: http://www.niwi.knaw.nl
15. De index is bereikbaar vanaf elke pagina (label "verdwaald ?") in de linker kolom. De directe URL is:
http://www.niwi.knaw.nl/nl/keyword.htm
16. http://www.adobe.com/misc/sitemap.html
17. http://www2.echo.lu/sitemap.html
18. Als voorbeeld de hoofdterm "boeken" met de subtermen:
/cgi-bin/nph-biomed_search.pl#books$biomedical literature#boeken$biomedische vakliteratuur
/cgi-bin/nph-socsci_search.pl#books$social sciences#boeken$maatschappijwetenschappen
19. De metatag in een HTML pagina:
<HEAD>
<META NAME="keywords" CONTENT="kosten , prijslijst , servicekosten ">
</HEAD>
20. Er zijn verschillende overzicht sites: bijvoorbeeld: http://odwin.ucsd.edu/glossary/others.html
Voor vertalingen is een EC initiatief veelbelovend: http://www2.echo.lu/edic/