Ontsluiting van Web sites naar analogie met de inhoudsopgave van een boek: voordelen en toepassing

R.E. de Vries en N.J.I. Mars

Nederlands Instituut voor Wetenschappelijke Informatiediensten, NIWI
(http://www.niwi.knaw.nl)

Samenvatting

Inhoudelijke ontsluiting van Web sites kent meerdere benaderingen. Hier wordt een vergelijking tussen gemaakt aan de hand van voorbeelden. De uitkomsten van de vergelijking wijzen op voordelen van ontsluiting met een handmatig aangelegde alfabetische lijst. Dit wordt nader uitgewerkt in de case van de Web site van het Nederlands Instituut voor Wetenschappelijke Informatiediensten (NIWI), dat voor een dergelijke benadering gekozen heeft.

Inleiding

In toenemende mate worden informatie en daarop geënte diensten over het Internet beschikbaar gesteld waarbij het World Wide Web de nu meest gekozen vorm is. Dit vergt het ontwerpen, opzetten en onderhouden van een zogenaamde Web site: een Internet plek waar een gebruiker langs informatieaanbod geleid wordt en diensten kan afnemen zoals het doorzoeken van databases en het bestellen van afdrukken van tijdschriftartikelen. Deze sites verschillen onder andere in hoeveelheid en veelsoortigheid van aangeboden informatie. Om ook complex aanbod hanteerbaar te houden voor gebruikers, kent het Web hypertext technieken. Daarmee wordt informatie niet in één keer aangeboden maar opgedeeld en in samenhang gebracht. Hypertext biedt vervolgens een gebruiker die aanbod op een site wil beoordelen en lokaliseren , alleen de mogelijkheid dit stap voor stap te doen: het zogenaamde "navigeren" op een site. En zoals met elk de weg zoeken: verdwalen is niet uitgesloten.

Met inhoudelijke ontsluiting van een Web site wordt een alternatief geboden voor dit stapsgewijs navigeren en een wegwijzer tegen verdwalen.

Inhoudelijke ontsluiting van Web sites volgt grofweg drie benaderingen:

  • bij weinig aangeboden informatie wordt volstaan met een overzicht op de "home page", het centrale vertrekpunt op een Web site voor verder intern navigeren
  • bij een veelheid aan informatie of een complexe structuur wordt ofwel een zoekfaciliteit geboden op alle inhoud van de site,
  • of er is een handmatig aangelegde alfabetische lijst met termen die de informatie ontsluiten.

De variant waarbij uit alle materiaal op een site geautomatiseerd een index gegenereerd wordt, is een mengvorm die weinig verschilt van de zoekbenadering omdat de termen niet inhoudelijk beredeneerd zijn maar bestaan uit de woord- en begripskeus in het Web aanbod zelf.

Toepassing van inhoudelijke ontsluiting blijkt weinig konsekwent: er zijn voorbeelden van sites met een veelheid aan informatie terwijl toch met een home page ontsluiting volstaan wordt, soms ook worden meerdere benaderingen tegelijk ingezet. De zoekfaciliteit wordt veel aangetroffen, maar waarschijnlijk meer omdat deze geautomatiseerd te realiseren is, zonder dat een bewuste keus is gemaakt.
De handmatig aangelegde alfabetische lijst daarentegen komt relatief weinig voor, terwijl deze een gebruiker van een Web site veel meer steun biedt bij het bepalen, vinden of alsnog vinden van gewenst informatie- of diensten aanbod.
Literatuur is schaars. Het elektronisch gepubliceerde en praktijkgerichte Web Review besteedt er aandacht aan onder "Web Architect" (1). Conferentiepapers lijken zich meer op experimenten te richten, bijvoorbeeld met visualisaties om inhoud van een Web site samen te vatten (2) . Sites zelf treden zelden buiten de gebaande paden: een weliswaar navigatie georiënteerd voorbeeld is het ontsluiten van een grote Europese overkoepelende site door de gebruiker een "drie dimensionele virtuele ruimte" te bieden (3).

Door de benaderingen te vergelijken ten aanzien van de voordelen voor een Web site gebruiker en de kosten voor de maker van een site, kan de keus voor een bepaalde vorm van inhoudelijke ontsluiting verder beredeneerd worden.

Vergelijking van vormen van inhoudelijke Web site ontsluiting

Met enkele Internet voorbeelden zijn de drie benaderingen op de volgende categorieën vergeleken:

  • de toegevoegde waarde ten behoeve van navigatie om een Web site bezoeker adekwaat het aanbod te laten bepalen en lokaliseren
  • de mate waarin de benadering een verdwaalde Web site gebruiker een uitweg en alternatief biedt
  • de voor realisatie en onderhoud op de Web site benodigde investering

Inhoudelijke ontsluiting met alleen een overzicht op de home page

Voorbeelden zijn een conferentie site en persoonlijke sites opgezet vanuit vakinteresse: de "Third Conference on Human Factors & the Web: Designing for the Web" (4) en het op persoonlijke titel georganiseerde aanbod van Laura Downey (5) en van Craig Marion (6) op het terrein van Web design en usability engineering. Daarnaast een voorbeeld van een verzamel site: de in Nederland gemaakte "SocioSite" (7) en van een representatie site: die van de International Federation of Library Organizations - IFLA (8).

Al deze voorbeelden ontsluiten met alleen het overzicht dat op de home page geboden wordt en de gebruiker staat alleen navigatie ter beschikking. Het is in feite de basissituatie voor alle Web sites. Bij Downey , Marion en de Human Factors conferentie is de benadering passend omdat de hoeveelheid aangeboden informatie beperkt en weinig complex van aard is. De voorbeelden van IFLA en SocioSite daarentegen hebben een hoog informatieaanbod dat bovendien veelsoortig is en met een reeks vertakkingen: één van de andere twee benaderingen van inhoudelijke ontsluiting zou hier de gebruiker meer steun kunnen bieden.
Bij verdwalen op de site of een verwachting niet beantwoord krijgen, is er in alle voorbeelden geen ander alternatief dan terug te gaan naar de home page en door navigeren opnieuw te proberen. De kans hierop is geringer bij de eerste drie voorbeelden (beperkt informatieaanbod) en groter bij de laatste twee vanwege het complexe aanbod.
Realisatie van deze vorm van ontsluiting vergt geen andere investering dan het maken van een adekwaat home page overzicht, wat toch al moet gebeuren. Dit lijkt aantrekkelijk als beschikbare middelen beperkt zijn maar vooronderstelt dat zo ontsloten informatie beperkt en overzichtelijk is.


Een veelheid aan (complexe) informatie: ontsluiting met een zoekfaciliteit

Voorbeelden zijn een commerciële site: Adobe (software onder andere voor electronic publishing) (9), en een overkoepelende site: I*M Europe (informatie door de Europese Commissie op alle terrein van het ontwikkelen van elektronische informatiediensten) (10). Beide bieden deze ontsluiting aan op de home page onder het label "search" en beide kennen geavanceerde zoekfaciliteiten en begeleiding van de gebruiker bij het zoeken.

Adobe gebruikt de home page alleen om een reeks ingangen aan te geven waaronder een gebruiker het aanbod kan bepalen en gericht verder kan zoeken op de site. Dit vraagt meerdere navigatie stappen en mogelijk terugkeren om een andere ingang te proberen. De zoekfaciliteit stelt wèl in één keer alle Adobe Web materiaal ter beschikking maar met de nadelen die aan alle search engines kleven: hoe algemener de zoekvraag en hoe onbekender een gebruiker nog is met het informatieaanbod op een site, des te minder geeft deze ontsluiting een toegevoegde waarde. Gezocht is op "PDF" als voorbeeld van een gebruikersbehoefte aan algemene oriëntatie en op "Capture" als representatief voor gericht informatie krijgen. Het eerste is een uitwisselingsformaat van Adobe, het tweede Adobe software. Voor de ingangen geboden op de home page is "PDF" te algemeen. De search faciliteit geeft een reeks resultaten maar meerdere van deze documenten zouden ook doorgekeken moeten worden om relevantie te bepalen. De gebruiker blijft met lege handen staan. Informatie over de Capture software is evenmin direct met navigatie te vinden maar hier geeft de search adekwate resultaten. De vraag over "Capture" is dan ook specifiek, sluit nauw aan op wat de site wil aanbieden en de gebruiker hanteert deze ontsluiting alleen voor lokalisatie op een complexe Web site. Vergelijkbaar met het Adobe voorbeeld is op I*M Europe gezocht naar de Europese discussieronde die het "Green Paper on the Role of Libraries in the Information Society" moet gaan opleveren (algemene vraag) en "Z39.50" als een specifieke vraag. De home page biedt voor beide vragen voor navigatie geen aanknopingspunten en gezocht werd op "green paper" omdat een precieze omschrijving een gebruiker meestal niet bekend is. Dit levert uit de 6231 documenten op de site, 230 hits op. Pas met "refine search" door het extra woord "libraries" wordt de gewenste informatie gevonden. De specifieke "Z39.50" vraag geeft direct relevant resultaat. Een belangrijke reden waarom vergeleken met Adobe, I*M Europe met deze vorm van ontsluiting ook voor algemene vragen waarde toevoegt ten behoeve van navigatie, is de zorg besteed aan de presentatie van de zoekresultaten: elk resultaat gaat vergezeld van een kort citaat uit het document. Dit helpt een gebruiker zonder veel voorkennis, aard en relevantie van het gebodene sneller te overzien.
Bij verdwalen op deze sites kan zowel terug gegaan worden naar de home page als de zoekfaciliteit benut worden. Gebruikers zouden dan door een "search" met algemene vragen alsnog hun weg willen vinden. Dit is vergelijkbaar met de voorafgaand besproken situatie waar een gebruiker een Web site benadert met een algemene vraag en de "search" wil gebruiken ten behoeve van navigatie. I*M Europe als overkoepelende site is voor navigatie dermate moeilijk dat bij de weg kwijt raken de zoekfaciliteit toch een uitweg kan bieden. De Adobe site is eenduidiger (een reeks software producten met daaromheen verkoop en dienstenaabod) en daardoor gemakkelijker voor navigatie met minder verdwaalkans. Verdwaalt men toch dan is de gezochte informatie vermoedelijk zo algemeen of zit niet in het Adobe aanbod, dat ook een "search" nauwelijks hulp biedt. In het algemeen staat een inhoudelijke ontsluiting met een zoekfaciliteit waar een gebruiker zelf de (zoek)termen voor moet bedenken, haaks op een situatie waar een Web site bezoeker het juist opgegeven heeft en verdwaald is.
Realisatie vergt éénmalige investering in software voor indexering en in de search engine, een juiste aanmaak van Web documenten (bijvoorbeeld om een citaat te kunnen tonen bij zoekresultaten) maar vervolgens kan deze vorm van ontsluiting verregaand geautomatiseerd verlopen. Het is de vraag of er om die redenen niet vaak voor gekozen wordt terwijl het gebruikers maar beperkt kan helpen. Alleen bij sites met een zeer divers aanbod en om die reden moeilijke navigatie of bij ervaren gebruikers die een site kennen en specifieke informatie willen uitlichten, lijkt een zoekfaciliteit op Web inhoud nut te hebben.

Een veelheid aan (complexe) informatie: ontsluiting met een handmatig aangelegde alfabetische lijst met termen

Voorbeelden zijn opnieuw de commerciële Adobe site en de overkoepelende site I*Am Europe . Daarmee is het tevens mogelijk voor één en dezelfde Web site twee benaderingen van inhoudelijke ontsluiting (lijst en zoekfaciliteit), onderling te vergelijken.

Als toevoeging aan navigatie biedt Adobe onder het label "index" een alfabetisch gerangschikte lijst met termen (11), waarbij elke term de gebruiker direkt naar een bepaalde Web pagina of onderdeel van de site kan brengen. Dit versnelt het lokaliseren van specifieke informatie maar ook het afwegen of de site biedt wat men zoekt gaat gemakkelijker door een beperkte lijst door te bladeren dan door stapsgewijs verkennen vanaf de home page. Op zich hebben home page's en lijsten dezelfde mogelijkheden om met goed gekozen bewoordingen het Web aanbod te structureren maar moet een home page zich beperken tot wat in één beeldscherm aan een gebruiker getoond kan worden. Bovendien zal de metafoor die men bij het ontwerpen in gedachten neemt voor home page en lijst verschillen: wordt uitgegaan van het boek als metafoor dan is de home page eerder de algemene informatie op voor- en achterkant van een boek, terwijl een lijst een analogie heeft met inhoudsopgave en index van een boek. Met de ook eerder gebruikte informatievraag naar "PDF" (algemeen) en "Capture" (specifiek) blijkt de toegevoegde waarde van de Adobe index ten behoeve van navigatie: waar de home page geen aanknopingspunten heeft, komt PDF in de lijst wel voor en Capture onder "Acrobat Capture". De I*Am Europe site heeft onder het label "subject index" (12) een vergelijkbare inhoudelijke ontsluiting maar meer naar analogie met de inhoudsopgave dan de index van een boek: de lijst bevat de "main subject headings" die zeer algemeen zijn met daaronder niveaus met gerelateerde, specifiekere termen. Een boek index zoals ook bij Adobe is een platte lijst die losstaat van hoe een Web site hiërarchisch ingedeeld is. (13) De informatie over het "green paper" als algemene vraag, is onder "libraries" in de subject index van I*Am Europe in twee stappen te vinden. Voor de specifiekere vraag naar "Z39.50" blijkt de index weinig toe te voegen: een gebruiker moet veel voorkennis hebben om eerst de hoofdterm "Open Information Interchange Standards" te kiezen en daaronder uit een verder twintigtal een specifiekere term, waarvan verschillende nauw verwant zijn. Pas op een derde niveau waar eerst naar toe genavigeerd moet zijn, wordt "Z39.50" gevonden. Zoals het "Capture" voorbeeld niet onder de letter "c" gevonden werd maar uiteindelijk wel door bladeren in de Adobe index, zo moet bij I*Am Europe bladeren toch nog telkens met navigeren gecombineerd worden. Naar analogie van Web aanbod als een boek, heeft de Europe site met deze ontsluiting meer een inhoudsopgave op het oog en Adobe de index. Bij beiden is de afbakening niet scherp: I*Am voegt toch detail toe maar verborgen op een apart niveau, Adobe heeft één lijst met soms ook algemeen beschrijvende termen. Naarmate informatie die een gebruiker wil lokaliseren specifieker is zal ontsluiting met een handmatig aangelegde lijst minder waarde toevoegen ten behoeve van navigatie en het type "inhoudsopgave" (per definitie) minder dan het type "index". Het omgekeerde doet zich voor met algemene vragen en bepalen wat een Web site te bieden heeft. Een combinatie van beide analogieën "inhoudsopgave van een boek" en "boek index" tot één door te bladeren alfabetische lijst, lijkt een goed compromis. Het handmatig aanleggen ervan is daarbij essentieel: een beredeneerde keuze van termen is nodig om zowel het meer algemene als het detail te ontsluiten en tegelijk de lijst overzichtelijk te houden voor doorbladeren. Het automatisch laten genereren van een lijst uit alle woorden van de Web inhoud van een site, komt daarom als alternatief niet in aanmerking.
Bij verdwalen op deze sites is er naast teruggaan naar de home page, de mogelijkheid van raadplegen van de lijst met termen. Vergeleken met ontsluiting door een zoekfaciliteit, heeft een gebruiker aan een lijst direct steun: er gaat een reeks suggesties vanuit waar gezochte informatie met één verdere navigatiestap te vinden is en dient daarmee als snelle wegwijzer. Doordat de lijst handmatig aangelegd wordt kan bovendien rekening gehouden worden met omschrijvingen en benoemingen door gebruikers zelf. Dezelfde informatie of diensten op een Web site kunnen zo door synoniemen met meerdere ingangen beschreven worden voor meerdere, verschillende gebruikersgroepen. Vergelijkbaar kunnen termen opgenomen worden die refereren aan informatie die veel op een site geraadpleegd wordt en dus blijkbaar veel gezocht wordt. De metafoor van Web aanbod als een boek sluit bij uitstek aan bij situaties waar een gebruiker nog niet of niet meer zijn weg weet te vinden: ieder heeft ervaring met het vinden van informatie in boeken en het terugvallen op inhoudsopgave of index is bijna intuïtief. Aan de I*Am Europe "subject index" lijkt handmatig weinig verdere aandacht besteed, bij Adobe meer - bij samengestelde termen bijvoorbeeld laat men soms deeltermen elders terugkomen. Zelfs in ruwere vorm bieden beide voorbeelden met deze ontsluiting toch meer hulp aan een verdwaalde gebruiker dan het lege loket van een zoekfaciliteit.
Realisatie vraagt geen bijzondere software of investeringen, maar wel éénmalig de analyse van informatie en diensten die geboden worden en vervolgens de aanleg van een lijst met inhoudelijk beredeneerde termen om dit aanbod te ontsluiten. Daarbij hoort de analyse naar welke pagina's en onderdelen van de Web site vanuit de lijst het best verband gelegd kan worden. Verrijking met synoniemen en dergelijke is dan nog een extra inspanning. Wordt nieuw aanbod op de site aangebracht dan zal ook de lijst moeten veranderen. Daarmee vergt deze vorm van ontsluiting de meeste en ook terugkerende inzet. Omgekeerd aan de situatie bij een zoekfaciliteit, kan dit een reden zijn waarom bij complexe en veelsoortige Web informatie toch weinig tot een handmatige lijst besloten wordt. De vergelijking van de drie vormen van inhoudelijke ontsluiting laat aan de andere kant juist ook de voordelen voor de gebruiker zien.
De nu volgende case van de Web site van het Nederlands Instituut voor Wetenschappelijke Informatiediensten (NIWI) illustreert juist deze laatste benadering.


Ontsluiting van de NIWI Web site met een handmatige aangelegde lijst met termen: gekozen analogie, uitwerking en voordelen

Achtergrond

Het NIWI biedt nationaal wetenschappelijke informatie aan in vier wetenschapsgebieden: biomedisch, geschiedenis, maatschappijwetenschappen en Nederlandse taal en letteren. Het type informatie is verder onder te verdelen in: data voor secundaire analyse (data-archieven), documenten en bibliografische referenties en onderzoekinformatie. De informatiediensten worden geleverd aan de wetenschappelijke wereld maar ook speelt het NIWI een rol in kennisoverdracht aan academische professionals, het bedrijfsleven, de media en het algemene publiek. Daarnaast wordt bijgedragen aan internationale verspreiding van (Nederlandse) wetenschappelijke informatie.
Omdat het accent gelegd wordt op beschikbaarstelling en dienstverlening over het Internet, is de NIWI Web site een essentiële schakel in het aanbieden van genoemde informatie en informatiediensten. (14) De site is tweetalig: Engels en Nederlands. Een belangrijk kenmerk is verder de reeks uniforme zoekfaciliteiten die elk type informatie uit de verschillende wetenschapsgebieden toegankelijk maken. Afzonderlijke Web pagina's dienen in hoofdzaak om een gebruiker met zo min mogelijk navigatie bij gewenst aanbod te brengen. Bestellingen of uitleenverzoeken worden vervolgens eveneens via het Web gerealiseerd.
Doordat verschillende gebruikersgroepen aangesproken moeten worden en het NIWI aanbod complex is in de zin van meerdere wetenschappelijke disciplines en meerdere typen informatie, wordt gebruikers naast navigatie vanaf de home page ook een inhoudelijke ontsluiting van de Web site geboden met hulp van een handmatig aangelegde en alfabetisch gerangschikte lijst met termen. (15) Deze benadering heeft voorkeur boven ontsluiting met een zoekfaciliteit om redenen zoals toegelicht bij het vergelijken van de drie benaderingen van inhoudelijke ontsluiting. Bovendien brengt NIWI de lijst vooral als help faciliteit onder "verdwaald ?" of "lost ?" en minder als toegevoegde waarde ten behoeve van navigatie. Juist voor verdwaalde gebruikers heeft een zoekfaciliteit weinig of niets te bieden. Bovendien ontsluit de NIWI site geen grote aantallen afzonderlijke documenten (zoals bijvoorbeeld I*Am Europe) maar beheert en maakt informatie toegankelijk met databanken. Een zoekfaciliteit op NIWI Web pagina's zou geen inhouden te indexeren hebben. Met een handmatige lijst kan tevens ingespeeld worden op verschillend woord- en begrippengebruik bij het heterogene publiek dat NIWI bedient.
De lijst met termen is uitgewerkt naar analogie met de index van een boek. De naamgeving van de Web pagina is voorlopig nog gekozen als "Inhoudsopgave" respectievelijk "Table of contents" om voor gebruikers een zo vertrouwd mogelijke term te hanteren, als is die strikt genomen niet juist. De opzet is om bij verdwaald zijn een alternatief te bieden dat aanhaakt bij de ervaring die ieder heeft om informatieaanbod (een boek, een Web site) snel te overzien, zowel op hoofdpunten als meer op details, door alfabetisch op te zoeken in een index. Een ontsluiting naar analogie van de inhoudsopgave van een boek, zou alleen de indeling en structuur van een Web site weergeven. Dit type overzicht werd met de NIWI home page en het algemene ontwerp van de site al gerealiseerd. Overwogen wordt nog wel om een inhoudsopgave aan te bieden als "site map" voor die gebruikers die voor een overzicht meer visueel dan tekst georiënteerd zijn. Een site map combineert grafische technieken en tekstelementen om indeling van een Web site samen met hoofdpunten van het aanbod, weer te geven. Zowel Adobe (16) als I*Am Europe (17) bieden deze variant aan.

Uitwerking

Uitwerking van de inhoudelijke ontsluiting zoals NIWI die hanteert, behelst drie aktiviteiten:

  • het inhoudelijk beredeneren en kiezen van termen,
  • het nagaan en bewaken van relevantie van termen voor de verschillende groepen gebruikers van de NIWI site,
  • het praktisch aanleggen en onderhouden van de index, gegeven ook dat de site aan verandering onderhevig is

Het inhoudelijk bepalen van de termen steunt op analyse van het aanbod van NIWI informatiediensten zoals dat op specifieke Web pagina's vorm krijgt: die termen zijn geschikt die het aanbod specifiek genoeg verwoorden en (daarmee) vervolgens ook uniek naar een bepaalde NIWI Web pagina kunnen verwijzen. Opnemen van synoniemen en het geven van meerdere ingangen aan samengestelde termen, verhogen de waarde van de lijst onder behoud van die unieke pagina referentie.
Het NIWI onderhoudt bijvoorbeeld databanken met bibliografische bestanden. Deze zijn er voor verschillende wetenschappelijke disciplines. In de index voor de Web site is daarom de hoofdterm "bibliografische verwijzingen" opgenomen maar als synoniem ondermeer ook de hoofdtermen: "tijdschrift artikelen", "boeken" en "auteurs". Subtermen zijn telkens de relevante disciplines. Verwezen wordt direct naar de pagina waar in de bestanden gezocht kan worden. Omringende pagina's in het Web design hebben geen verwijzing omdat deze alleen functioneel zijn bij stapsgewijze navigatie vanaf de home page. De synoniemen proberen dezelfde informatiedienst voor zowel academische gebruikers als het algemene publiek, te verwoorden. Een algemeen voorbeeld van synoniemen is de Web pagina met NIWI prijsinformatie die de termen "kosten", "prijslijst" en "service kosten" heeft.
Soms is aanbod door de tijd heen bekend geraakt onder afkortingen of eigennamen, zoals "SWTL" of "Grateful Med". Opname van dergelijke termen is waardevol als wegwijzer.
Naast bibliografische bestanden zijn ook data uit onderzoek en onderzoekinformatie belangrijk in de NIWI informatiediensten. Woordfrequenties over de gehele Web site laten zien dat er vijftien woorden zijn beginnend met "data" en het woord "data" zelf al meer dan honderd maal voorkomt. Met "onderzoek" beginnen achttien woorden en de frekwentie voor "onderzoek" zelf is negenenveertig. Een automatisch gegenereerde index op woordinhoud van de site, maar ook een zoekfaciliteit als ontsluiting, zouden weinig overzicht of hulp bieden wanneer een gebruiker meer algemeen in data of onderzoekinformatie geïnteresseerd is. Dit deel van het NIWI aanbod kon in de handmatige lijst met slechts enkele hoofd- en subtermen wel specifiek en uniek verwezen worden.

De bepaling van de relevantie van termen voor verschillende groepen Web site gebruikers gebeurt door bijvoorbeeld te vergelijken met woordkeus en begrippengebruik in door NIWI bestreken wetenschapsgebieden.
Een voorbeeld zijn de data-archieven van NIWI. Gebruikelijke termen in publicaties met kwantitatieve analyses zijn: "databestanden", "secundaire analyse" en het gebruik van "data beschikbaar stellen". In de index verwijzen de eerste twee termen naar de Web pagina waar de catalogus doorzocht kan worden, de derde term naar een registratiefaciliteit voor databestanden.
Ingeburgerde termen zijn een ander voorbeeld: "lopend onderzoek" is om die reden opgenomen, waar de Web site uitsluitend het modernere "onderzoekinformatie" hanteert.
Het maken van de Table of Contents kan gebaat zijn bij glossaries.

De praktische aanleg en onderhoud van de index zijn beperkt doordat alleen die Web pagina's verwijzingen hoeven te krijgen waar een (informatie)dienst of aanbod plaats vindt. Tussenstappen en dergelijke in het Web design, komen daarmee niet in aanmerking. Nederlandse en Engelse termen worden in een plat ASCII bestand bijgehouden (18), telkens met de bestandsnaam van de corresponderende Web pagina. Een Perl programma genereert hieruit de "Table of Contents" en "Inhoudsopgave" voor de Web site en brengt de termen aan in de betrokken pagina's zelf volgens HTML MetaTag syntax. (19) Het laatste anticipeert het indexeren van NIWI Web aanbod door robots en search engines. Woordenboeken en synoniemenlijsten zijn vanaf het Internet te gebruiken, wat het deels automatiseren van onderhoud zal vergemakkelijken: vooral voor de "Table of Contents" zijn zo glossaries voor bepaalde vakgebieden te raadplegen en het vertalen tussen de Nederlandse en Engelse lijst met termen kan er suggesties vinden. (20)


Conclusie

De gedane vergelijking van drie benaderingen van inhoudelijke ontsluiting van Web sites, wijst op sterke voordelen van een handmatig aangelegde alfabetische lijst, vooral wanneer een gebruiker verdwaald is op een site met complexe informatie.
Uit dezelfde vergelijking blijkt juist deze ontsluiting door het handmatige karakter, meer en blijvende investering te vergen.
Voor de NIWI Web site is gekozen voor ontsluiting met een alfabetische lijst met termen, die bovendien nader uitgewerkt is naar analogie met de index van een boek. Termen kunnen synoniemen hebben en onder meerdere ingangen voorkomen maar verwijzen telkens naar één unieke Web pagina. Door bij toekenning van termen te redeneren vanuit het dienstenaanbod van NIWI en niet vanuit elke individuele Web pagina, is het aantal verwijzingen relatief beperkt. Ook de nadere criteria van specifiekheid en uniek refereren, houden de lijst met termen beperkt.
Door uitwerking naar analogie met een index, blijken de voordelen voor de gebruiker van deze wijze van Web site ontsluiting, samen te kunnen gaan met binnen het redelijke blijvende kosten aan aanleg en onderhoud.

NIWI; November 1997



Noten


1. Web Review en de column Web Architect is te vinden op: http://webreview.com/universal/previous/arch/index.html
Relevant zijn: October en July 1997 ; September 1996
2. "Visualizing websites using a hierarchical table of contents browser: WebTOC" ; David Nation et al. ; Conference Proceedings: 3d Conference on Human Factors & the Web, Desigining for the Web, 1997 http://www.uswest.com/web-conference/proceedings/nation.html
3. "navigate in I*Am Europe's contents in a 3D virtual space" ; (dit vergt het ophalen van een browser uitbreiding) http://www2.echo.lu/ime-virtual.html
4. http://www.uswest.com/web-conference/
5. http://www-nlpir.nist.gov/~downey/
6. http://www.chesco.com/~cmarion/Academic/UseEng.html
7. http://145.18.241.97:80/sociosite/
8. http://www.nlc-bnc.ca/ifla/
9. http://www.adobe.com/ ; search: http://www.adobe.com/misc/search.html
10. http://www2.echo.lu/home.html ; search: http://www2.echo.lu/search.html
11. http://www.adobe.com/ ; index: http://www.adobe.com/misc/siteindex.html
12. http://www2.echo.lu/home.html ; subject index: http://www2.echo.lu/subjhead.html
13. Zie Web Architect (noot 1) July 97, sectie "The User's View of a Site" ; idem September 96, sectie "Second Commandment" ; idem October 97, sectie "So what are side indexes.."
14. De NIWI Web Site: http://www.niwi.knaw.nl
15. De index is bereikbaar vanaf elke pagina (label "verdwaald ?") in de linker kolom. De directe URL is: http://www.niwi.knaw.nl/nl/keyword.htm
16. http://www.adobe.com/misc/sitemap.html
17. http://www2.echo.lu/sitemap.html
18. Als voorbeeld de hoofdterm "boeken" met de subtermen: /cgi-bin/nph-biomed_search.pl#books$biomedical literature#boeken$biomedische vakliteratuur /cgi-bin/nph-socsci_search.pl#books$social sciences#boeken$maatschappijwetenschappen
19. De metatag in een HTML pagina:

<HEAD>
<META NAME="keywords" CONTENT="kosten , prijslijst , servicekosten ">
</HEAD>

20. Er zijn verschillende overzicht sites: bijvoorbeeld: http://odwin.ucsd.edu/glossary/others.html Voor vertalingen is een EC initiatief veelbelovend: http://www2.echo.lu/edic/