Zoeken en vinden (o.a. met Solr)

Kennis
SWIS
3 juni 2022

Bij ‘zoeken’ denk je waarschijnlijk direct aan Google Search: de koning onder de zoekmachines. Maar als je bezoekers binnen je eigen website wilt laten zoeken, heb je een andere tool nodig. Solr bijvoorbeeld, een open source tool waarmee je een zoekfunctie op maat maakt. Zo vinden mensen makkelijk de juiste informatie, zien ze alleen relevante resultaten en krijgen ze handige suggesties bij spelfouten. Klinkt allemaal prachtig, maar hoe zorg je dat het ook echt werkt? En wat heb je eigenlijk aan een zoekfunctie? SWIS legt uit.

Met een goedwerkende zoekfunctie blijven bezoekers langer op je website en vergroot je de kans dat ze vinden wat ze nodig hebben

SOLR

Naast dat je jouw bezoekers langer op je website vasthoudt, verzamel je ook er waardevolle gegevens mee over waar mensen naar op zoek zijn en hoe ze je website gebruiken. Misschien wordt er vaak op een bepaald onderwerp gezocht, terwijl je daar geen content over hebt. Hier kun je vervolgens op inspelen. Maar zorgen dat bezoekers de juiste informatie vinden, kan behoorlijk lastig zijn. Zodra ze irrelevante resultaten krijgen of lang moeten wachten, verliest de zoekfunctie zijn meerwaarde.


Zoekfunctie of navigatie?

Niet elke website is gebaat bij een zoekmachine. Op de SWIS-website staat bijvoorbeeld te weinig informatie om een functionerende zoekfunctie voor te bouwen. In dit soort gevallen kunnen bezoekers prima vinden wat ze zoeken door de navigatie op je website te gebruiken. Met een kleine dataset volstaat de informatiestructuur van je website dus, zolang je deze goed hebt ingericht. Maar als je een website met bijna 300.000 artikelen hebt, zoals het Nederlands Tijdschrift voor Geneeskunde (NTvG), kun je niet zonder uitgebreide zoekfunctie.

Wij ontwikkelden voor het HMC Haaglanden een interne zoekmachine. Een zoekmachine waarvan wij vinden: zo hoort zoeken te zijn.

Probeer de zoekmachine zelf uit op de website van het HMC Haaglanden.

HMC

Relevantie is key

Solr is een applicatie die een gespecialiseerde database gebruikt waarin informatie zo wordt opgeslagen dat je er razendsnel in kunt zoeken. Net als bij elke ander zoekmachine, is de kerntaak van Solr relevante resultaten weergeven. Zoek je op een nieuwssite bijvoorbeeld naar ‘Tweede Kamer’, dan ben je waarschijnlijk niet geïnteresseerd in alle artikelen waar de woorden ‘tweede’ en ‘kamer’ in voorkomen. Je wilt dat de zoekmachine begrijpt waar je naar zoekt, namelijk het laatste nieuws uit politiek Den Haag. Het is daarom belangrijk dat je je database goed inricht. Hoe je dat doet, is afhankelijk van het publiek en de informatie op je website.

Minder code, meer resultaat

Solr is zeer geschikt voor integratie met andere applicaties, zoals een CMS. En omdat je de zoekfunctionaliteiten niet zelf hoeft te ontwikkelen, krijg je sneller resultaat met minder regels code. Zo heeft Solr een algoritme voor autocorrectie: voer je een zoekopdracht in met een woord dat niet klopt, dan krijg je automatische suggesties voor vergelijkbare zoektermen. Daarnaast is de tool in staat om woorden naar de stam te herleiden via woord stemming. Zoek je op ‘reizen’, dan krijg je dus ook resultaten voor termen als ‘reis’, ‘gereisd’ en ‘reisden’. Verder kun je filteren binnen resultaten. Wil je bijvoorbeeld alleen artikelen vinden van na een bepaalde datum, of door die ene auteur? Geen punt, dit kun je allemaal instellen.

Maximale controle

Een cruciale eigenschap van een goede zoekmachine is dat deze niet alleen telt hoe vaak een woord voorkomt, maar ook op andere details let. Bijvoorbeeld hoe lang een artikel is, waar de zoekterm precies in de tekst voorkomt en wanneer een stuk is gepubliceerd. Een nieuwsbericht uit 2005 is bijvoorbeeld minder relevant dan een van gisteren. Door de uitgebreide instelmogelijkheden en grote gebruiksvriendelijkheid biedt Solr maximale controle over welke resultaten wanneer worden weergegeven. Het mooie is dat al deze functionaliteiten geen negatief effect hebben op de zoeksnelheid: binnen een paar seconden doorzoekt het programma een half miljoen resultaten. Hierdoor is Solr ook geschikt voor grotere datasets

Nationale ombudsman

Een andere reden dat SWIS graag met Solr werkt, is dat het programma makkelijk met
Drupal-websites is te integreren. De Drupal-integratie bestaat al lang en wordt actief onderhouden en doorontwikkeld. En doordat zowel Drupal als Solr open source zijn, biedt de combinatie ultieme vrijheid om een oplossing op maat te maken. Deze vrijheid komt duidelijk naar voren in de website en zoekmachine die SWIS voor de Nationale ombudsman bouwde. Hier gingen we uit van twee typen bezoekers: burgers en professionals. Waar onderzoekers en journalisten op zoek zijn naar rapporten en communicatie met de overheid, zijn burgers juist geïnteresseerd in blogs en nieuwsberichten. Met Solr ontwikkelde SWIS een zoekfunctie die optimaal werkt voor beide doelgroepen.