Vi gjort mange justeringer i det leksikalske søket for treffe bedre i slike tilfeller
- Implementere stoppord (ord som ikke tas med i oppslaget)
- Justere levenshtein distance (hvor mange skrivefeil skal det tas høyde for)
- Resultatheving på spesifikke sider/dokumenter og kategorier
- Legge inn synonymordbok (f.eks at terrasse og platting gir like resultat)
Dette kan løse mange utfordringer, men når mengden innhold er så stor som i DiBKs tilfelle, er det grenser for hvor langt man kommer med slike justeringer.
Semantisk søk: Når tegn blir til setninger med betydning
Et semantisk søk baserer seg på vektorisering av tekst. Ved hjelp av AI analyserer vi innholdet som finnes på nettsiden, og hva brukeren har skrevet i søkefeltet. Da kan vi bedre forstå hvilket innhold som passer best til søket. Teknologien bygger tungt tekstanalyse med store språkmodeller, og vektorisering av dokumenter.
Når man da f.eks søker etter “Hvordan bygge en trapp”, skjønner det semantiske søket at det er ikke all bygging det handler om her, men spesifikt om trapp. Den skjønner også at det er “Trapp” som er hovedtematikken, og henter frem dokumenter som omhandler trapp og utforming, regler og forskrifter om denne. I DiBKs tilfelle skal Forskrifter om trapp komme øverst, og deretter for eksempel forskrifter om rekkverk, da disse har med trapp å gjøre: