Söndagshack: Menade du Google News?

När jag gör webbsökningar så stavar jag ofta rätt kass. Det händer till och med att jag använder sökmotorn för att se hur ett ord stavas – jag skriver in det ord jag är osäker på i Googles sökruta och ser om Google svarar med ett ”Menade du?”-förslag. På så sätt får jag en hint om jag stavat rätt eller inte.

Söndageftermiddagen har ägnats åt att implementera en liknande funktion i vår nyhetssökmotor. För sökningar som inte resulterar i någon länk till en artikel, och där vi tycker oss kunna hitta ett rimligt stavningsalternativ, ger Frisim nu en länk med ”Menade du [nytt sökord]?”

Söker du t.ex. på [goigle news] i hopp om att hitta artiklar om Google News så ser svaret ut som:

Tekniken jag använder bygger på en ordlista skapad av de ord som finns i våra insamlade artiklar. Om sökningen du gjort inte matchar mot någon artikel så analyseras orden i söksträngen och vi försöker hitta likande ord som finns i ordlistan. Detta är en vanlig teknik för att skapa sig en ordlista som innehåller den typ av ord finns sökbara i indexet. Med denna teknik så får vi en ordlista som innebåller ”nya” ord och teknik-ord. Tyvärr innebär det också att det inte är omöjligt att få ett förslag på ett felstavat ord, eftersom det troligen finns med några sådana i de nyhetsartiklar vi sparat.

Just nu väger vi inte in hur ofta ett ord har använts i artiklarna, utan tar det som verkar stavas mest likt sökordet. Förhoppningsvis kommer detta att kunna utvecklas vidare. Nuvarande ordlista innehåller lite för många stavfel för att det ska fungera helt perfekt. Än så länge går det i all fall att leka lite t.ex. genom att söka på ”ord” som alldrig och alvarligt.

Stavningsfunktionen finns bara under .se-verisonen av Frisim, dvs på frisim.se. Detta ”hack” är ett försök att förbättra vår söktjänst samtidigt som vi kan kräma ut lite mer ur vår nya server.

Comments are closed.