Lucene/Solr ersätter Sesam

Hos Aftonbladet.se så har artikelsöket från Sesam.se idag ersatts med ett hembygge baserat på Lucene-baserade Solr. Även SvD har idag fått ett ”hembyggt” Lucene eller Solr-baserat artikelsök istället för Sesam. De två ser relativt lika ut, och båda använder fasetter för att begränsa sökningar till avdelningar på sajten. Aftonbladet har en lite skumma ”underfasetter” på Nyheter där man kan avgränsa sökningen till bland annat ”ämnena” Carolin eller ”Veta mer”. På SvD finns skribent-, artikeltyps, ämne(?) och tidsfasetter. Båda använder hightlight:ing för att försöka visa i vilket sammanhang som sökordet används. Facets och Hightlighting är ”hyllvara” för Solr.

Både Aftonbladet och SvD lanserar sina nya sök på Twitter. Båda sajterna verkar ha c:a 400.000 artiklar i sina index.

En snabbkoll på hur välindexat data är kan man få med ”fulsökningar”. SvD får bara knappt godkänt då t.ex. sökningen ”pepparrot på tub” inte ger någon träff när ”papparrot p å ger en träff”. Aftonbladet är lite svårare att bedöma då en sökning på t.ex. auml (som brukar dyka upp som en del i HTML-kodade ä:n) inte resulterar i någon ”highlight:ing” alls.

  1. Ola Henriksson skriver:

    Ditt fulsökningsexempel har jag nu justerat. Tyvärr ser jag att vi har ganska mycket skräptecken i vårt arkiv. Så det går ju att hitta andra. Men vad jag kan se är det mest riktigt gamla grejer från importer av gamla system.

  2. Clas skriver:

    Ola. Okej, inget illa menat. Frisim.com har massvis av dessa problem, det är därför jag känner till problemet så väl. Den mer ”nystartade” Nyhetr.se är något bättre hoppas jag.

  1. [...] Lucene/Solr ersätter Sesam [...]