Aftonbladet har idag lanserat sin bloggsökmotor Bloggsok. Enligt NyTeknik så ska mer än 4000 bloggar indexeras, och mer än 10000 blogginlägg per dag.

Bloggsok bygger, precis som sökningen på DN.se och Expressen.se, på den Java-baserade sökmotorn Lucene. Eftersom jag har viss erfarenhet av Lucene så kan jag avslöja några fler avancerade sökfunktioner än de som finns beskrivna på Om Bloggsok-sidan. T.ex kan du söka på ord i titeln med sökningen: title:google. Du kan också söka på inlägg där t.ex. orden sökmotor och google förekommer med maximalt 2 ord mellan sig, genom att söka på “google sökmotor”~2. Notera att Bloggsok sorterar bort korta så kallade stoppord som och, på, av, men och så vidare. Bloggsok klarar också, på vanligt Lucene-maner, av parenteser så det går t.ex att göra en sökning på inlägg som har ordet google i sig och åtminstone ett av orden blog eller index genom att söka på google AND (blog OR index).

Gissningvis drivs Bloggsok en server dedikerad för sökningar och en dedikerad till att indexera blogginläggen. Ingen av dessa behlöver ha så snabb processor, men om de lagrar indexet i RAM, vilket verkar troligt när jag ser hur snabb den är just nu, så krävs rätt mycket minne när databasen blir större. Det framgår dock inte om de tänkt lagra inläggen sökbart i all framtid, eller om de kommer att kasta bort inlägg från indexet när de blivit “gamla”.

Än så länge ser den lovande ut tycker jag, även om jag hellre sett ett Google-liknande, minimalistiskt, utseende på resultatsidorna (SERPen).

Bloggen Webbsnack kommenterar innehållet i Bloggsok. Där jämförs med Technorati och Google Blog Search. Technorati och Aftonbladets Bloggsok bygger på samma tekniska plattform, Lucene.