Clas dödar kattungar

Då utvecklingen av Frisim2 fortgår och faktiskt börjar närma sig en ”körbar” version så har jag ägnat några minuter åt att titta på ett urval av de svenska tjänster som finns och som kommer att ha vissa beröringspunkter med min. Jag är mycket medveten om att varje gång jag ger kritik på en ”konkurrent” så dödar gud en kattunge, men jag kan ändå inte hålla mig, trots att jag tycker synd om kattungarna. *snyft*

1. Knuff.se presenteras ibland som ”svenska bloggosfärens medelpunkt”. Knuff.se fungerar otroligt bra, och är väldigt imponerande. Knuff har i och med att den funnits ett par år, och på grund av systersajterna bloggkartan.se, nyligen.se och bloggar.se, så finns möjlighet till att hålla koll på en mycket stor mängd data. Knuff har också lyckats otroligt bra med att plocka upp ”finesser” som att lista saker som det länkas till i blogginläggen och möjlighet att söka på en blogg för att se vilka inlägg som länkar den bloggen. Tack vare etiketterna som sätts på systersajten bloggar.se så kan möjligheten till kategorisering göras med relativt stor precision. Knuff.se innehåller förvånansvärt lite spam, gissningsvis på grund av att någon del i processen av överflyttningen från nyligen.se till knuff.se är manuell. Jag tycker att Knuff.se har en rimlig avvägning mellan mängden persenterad information och mängden Google Adsense-reklam. Jag tycker att Knuffs största styrka är de ”temasidor” där vilka nyheter, videos, böcker etc., som är ”populärast” att länka till bland blogginläggen. Antalet bloggar som är med är gissningsvis någonstans mellan 10.000 och 50.000 stycken. Alla bloggar som omfattas ”är svenska”, även om vissa är skrivna på engelska. Jag gissar att Knuff.se är baserad på MySQL och eventuellt på något FULLTEXT-lager så som Sphinx för att snabba upp vissa delar. Lite information om/runt Knuff finns i Johan Larssons blogg.


shot

2. Bloggz är en relativt ny sajt. Bloggz innehåller svenska bloggar, även om en del är på engelska (bloggen ligger då oftast på en svensk bloggtjänst). Sökningen sägs omfatta 90.000 bloggar. Bloggz har en egen ping-tjänst men hämtar också ”pingar” från annat håll (gissningsvis bl.a. från en RSS-feed med Googles Blogsearch-material). Sökresultatsidan ser konstigt ut för vissa sökresultat, vilket verkar ha att göra med funktionen för ”highlighting” av sökordet i sökresultatet inte fungerar perfekt. Jag tycker att Bloggz visar för mycket reklam på sökresultatsidorna i relation till innehåll och innehållskvalitet. Bloggz baseras på MySQL och FULLTEXT-indexet Sphinx. Lite information om/runt Bloggz finns i Jonas utvblogg.


shot

3. Tailsweep är helt ny för mig. Tailsweep har en egen ping-tjänst, men verker också plocka in data från annat håll. Sökresultaten innehåller båda svenska och utländska RSS-feeds, blandat. På startsidan står att över 125.000 bloggar är sökbara, men det är oklart om det inkluderar de nyhetssajt-feeds som är relativt vanligt förkommande bland sökresultaten. Jag hittar väldigt lite skärp (utöver nyhetssajterna?) i bloggindexet, vilket är positivt. Tailsweep har inte ”highlighting” av sökord i listan med sökresultat. Det går att söka på väldig korta ord och på årtal, men av någon mystisk anledning ger sökorden ”tailsweep” eller ”kanske” inte några resultat alls!? Normalt går sökningarna mycket snabbt, medan andra upplever jag som något långsamma. Tailsweeps sökresultatsidor visar så pass mycket Google Adsense reklam att jag lätt skulle kunna missta dem för MFA-sidor. Tailsweep är, om jag förtått det rätt, utöver sökmotorn, ett annonsnätverk. Tailsweep använder indexet Lucene. Jag har inte hittat någon utvecklingsrelaterad blogg hos Tailsweep, men en av personerna bakom driver bloggen Fosfor gadgets.


shot

4. Twingly. Twingly fokuserar på att koppla ihop nyheter med bloggar genom att erbjuda nyhetssajterna att visa vilka bloggar som länkar en specifik nyhetsartikel direkt på nyhetssajten, men erbjuder även en bloggsök-ruta på sin egen sajt. Tekniken basers på att bloggarna pingar in sina inlägg till Twinglys ping-tjänst. Twingly säger sig söka bland 83.000 svenska bloggar. Sökningarna i indexet upplever jag gå med varierande hastighet, ibland mycket snabbt, ibland betydligt långsammare. Ingen ”highlighting” görs av sökordet i sökresultaten. Utöver en länk till blogginläggen visas en länk till bloggens huvudsida och en länk till dess RSS-feed. Twingly verkar vara baserad på någon .NET/MSSQL-lösning från Microsoft. Twingly bloggar om tjänsten och företaget på Primelabs.se.


shot

5. Aftonbladets Bloggsök är en ingång till Bloggportalen. Bloggsök omfattar de bloggar som finns registrerade på Bloggportalen. Bloggportalen har i princip samma ”finesser” som Knuff.se, även om sökbarheten inte är lika stor (t.ex. på vilka bloggar som länkar en annan blogg och dylikt). Även Aftonbladets Bloggsök använder Lucene. Jag har inte hittat någon ren ”utvecklingblogg”, men på Omvärldsbloggen presenteras Aftonbladets bloggsatsningar.


shot

6. Google blogsearch. Bloggsearch har en imponerande bredd på sökresultaten, men inte så många ”finesser”. Google har en egen ping-tjänst, men hittar säkert en stor del av länkarna till de indexerade bloggarna i deras normala webbindex. I Googles blogsearch är det tydligt hur jag kan begränsa till sökresultat från en viss tidsperiod.


shot

Bilderna visar hur sajten ser ut efter en sökning på den egna sajtens namn. Jag har försökt ordna listan ovan i ”resursordning”. Knuff är ett enpersonsprojekt, Bloggsök och Googles Blogsearch är gissningsvis utvecklat av och drivs av betydligt fler. Skulle jag försöka rangordna sajterna i ”brahetsordning” så känns det svårare, men uppenbart är i alla fall att jag besöker Knuff.se oftast! För mig länns det som om Knuff prioriterar kvalitet före kvantitet. I vissa specifika lägen kan jag tycka att kvantitet (många indexerade bloggar) har prioritet, men oftast har det inte det.

Alla de listade sajterna indexerar bloggar. Några av dem inkluderar också nyhetssajters RSS-data i sina index, men det verkar inte vara ”medvetet”. Knuff separerar nyheter och bloggar, men gör inte nyheterna sökbara.

Utöver dessa känner jag bland annat till sajterna feeder.se, blogseek.se, Eniro/bloggsök, vilka jag upplever som ”lite mindre intressanta”. Finns det några fler som jag bör finna intressanta?

  1. Marcus Herou skriver:

    Kul att du hittade vår sajt. Jag är utvecklaren bakom Tailsweep Search. Håller med om att det är mycket AdSense, provade mest att leka med de olika formaten och nu har jag rensat en del. Att sajten är seg emellanåt är för att vi uppdaterar indexet som satan och då blir det ej optimalt att söka samtidigt. Jag har handcrawlat de sajter som finns med i indexet för att hålla hög kvalitet.

    hej svejs!

  2. Hjalmar skriver:

    Trevligt inlägg Clas, jag har som du säkert förstår också sneglat lite åt det här hållet. Det ligger ju nära till hands. Kul att du tar tag i det, jag känner personligen att det är lite för ointressant att indexera bloggar på grund av den höga oljud till informations-faktorn.

    Tror nog att kattungarna klarar sig ändå, dina klagomål är ju sakliga. Snarare så borde dem som har fått sina siter här tacka dig för din feedback. Kör hårt, jag tror nog du kan göra nånting som är bättre än det mesta i sverige idag. Du borde försöka konkurrera med twingly på deras svaga punkter. Vi kanske kan göra någon form av samarbete där om du kan få ihop en vettig tjänst (tex att man får länkar från både frisim och nyhetsportalen om man trackbackar nån av oss). Jag tror inte att twingly skulle kunna slå tillbaka särskilt bra mot en ny konkurrent, de verkar ha en extremt sölig utvecklingscykel.

  3. Clas skriver:

    Jonas: Bättre, men.. a) Kan man söka med citat-tecken? Det verkar fungera men de tas bort när sökfrasen ”upprepas” i sökrutan på sökresultatsidan. b) Söker jag på t.ex ”Mikael Nilsson på högerbacken” (med citat-tecken) så visas väldigt mycket text i den första träffen (från ”Anteckningar från…”, och speciellt verkar texten, när den visas upp på din sida, omkastad i förhållande till vad bloggaren skrivit. Gör du så med flit? c) Jag tycker att du listar för stor del av blogginläggen när du visar upp dina sökresultat. Långa ”citat” tillsammans med wildcard-subdomän och ingen robots.txt är inte snällt mot bloggarna!

    Hjalmar/Grazzy: Jag ”trafikdelar” gärna lite med dig. Jag är inte säker på vilken form som vore roligast, men har du något förslag på provar jag gärna något!

  4. Marcus Herou skriver:

    Tja boys. Ni fångade Tailsweep förra gången då den var riktigt i BETA stadiet. Nu är den lite bättre. Allt adsenselarv är borta, bättre relevans, site:mysite.se sök, multi-ping, bättre summeringar mm.

    Vad tycks? Jag vill gärna få input så jag kan göra den bättre.

    Mvh

    //Marcus Herou

  1. [...] Det finns olika sätt att presentera sökresultat på – men nästan alla text-sökmotorer presenterar dem på samma sätt! I mitt tidigare inlägg om kattungar så listade jag ett antal bloggsökmotorer. Ingen av dem är så nydanande när det gäller att presentera sökresultaten. Gissningsvis beror det på att alla är så vana vid hur Google presenterar sin sökreultat, så om det inte ser ut som hos Google så är det ingen som känner igen det som just sökresultat. [...]

  2. [...] detalj lite senare, och jämföra med t.ex. PSSpy. Men det blir för internt bruk så att jag inte dödar några fler [...]