Nyhetsrangordning

Jag har funderat lite på hur man kan rangordna och visa nyheter utan att kräva att användaren ger sökord och göra en sökning bland nyhetsartiklar. Sedan tidigare har jag använt klickstatistik insamlad från några hundratal sajter som visa nyhetslänkar. De mest klickade nyhetslänkarna visas upp under ”andra läser om” på Frisim. Med denna typ av rangordning så verkar det bli så att artiklar med ”fantastiska off-beat”-rubriker hamnar högt upp. Dessutom är det ofta så att nyheten i sig är inte nödvändigtivs är lika ”spännande” som själva rubriken. Ett tredje sätt är att använda Word burst, vilket också används på Frisims startsida.

Ett annat sätt att ranordna nyheter, om som används på bland annat Knuff, Aftonbladets Bloggportalen, och indirekt också på Twingly är att titta på vilka nyhetsartiklar som det länkas till från bloggar. För att kunna göra denna typ av blogglänksanalys krävs att man samlar in data från ett antal bloggar. Hur många bloggar som behövs beror förstås på vilka bloggsajter man väljer. Idealt vill man naturligtvis analysera ”alla” bloggar, men antalet är idag rätt stort, och det finns dessutom massvis med ”ointressant” där ute. Dessa ”ointressanta” bloggar länkar oftast inte till nyhetsartiklar. För att prova hur detta skulle kunna fungera så valda jag ut c:a 150 bloggar som jag tittat på ett par dagar. Bloggarna valdes ut från diverse ”topplistor”. Totalt har c:a 3500 blogginlägg analyserats. Tittar jag på vilka nyhetsartikar som det länkats till från dessa blogginlägg ser det, vid en snabb överblick, ut som ungefär samma nyhetsartiklar som visas på Knuff/nyheter även om antalet blogginlägg som analyserats av mig bara är en bråkdel av de som Knuff samlar in data från. Resultat verkar naturligt då Knuffs egen analys säger att:

33 kända bloggar står själva för över en tredjedel av det totala antalet blogglänkar till DN, SvD, Dagen och IDG under den senaste månaden.

Knuffs statistik togs fram i samband med bloggosfärens diskussion (blandannat här) om hur tillbakalänkningsfunktionen Twingly verkar ha påverkat vad svenska bloggar skriver om och länkar till.

Från min något bristfälliga mängd bloggdata kan jag bekräfta att det verkar som om de flesta nyhetsartikellänkarna görs från ett relativt litet antal bloggar, men också att länkas till ett väldigt litet antal tidningar. Naturligtvis är det så att de tidningar som ger länkar tillbaka till bloggen i samband med nyhetsartikeln (via Twingly) kommer att göra att fler länkar till just denna källa, men det är DN och SvD är det som det länkas överlägset mest till från de bloggar jag tittat på. Gissningvis beror detta på att dessa två sajter var tidigt ute med att använda Twingly, men också att man gissningsvis får flest besökare tillbaka till bloggen från dessa nyhetssajter. Twingly används t.ex. även av Ekonominyheterna, Dagen, och IDG. Min statistik säger att från de c:a 3500 blogginläggen som samlats in så har drygt 1000 länkningar gjorts till nyhetssajterna SvD, DN, IDG, Ekonominyheterna, Dagen, Metro, Expressen, Aftonbladet, Sydsvenskan, GP, E24, BLT, NA, UNT och Corren. De fördelas sig som: 397 till SvD, 382 till DN, 64 till IDG, 49 till Expressen, 44 till Aftonbladet, 33 till Dagen, 13 till Ekonominyheterna, 11 till E24, 9 till Metro, 8 till Sydsvenskan och 7 till GP. Nyhetssajterna BLT, Kkuriren, Ekuriren, NA, UNT och Corren har tillsammans bara 3 länkar till sig. Till Svt och SR finns också ett inte försumbart antal länkar, men där krävs det lite mer jobb för att se vilka som är till en ”riktig” nyhetssartikel.

Ett tredje sätt att rangordna nyhetsartiklar är genom att använda Word bursts. Det är den teknik som används för att välja till nyheterna som visas längst upp på frisim (de med bilder på). Denna metod permierar delvis ”duplicerade” nyheter som kablats ut från TT om det är så att man inte kompenserar för det på något vis.

Försöker jag se om det finns likheter mellan de två första sätten att rangordna nyheter på så ser jag att så inte verkar vara fallet, i alla fall inte för den tidsperiod och de data som jag tittat på. Blogglänkningsrangordningen lyfter fram mer ”komplexa” nyheter, ofta nyheter med politisk koppling, med rubriker som t.ex.: ”Spänd väntan på ny gryning i Burma”, ”Perssons dubbla inkomster ” och ”Beslöjade flickor möts med kritik”. Klickstatistiken lyfter fram artiklar med rubriker som ”Blixten slog ner i Antes snopp”, ”Sexhånas i finsk tv” och ”Din gps – en dödsfälla”. Även källorna skiljer sig åt en del; Aftonbladet och Expressen verkar skriva väldigt ”klickvänliga” rubriker.

Slutsatsen blir att vill jag ha en rangordning där ”seriösa” nyheter lyfts fram så verkar blogglänksmetoden fungera bra, men vill jag ha ”off-beat-nyheter” så verkar de hittas fint genom klickstatistiken.

Comments are closed.