Frisim: Aktuella namn

Frisim har fått en nya ruta på sin framsida med aktuella namn från de insamlade nyhetsartiklarna. Denna typ av lista finns på andra sajter som till exempel Google News. Hur intressant listan är för besökaren får väl framtiden utvisa.


frisimaktuellt

Tanken med att ta fram och lagra denna typ av information är att namn är ett effektivt underlag för att klumpa ihop nyhetsartiklar med varandra. Om det är så att samma namn nämns i ett antal artiklar under de senaste timmarna så är det relativt troligt att artiklarna har mer gemensamt, och kan tolkas som att de hör ihop. Förhoppning är att en vidareutveckling av dessa namnlistor kan förbättra vårt system för att para ihop nyhetsartiklar med varandra.

Uppdatering: Nu finns där också en Wikipedia-länk till varje namn i form av ett litet frågetecken.

Uppdatering: Efter en massa tweakande så hoppas jag att jag nu har kod som funkar okej. Ännu finns inte så mycket data insamlat i systemet för att de ska se bra ut, men ordnar sig förhoppningsvis inom kort. Det svenska språket är verkligen inte kul att försöka behandla automatiskt; genetiv ”s” är relativt svåra separera från namn.

Comments are closed.