Archive for augusti, 2004

DN och Expressen använder open source sökmotorn Lucene!?

Posted in Sökmotorer on augusti 31st, 2004 by Clas – Kommentering avstängd

Detta hänger ihop med mitt förra inlägg – om svenska sajter som använder sökmotorn Lucene. I brist på bättre saker att ägna tiden åt har jag suttit och provsökt nyhetsartiklar på dn.se och expressen.se. Från resultaten av mina tester att döma så drar jag slutsatsen att Polopoly implementerat sökmotorn Lucene hos både Expressen och DN.

Bloggar och nyhetssökningar på Bok & Biblioteksmässan

Posted in Osorterad on augusti 19th, 2004 by Clas – Kommentering avstängd

En av Internetbrus-snubbarna har en presentation på Bok & Biblioteksmässan i Göteborg den 23 september. Synd att man inte är där och lyssnar. Undrar vilka nyhetssöksajter de nämner? Hoppas de lägger ut sin presenation efteråt =)

Sökresultat via RSS och Google Zeitgeist

Posted in Frisim on augusti 19th, 2004 by Clas – Kommentering avstängd

ResourceShelf (via Bloglines) listar vilka sajter som (gratis) distribuerar länkar till innehåll (mest nyheter och blogginlägg) baserat på sökresultat, i RSS-format. Det finns inte så många svenska sajter som gör detta. De enda jag känner till är Nyhetsportalen.se och vi. Vi gör det dock inte gratis och Nyhetsportalen gör bara sökningar i själva rubriken(?).

Jag förvånas av Googles svenska Zeigeist för Juli. I topp band sökningar hos Google.se finns: Aftonbladet! Vem söker efter aftonbladet på Google? På 6:e plats finns dessutom Expressen. Antagligen är statistiken behandlad så att sökningar på flera ord delas upp. Vi får en del trafik där just aftonbladet ingår som en del av sökningen, och den räknas då troligen in.

Sajter som listar nyhetsrubriker

Posted in Sökmotorer on augusti 18th, 2004 by Clas – Kommentering avstängd

Hmm, det börjar bli ganska många sajter som listar rubriker från svenska nyhetssajter: Senaste.info, News.nu, Nyhetsportalen.se, Tabloid.se och Rubriker.com och säkert några till, som jag missat. Hos några kan man söka i rubriktexten, men få erbjuder så mycket mer – Senaste.info indexerar hela artiklar men har ett ganska litet index över artiklar. Några har nyhetsbevakar-program att ladda hem. Undrar hur många som använder dem? Fler nya idéer, tack ;-)

Amazon aggregerar från bloggar?

Posted in Sökmotorer on augusti 8th, 2004 by Clas – Kommentering avstängd

Är detta en start för Amazon.com’s blog aggregator?

Vi visar dina annonser som tack för hjälpen!

Posted in Frisim on augusti 5th, 2004 by Clas – Kommentering avstängd

Jag har tänkt att prova att använda Google AdSense som ”betalningsmedel” för länkning till vår nyhetssida på vår frisim.se-sajt. (Syftet är naturligtvis, som alltid, att få fler besökare, men också att prova en kul idé.) Tanken är att du länkar till vår Nyhetssida som visa annonser från Google AdSense. När du länkar skickar du med din AdSense-kod (den är publik!) och annonserna som visas är från ditt AdSense-konto.

Google tycker att detta är ett schyst sätt att använda deras annonser, och på min specifika fråga om detta svarar de ”In regards to your question about placing other people’s AdSense ads on your site, AdSense publishers are allowed to place ads on any site where they have the permission of the site owner, as long as the site complies with AdSense policies.”

Jag har satt upp en hjälpsida där jag försöker förklara du det fungerar.

(En liknande teknik som denna används redan på vissa forum för något de oftast kallar ”revenue sharing”. Här gäller det dock länkning till en specifik webbsida, och du får hela intäkten!)

Google News nyhetskällor

Posted in Sökmotorer on augusti 5th, 2004 by Clas – Kommentering avstängd

Via ResearchBuzz! så hittar jag till Digital Deliverance som har kommenterat Google News urval av nyhetskällor på Googles nyhetssida. Där kommenteras två saker. Den första kommentaren handlar om att även om Google News säger sig samla in nyheter från över 4500 sajter så är det 10 källor som står för majoriteten av länkarna och 100 källor står för c:a 98% av länkarna. Slutsatsen måste bli att det inte hjälper att ha många källor när man skall presentera en Google News-liknande sajt. (Kanske kan det dock vara enklare att göra ett bra urval av toppnyheter om man har många källor, men det är en annan historia.) Den andra kommentaren handlar om vilka källor som Google News länkar till med rubriken. Man förväntar sig att den största länken (den länkade rubriken) kommer flest personer att klicka sig vidare med, så det vore bra om det i någon mening var en länk till den bästa källan, den källa som bör ha mest inblick i ämnet artikeln handlar om. Med det som utgångspunkt ifrågasätter Digital Deliverance att ”Is Xinhua really the most relevant news source for three of the top five news stories from the U.S.? Or five of the top eight stories worldwide?” [Xinhua är en nyhetsbyrå ägd av den Kinesiska staten.] och ”Is Al-Jazeera the most authoritative source of that EU story?” [red: about a European Union decision about Israel]. Hmm, troligen inte! Google borde kunna lösa detta bättre!

Google cache-tid

Posted in Sökmotorer on augusti 3rd, 2004 by Clas – Kommentering avstängd

Google har adderat möjligheten att se när de senast sparade, och indexerade(?), en webbsida. Tyvärr fungerar det bara med Google.com, och inte på den svenska .se-versionen. Exempel för cache av denna sida.

Topix.net förnyar sig

Posted in Sökmotorer on augusti 3rd, 2004 by Clas – Kommentering avstängd

Topix.net har uppdaterat design och funktion på sin nyhetssajt. Rent designmässigt har det blivit lite ”renare”, men det är fortfarande väldigt mycket på förstasidan. Clickz, Battellemedia och ResourceShelf noterar att de har adderat en ”Live Feed” med de senast insamlade nyheterna, samt att de adderat möjligheten att få ”nya nyheter” från en viss kategori skickade per epost, en gång per dag eller vecka. I Topix blog kan man också läsa om den ”NewsRank” som de försöker marknadsföra på samma sätt som Google använder sin PageRank. I bloggen finns också några antydningar om hur de rangordnar de insamlade nyheterna, och ger exempel på hur svårt det är att härleda en nyhet till en plats – att kategorisera baserat på bara källa eller ett nyckelord fungerar ofta dåligt. Topix verkar ha löst problemen delvis genom att ha vad de kallar en ”Knowledge Base” till hands vid kategoriseringen. Antagligen skulle denna ”kunskapsbas” kunna jämföras med en term-vektor som innehåller platser och företeelser som kan förknippas med en specifik kategori, eller specifikt geografiskt område.

Topix har viss personalisering i och med den ”flyout navigation” till vänster på sidan, som håller reda på vilka kategorier du har besökt tidigare, och länkar direkt till dem.

Dock är det som svensk lite svårt att se hur bra Topix fungerar, och som svensk ser jag mycket begränsad nytta med Topix ”local news”. Topix Sökmotor-kategori är den enda som jag har funnit spännande nog att ha lite koll på.