Archive for april, 2009

Inuti Lucene

Posted in Osorterad on april 28th, 2009 by Clas – Kommentering avstängd

Lucid imagination har gjort en intervju med svensken Karl W om hans användning och utvidgningar av open source sökmotorn Lucene. Bloggaren hakank nämns också på ett hörn.

Nyhetsjättar på väg att stämma Google?

Posted in Osorterad on april 7th, 2009 by Clas – Kommentering avstängd

Nyhetsjättarna The Associated Press (AP) och The Wall Street Journal är på krigsstigen. I siktet har företagen Google och andra nyhetsaggregatorer. Läs en rewrite hos Metro, eller ”orginalet” på NYTimes eller på News.com.au.

Uppdatering: Google kommenterar:

Users like me are sent from different Google sites to newspaper websites at a rate of more than a billion clicks per month. These clicks go to news publishers large and small, domestic and international — day and night.

And once a reader is on the newspaper’s site, we work hard to help them earn revenue.

och

In the U.S., the doctrine of fair use enshrined in the US Copyright Act allows us to show snippets and links. The fair use doctrine protects transformative uses of content, such as indexing to make it easier to find.

Sesam – stängd?

Posted in Osorterad on april 5th, 2009 by Clas – 2 Comments

I veckan fick jag reda på att Schibsted stänger igen norska Sesam.no. Det norska nyhetssöket, och en del annat från sajten, sägs flytta över till en annan Schibsted-sajt, Finn.no. I Sverige, där Aftonbladet (del av Schibsted-koncernen) är ägare av Sesam.se så verkar det mer oklart vad som händer. I Computer Sweden skrivs det att Sesam.se läggs ned, men att det är oklart vad som händer med det sajtspecifika nyhetssöket som t.ex Aftonbladet, SvD och Resume använder.

Hos Dagens Media säger de att

- Vi har haft svårt att få lönsamhet. Den här sajten bygger också på att vi har en gemensam utveckling med Norge och när de nu lagt ned blir det svårt att bära den själva.

Redan nu kan jag kostatera att en sökning på ordet [och] hos Sesam.se inte returnerar någon ny nyhetsartikel sedan 09:40 igår, den 4 maj (mer än 34 timmar sedan). Men kanske är det bara tillf’älligt – sajten är ju fortfarande uppe. De sajtspecifika versionerna verkar fortfarande fungera bra.

Detta är synd. Vi är visserligen fler i samma bransch, hehe, men Sesam.no har, med sina 100 anställda, varit de som drivit nyhetssök framåt bäst. Sesam var tidiga med ”facets”, möjlighet att begränsa sökningar med bara ett klick för källor och tider; de var tidiga med ”entity extraction”, att identifera namn och platser i nyheter, och de var tidiga med ”federated search”, sökresultat där sökningar från andra sajter, t.ex. Wikipedia, visas och länkas. Sesam.se, som ”ärvt” mycket av sin teknik från Sesam.no, hade ypperliga möjligheter att lägga energi på denna typ av finesser i och med att de inte behövt kämpa med ett av de största problem som andra nyhetssökmotorer har, att spindla nyhetskällor. Sesam.se tar in nyhetsartiklarna från Retriever, som i sin tur får artiklarna levererade direkt från nyhetssajterna. Sesam.no verkar ha kostat mycket pengar – det säger sig självt när det handlar om över 100 anställda under de fem år som de hållit på. Resultatet för de andra typerna av sökning, webb, bild och video har varit svagt, gissar jag. Samtidigt är det svårt att göra pengar på en publik nyhetssökmotor – det hade Sesam.se konstaterat redan februari 2007, när jag pratade med dem.

Kvar bland publika nyhetssökmotorer för svenska nyheter är nu, utöver min Frisim också PS Spy, som är Dagens PS nyhetsbevakningstjänst som har utvecklats av en av de gamla Agent.se-startarna; Eniro nyhetssök som drivs av norska Opoint; och Googles Google News som tyvärr inte verkar var så högt prioriterad bland Googles nationella nyhetssöksidor. Av dessa är det bara Frisim och Google News som levererar sökresultat i form av RSS-bevakningar – Eniro/nyhetssök bara genom webbsidan, och PS Spy genom webbsidan och per epost.

Denna utveckling gör mig mer taggad(?) att få den nya versionen av Frisim, med arbetsnamnetnyhetr lite mer färdig, och kanske fokusera på bara nyheter, och skippa att göra bloggar sökbara. Fokusera på en sak, och göra den så bra jag kan. Twingly och Knuff.se erbjuder bra svensk bloggsök, och jag kan knappast göra bättre än dem. Låter det bra, tycker du?

Nyheter på hemsidan – uppföljning

Posted in Osorterad on april 1st, 2009 by Clas – Kommentering avstängd

I mitt förra inlägg skrev jag om samarbetet mellan Frisim och Expressen. Samarbetet handlar om att visa nyheter från Expressen på din egen webbsida.

Nyhetsrubriker att visa på den egna hemsidan är en ”idé” som jag arbetat med på min sajt Nyhetsrubriker.com sedan 2000, och innan dess i ytterligare ett par år, men under andra namn. Under de 9 år som Nyhetsrubriker.com funnits så är det c:a 5500 personer som registrerat sig för att prova tjänsten. Av dessa så är det c:a 4000 personer som använt tjänsten på sin webbsida. Som mest har det varit c:a 1000 aktiva samtidigt. Idag är det knappt 400 sajter som aktivt visar nyhetslänkar via systemet. Dessa 400 sajter genererar c:a 500 rubrik-klick per dag – de mest listigt formulerade rubrikerna får c:a 30-50 klick. Den största sajten som använder systemet är (fortfarande) CatWeb.

Det ska bli spännande att se hur bra vi lyckas med vårt Expressen-konceptet. Expressen har under ett par veckor länkat direkt från flera av sina temasidor, som t.ex. Expressen/nöje och Expressen/ledare till vår nyhetsrubrik-rute-generator på Frisim.com/expressen.


expressen länk

Även om jag har erfarenhet från mitt Nyhetsrubriker.com-projekt så har jag svårt att bedöma hur många som bör kunna vara intresserade av denna typ av länkar. Lite beror det på hur ”händig” genomsnittsbloggaren är, lite hur attraktiv nyhetsrutan anses, lite beror det på hur intressant det är att länka nyheter från sin egen blogg eller hemsida. Nu visar i alla fall tillräckligt många sajter och bloggar nyhetsrutan för att jag kan se att det verkar fungera helt okej, och det har också gjort att jag fått lite mer inblick i hur bra (faktiskt!) Google App Engine fungerar för denna typ av ”widget”.