Archive for oktober, 2005

Sydsvenskan om bloggosfären

Posted in Osorterad on oktober 30th, 2005 by Clas – Kommentering avstängd

Sydsvenskan har precis lagt upp en artikelserie om svenska bloggar på sin sajt. Artikelserien har tre delar som handlar som bloggar och och varför de blir fler och fler. Delarna behandlar Att påverka, Att bli känd och Att tjäna pengar. Den sista artikeln i serien, Att tjäna pengar, handlar mest om Johan L:s senaste bloggtjänst Knuff.se.

Schibsteds Sesam

Posted in Sökmotorer on oktober 29th, 2005 by Clas – Kommentering avstängd

Det verkar som om Schibsteds sökmotor Sesam har rätt stor aktivitet när det gäller att samla in (mina) webbsidor. Den kommande(?) sökmotorn Sesam är (naturligtvis) baserat på sökmotorn Fasts teknik och identifierar sig som ”FAST Enterprise Crawler 6 used by Schibsted Sok”. Henrik T skrev om pressreleasen då den kom i juli, men vi väntar fortfarande på den norska versionen och på att se om det blir en svensk version. Antagligen börjar den med den norska marknaden, men gissningsvis provar de väl även i Sverige(?) via någon av tidningarna. Sesam.se verkar dock redan upptagen och Schibstedsok.se är inte registrerad alls (men schibstedsok.no är).

Blocket och Craigslist // ekuriren vs Frisim

Posted in Sökmotorer on oktober 23rd, 2005 by Clas – Kommentering avstängd

Jag har tidigare skrivit lite om konflikten mellan annonssajterna Blocket och Allaannonser, där sajten Allaannonser.se scannar och publicerar länkar till Blockets annonser på sin egen sajt. Blocket har försökt stoppa detta med tekniska medel, samt vänt sig till tingsrätten för att få stöd i sin åsikt att Allaannonser gör fel i och med denna scanning. Nu har ett liknande fall dykt upp i USA. Det är eftertextannonssajten (främst privatannonser) Craigslist som har bett annonssökmotorn Oodle att sluta visa Craigslists annonser bland Oodles sökresultat. Även om Craigslist är okänd i Sverige så är de stora i USA. Craigslist ha runt 850 miljoner sidvisningar per månad (vilket är mer än tre gånger fler än hela Aftonbladet.se har).

Bland annat har SearchBlog kommenterat denna konflikt. Senare har även SEW skrivit om det, och ClickZ har undersökt det hela. Först och främst finns den stora skillnaden i fallet Craigslist vs Oodle jämfört med Blocket vs Allaannonser att Oodle har slutat visa Craigslists annonser – medans Allaannonser har inte slutat visa Blockets.

I ClickZs artikel undersöker de varför Craigslist inte vill ha sina annonser på Oodle. Uppenbart är att Oodle skickar trafik till Craigslist, något Craigslist borde vara tacksam för, eller? Oodle visar även t.ex annonserna från eBay och där betalar eBay pengar till Oodle för detta. Craigslist framför tre arguemnt för att de inte vill att Oodle ska visa deras annosner. Den första är att personer som ”sätter in” sin annons hos Craigslist, i somliga fall, inte vill att deras annons ska visas på andra sajter, och i andra sammanhang. Några av Craigslists kunder har alltså uppmärksammat Craigslist på att de inte vill att deras annonstext sprids vidare från Craigslist. Det andra argumentet handlar som att Oodle har använt namnet Craigslist när de har marknadsfört sin tjänst i annonser och pressreleaser. Det tredje har att göra med att Oodles sökspindel tar upp del av Craigslists datorresurser.

Jag tror att relationen mellan rättigheter och sökmotorer för eftertextannonser har vissa likheter med rättigheter för nyhetsartiklar och nyhetssökmotorer. Vår nyhetssökmotor Frisim har inte allt för stora problem med nyhetssajter som inte vill vara med i vårt index. De flesta nyhetssajtägare som noterat att de finns med i vårt inte har inget emot det. Dock verkar det nu som ekuriren, eller Eskilstunakuriren, inte vill vara med. Ingen på ekuriren har kontaktat mig, men faktum är att deras sajt inte går att läsa från det IP-nummer som vår sökmotor använder. Vi har naturligtvis slutat att ens försöka hämta deras nyhetsrubriker. Vi verkar dock inte vara ensamma om dessa problem; jag har noterat att även andra svenska nyhetsaggregeringssajter också verkar ha problem med att läsa just ekurirens nyheter efter augusti/september. Jag har dock försökt få tag i någon ansvarig på ekuriren, men de verkar inte vilja svara på epost från mig. :-(

Boken The Search

Posted in Sökmotorer on oktober 23rd, 2005 by Clas – 2 Comments

Under den senaste veckan har jag läst boken The Search av John Battelle. Boken fokuserar på ekonomin runt att skapa och driva en sökmotor, och speciellt handlar boken om Google.

Boken har 11 kapitel, varav de två första handlar om bakgrunden till webbsökning och de ekonomiska drivkrafterna bakom. I det första kapitlet beskriver författaren ”the database of intensions”, som kan sägas vara en informationssamling från vilken för dig intressant information kan utvinnas beroende på dina avsikter. I en ”database of intensions” finns information, dels om vad du brukar vara intressarad av, men också information av vad andra har visat intresse för, och vilka trender som finns på olika platser i världen. De journalistiska grundfrågorna ”Vem, vad, var, varför, när och hur mycket” besvaras också för konceptet ”sökmotorer”. Där förklaras också bl.a. det för sökmotorer så centrala begreppet ”den långa svansen” (The Long Tail).

Efterföljande fyra kapitel handlar om Googles ”uppväxt” och hur de hittade sin affärsmodell. Bokens fokus under dessa kapitel ligger på betalda sökresultat, ”paid search”. Bakgrunden som ges i de första kapitlen ger en intressant beskrivning av företag som Goto.com (som senare bytte namn och inriktning och nu finns som Overture.com). En intressant beskrivningn av personen Bill Gross ges. Bill Gross beskrivs som personen som fick betalda sökresultat att fungera på webben. Bill Gross driver just nu IdeaLab, som beskrivs som en inkubator för webbprojekt. IdeaLab driver bl.a. sökmotorn Snap. Sökmotorn Snap använder visserligen de verkliga sökresultaten (de algoritmiska) från Gigablast, men Snaps affärsmodell handkar om ”paid search”, och inget annat. I de inledande kapitlen ges också en förklaring till vad som låg bakom fiaskot med sökmotorn AltaVista. AltaVistas nedgång förklaras med att de satsade för hårt på sin portalsida, när deras försprång gentemot sina konkurrenterar låg inom tekniker för webbsökning. I bakgrundsbeskrivningen ges också en del intressanta kommentarer och lite historia bakom bl.a. Yahoo, Excite och Lycos. Kapitel fyra, som har titeln ”Google is born”, handlar om hur Google växte fram ur ett två misslyckade(?) doktorandprojekt som utmynnade i programmet BackRub, som kan ses som Googles föregångare. Idén med BackRub var att genom att automatiskt läsa en massa webbsidor på nätet upprätta en lista över vilka webbsidor som länkar till en specifik webbplats. Genom att ta reda på vilka webbsidor som länkas till av många webbsidor, och speciellt vilka webbsidor som länkas till från sidor som i sin tur många länkar till, så kunde BackRub användas för att bestämma vilka webbsidor som kan ses som auktoriteter på nätet. Algoritmerna som utvecklades för dessa beräkningar låg till grund för Google kända metod för att rangordna sökresultat, den så kallade PageRank-metoden.

Bokens andra del, från kapitel 7 och frammåt, handlar mycket som Google som företag – beskrivningar av vilka affärsmässiga val Google gjort under de senaste åren. En del plats ägnas Googles ”code principle” – ”Don’t be evil” – och hur de lever upp till det när det gäller sin lansering i Kina och när de sköter sitt Adwords-annonsprogram. En del plats ägnas också åt Googles börsintroducering.

Boken har 284 sidor plus fotnötter och index. Det är först och främst den första halvan av boken som jag finner intressant. Den del som beskriver hur mycket Google profiterar på ”paid search”, och succén vid börsintroduktionen tycker jag är mindre intressant. Bakgrunden, om hur Google ”blev till” och vilka tjänster Google hittills har konkurrerat ut, är desto mer intressant. Är man, som jag, intresserad av sånt här, men inte orkar läsa boken så rekommenderar jag denna WebCast där John Battelle tar upp några av de mest intressanta exemplen ur boken.

Metasökning

Posted in Osorterad on oktober 19th, 2005 by Clas – Kommentering avstängd

Sökmotorer som samlar in sökresultat från en eller flera andra sökmotorer kallas meta-sökmotorer. Det finns ett stort antal av dessa på nätet. Det finns till och med några som är riktigt stora – som har många användare. Exempel på sådana är Dogpile och Mamma.com. Mamma.com ser ut att ha en omsättning på över 15 miljoner (dollar).

Idag har flera tidningar skrivit om svenska Whipsearch. Tyvärr har jag inte förstått hur det är tänkt att Whipsearch ska användas. Undrar om någon på DN förstått det, eller om de bara klippt lite i ett pressmeddelandet? Jag har tyvärr inte hittat någon hjälptext eller beskrivning på hur Whipsearch ska/kan användas.

Whipsearch är kanske(?) inte en metasökmotor som de vanligen ser ut, ett sätt att göra samma sökning till fler sökmotorer (eller?) , endera för att hitta fler sökresultat eller se skillnaderna i de olika sökmotorernas resultat. De finns ett antal sådana ”gränssnitt” på nätet. Ett exempel är DoubleTrust, ett annat är Jux2. Jux2 är för övrigt till salu på eBay. Just nu är senaste budet $26,000.

Expressens nya Nyhetskollen

Posted in Osorterad on oktober 15th, 2005 by Clas – 2 Comments

Expressen har (uppenbarligen) haft premiär för sin nyhetsaggregerings-sida kallad Nyhetskollen. Jag är inte säker på när den visades upp för första gången, men Google har i alla fall en version från den 13:e oktober i sin ”cache”.

På Nyhetskollen visar Expressen upp nyhetsrubriker från ett antal svenska och utlänska nyhetssajter: DN, SvD, GP, Sydsvenskan, DI, Affärsvärlden och Ekonominyheterna, plus ett antal norska och engelskspråkiga sajter. Aftonbladet är inte med ;-) De uppdaterar sidan var 30:e minut. Materialet ser ut att vara samma material som tidningarna har i sina respektive RSS-feeds, förutom loggan från respektive nyhetssajt. Länkarna leder direkt till respektive nyhetssajt; Expressen verkar alltså inte hålla koll på vilka nyheter som attraherar trafik på övriga sajter genom att räkna klick på nyhetslänkarna.

Expressen kallar, i sann Google-anda, sidan just nu för en beta-version. Texten ”Senaste nytt från …” under varje logga hoppas jag att de tar bort innan beta-testet är över.

Bättre eller sämre?

Posted in Frisim on oktober 13th, 2005 by Clas – 2 Comments

Jag har byggt ihop en ”ny” indexsida som har en topplista över mest klickade nyhetslänkar. Sidan ser ut såhär:

new index page

Är det bättre eller sämre? Är det för mycket ”jag har just lärt mig två nya effekter i Photoshop-känsla” över det? Sidan finns tillfälligt på http://www.frisim.com/index2.php.

Webcasts om sökmotorer

Posted in Sökmotorer on oktober 9th, 2005 by Clas – Kommentering avstängd

Jag har ägnat några timmar åt att titta på de föreläsningar som finns upplagda från kursen Search Engines: Technology, Society, and Business. Föreläsningarna finns upplagda som streamade video-filer i bra upplösning och med bra ljud.

Introduktionsföreläsningen ger mest en inblick i hur amerikanska kurser brukar administreras. Förutom det så presenteras alla föreläsare (utom Sergey Brin, som är en den ”hemliga gästföreläsaren”). Föreläsningen ger dessutom en kort introduktion till hur en några prokoll på internet fungerar och komponenterna i en sökmotor.

Den andra föreläsningen är med J. Battelle – han som har bloggen SearchBlog. Han har dessutom skrivit den bok, The Search, som används som kurslitteratur i kursen. Hans föreläsning är rätt underhållande, och det ges några anekdoter från dot-com-eran.

Nästföljande föreläsning är med två personer från Yahoo och handlar om hur sökningar görs och presenteras på dagens sökmotorer. Första delen av föreläsningen handlar om hur sökresultat rangordnas och hur man som sökmotorägare kan utvärdera en rangordning. Andra delen handlar om hur personer upplever gränssnitt mot sökmotorer och hur ointuitivt boolean-OR och boolean-AND är för den ovane.

De två efterföljande föreläsningarna är av personer från Google. Den första presenterar Googles alla tjänster. Den presentationen verkar vara en ”standardpresentation” från Google. Rätt mycket tid ägna åt Google Print (som inte inresserade mig så mycket). Den andra föreläsningen (från den 3:dje oktober) ges delvis av Sergey Brin, som är en av Google-grundarna. Det är inte så mycket till föreläsning, utan mest frågor-och-svar. Föreläsningen innehåller inte så mycket intressant, men det är ju alltid lite kul att se hur en som lyckats så otroligt bra med sin webbtjänst presenterar och förklarar vad de gjort och hur de tänkt. Föreläsningen den 3:dje oktober innehåller också en halva av en Berkeleyprofessor som handlar om sökning i peer-to-peer-nätverk. Föreläsningen handlar mest om hur peer-to-peer-nätverk kan infekteras med filer som inte innehåller det de förväntas innehålla. Denna del känns inte så relevant för internet-sökmotor-temat.

Generellt så är det Q’n'A-delen (frågor-och-svar) i slutet på varje föreläsning det som är mest intressant. En hel del bra frågor ställs och svaren är ofta intressanta. Jag kommer att försöka titta även på den kommande föreläsningarna.