Archive for mars, 2008

Nettopp nyhetskatalog, alfa-version

Posted in Frisim on mars 30th, 2008 by Clas – 1 Comment

Nu finns det en publik alfa-version av Nettopp. Som jag skrev i mitt inlägg om Alltop så är sajten en nyhetskatalog i form av en lista med kategoriserade bloggar och nyheter. Just nu finns bara c:a 150 bloggar inlagda, men tanken är att det ska bli fler, förhoppningsvis med lite hjälp. Det är bara bloggar som skrivs på svenska som är inlagda. Såhär ser huvudsidan ut:


Nettopp1

och varje kategorisida ser ut såhär:

Nettopp2

Förhoppningen är att det blir stor bredd på kategorierna, men att urvalet av källor till varje kategori ska göras så att de upplevs relevanta och med med hög kvalitet. Antalet kategorier, och vilka, får jag justera vartefter jag ser hur svårt det är att hitta bra källor inom kategorierna. Redan nu kan jag konstatera att det (faktiskt) finns en rätt stor brist på ”rikitga” kattbloggare.

I sann ”web 2.0″-anda så bryr jag mig inte om att lägga till det enorma utbud av amerikanska bloggar som finns för varje kategori, utan jag har helt enkelt länkat till de jag tyckte var mest intressanta hos Guy Kawasakis Alltop. De finns samlade under ”Hos Alltop”.

Alfa-version av Nettopp är ungefär lika spännande som Alltop.com är, men med betydligt färre källor inlagda. Finessen med Nettopp är att jag drar all nyhets- och bloggdata genom sökindexet i Frisim. Det gör att all data som visas på Nettopp, och de fullständiga blogginläggen och nyhetsartiklarna är ”analyserade” och blir sökbara. Tanken är att det ska gå att göra något bra av det. Hur bra det blir återstår att se, men gissningsvis beror det lite på hur mycket tid jag lägger ner ;-) En sak är dock säker: eftersom bloggarna läggs in manuellt så blir resultatet bättre om du tipsar mig om din blogg, eller ännu hellre, tipsar mig om alla bra ämnesfokuserade bloggar som du brukar läsa. Det finns ett fint Ajax-baserat formulär (bygger på MooTools) för att bidra. Vill du bidra med många bloggar eller med en helt ny kategori funkar nog mail bättre. Självklart får du som bidrar med bloggtips ”cred” på sajten. Så, prova nu Nettopp.se.

Stilstudie: Alltop.com

Posted in Osorterad on mars 29th, 2008 by Clas – 3 Comments

Sajten Alltop.com lanserades den 11 mars i år. Sajten är en manuellt skapad lista över amerikanska bloggar och nyhetssajter. Själva konceptet är knappast revolutionerande. Det som är lite nytt är sättet som katalogen presenteras på. Varje kataloginlägg (nyhets- eller bloggkälla) presenteras genom att lista de sex senaste inläggen eller nyheterna. Samtidigt som sajten är en ren katalog med sorterade källor så kan man alltså se rubrikerna på vad varje senaste skrivit. Inte heller det gör sajten så speciell.


alltop shot

Det som möjligen är lite speciellt med sajten är att det är ”internetkändisen” Guy Kawasaki som marknadsför den. Guy är bland annat känd för ett antal startups och för intervjuer och presentationer i startup-världen. Senast gjorde han en intervju med Microsofts Steve Ballmer på konferensen MIX’08. Enligt Guys blogg så köpte han sajten färdigimplementerad, men utan alla källorna inlagda, för $3000.

Alltop.com fick ganska mycket publicitet när det lanserades, i alla fall i relation till vilket problem som sajten löser. Lite gissningar om storleken på trafiken finns hos Alexa och Compete.

Sajten har fått ett blandat mottagande från besökarna. Man kan konstatera att sajten knappast blivit så omskriven om det inte vore för att Guy är den som ligger bakam. Redan i kommentarerna på hans lanserings-blogg så noteras det att ”And that’s why Guy is a key component of this idea – his fame can get this idea into the mainstream press. ”, samtidigt som vissa är rätt negativa, och skriver t.ex. ”Sorry to tell you, but at 1st, 2nd an 3rd look, I had a hard time telling it apart from a linkfarm.” Andra ser nyttan med sajten för alla de som inte är användare av RSS-feeds och nyhetsläsare: ”… well I don’t think this was built to please us techies… think about mainstream users that STILL have no idea what an RSS feed is… this could actually be a good step to get them interested. Not everything has to be a GREAT idea to be useful.”

Startup-sajten TechCrunch sågar sajten med orden Guy Kawasaki Formally Launches Alltop. Wow, It’s Bad, och även där är kommentarerna från (de ofta teknikfixerade) läsarna blandade, allt från ”Alltop is great when you want to go somewhere for a source of new information whereas I use NetVibes for sites I check on a regular basis.”, via ”Guy Kawasaki is a premiere self-promoter and attentionwhore. … Yet he knows how to play the media like a fiddle.” till kommentarer som ”Looks like a parked domain”.

Anledningen till att Alltop startades var, enligt webbsidan, att de konstaterade att sajten Truemors fick väldigt mycket trafik från sajten PopUrl, mer trafik än de fick från Google.

Samligen av bloggar och nyhetssajter inom t.ex. Social Media är imponerande, och eftersom jag inte har 100% koll på amerikanska sajter inom området så kan jag faktiskt uppskatta den sammanställning som finns på Alltop, även om sajten är enkel.

Varför skriver jag om Alltop? Jo, då jag tänker mig att skapa en kategoriering av nyhets- och bloggsajter så är Alltop ett intressant sätt att presentera data på. Presentationssättet tycker jag lämpar sig rätt bra för ”slösurfning” och för upptäckande av nya sajter att addera till nyhetsläsaren.

En alfa-version av min svenska Alltop-look-a-like finns på nettopp.se. Mer info om den senare…

Amazon EC2 blir bättre på hosting

Posted in Osorterad on mars 27th, 2008 by Clas – 1 Comment

Jag har under det senaste året använt Amazon EC2 som ”backup-” och utvecklingsserver. Amazon EC2 fungerar som en viruell dedikerad server (VPS) som hyrs på timbasis. Jag betalar bara för de timmar som servern är igång, och bara för den trafik som går till och från servern. Håller jag servern igång en månad och utnyttjar måttligt med trafik, så blir kostnaden ungefär $100.

En nackdel med Amazons lösning jämfört med en vanlig VPS är att den inte givits något permanent IP-nummer. Det innebär att jag har behövt utnytta en DNS-tjänst som tillåter att jag snabbt kan peka om en domän mot det IP-nummer som jag tilldelas när jag startat min server. Det har inte varit något större problem. En annan uppenbar nackdel med att starta upp och stänga ner en hyrd server ofta är att man behöver lagra och ”ladda upp” sitt opertivsystem och t.ex en configurering av webbservern Apache varje gång servern startas. Det löses hos Amazon genom att man manvänder Amazons lagringstänst Amazon S3 för att lagra en komplett version av operativet. Genom att ladda upp denna så är man tillbaka på samma ställe som när servern stängdes ned. Nackdelen blir mer uppenbar om servern krashar utan att du lagrat dina senaste data, då går de hopplöst förlorade, men det har ännu inte hänt mig. Att spara ner ofta ”löser” det problemet.

Idag mailar Amazon om att de lanserar två nya funktioner till sin EC2-servrar. Den ena är ”elastiska IP-nummer”, vilket innebär att jag kan ”checka ut” ett personligt IP-nummer som jag kan peka min domän till, och att det IP-nummret kan pekas mot min EC2-server när den startas. Det innebär att jag inte behöver peka om domäner när servern startas upp. Det innebär också att en EC2-server skulle kunna användas t.ex. för mailhantering eller som DNS-server(?).

Den andra funktionen som lanseras är möjligheten att välja var jag vill att min server ska finnas, fysiskt. Amazon kallar det Availability Zones, och innebär att jag kan se till så att om jag startar flera VPS:er så kan jag se till att de befinner sig på olika platser. Det verkar som om Amazon idag bara låter mig välja på platser i USA, och det framgår inte av instruktionerna var de finns, men Amazon lovar att ”common points of failures like generators and cooling equipment are not shared across availability zones, and availability zones are designed to be independent with failure modes like fires and flooding.”

Mitt projekt Nettopp.se utvecklas på en Amazon EC2. Snart ät det i alla fall möjligt att visa upp en skärmbild på hur Nettopp kommer att se ut. Vill du vara med och katalogisera bloggar så skicka mig ett mail!

Hands-on: Jag tror jag förstår varför Yahoo lyckades

Posted in Sökmotorer on mars 23rd, 2008 by Clas – 8 Comments

Sökmotorer som är specialiserade på att ett visst ämne, ofta kallade vertikala sökmotorer, kan vara väldigt användbara. En söktjänst för lägenheter i Stockholm (som t.ex. Booli), en söktjänst för matlagningsrecept (som t.ex. hos Arla), eller kanske en söktjänst med bilrepareringsinstruktioner för folk med gamla bilar (finns inte ännu, eller?) känner jag mig ofta otroligt ”smart” när jag använder. Alltså blev jag intresserad av att titta på hur man kan utveckla sådana. Min nisch blev en nyhetssökmotor (ja, Frisim.com). Smart som fan – men ändå inte – eftersom ”nyheter” kan handla om lite vad som helst, alltså allt från Paris Hiltons nya hund, via mord i Arboga, till massvält i Afrika. Att nyheter handlar om en massa ”olika saker” gör att det ibland är svårt att hitta det jag tror mig kunna finna genom att använda det traditionella söksättet, att skriva in ett antal sökord i en textruta. För djupdykningar runt ett specifikt namn eller plats fungerar det dock ofta väldigt bra.

En nackdel med lite smalare sökmotorer, jämfört med Google, är att själva tjänsten hamnar i mitt det som i moderna affärssammanhang ofta kallas den långa svansen, ”the long tail”, dvs sökmotorn erbjuder en smal produkt som bara ett fåtal personer är intresserad av, men de som verkligen är intresserade är ofta entusiastiska över att ha hittat tjänsten. Men låt mig skita i det så länge, då det bara är intressant om man ska tjäna pengar på sin sajt, eller som Hjalmar (nästan) uttrycker det, det är skitgöra att sitta och hålla på med nischade siter när man istället kan gå direkt på den stora feta kalven.

En sökmotor som på ytan är en specialiserad sökmotor och delvis liknar ren nyhetssökmotor är de så kallade bloggsökmotorerna. Min, relativt nyvunna, insikt är att bloggsökmotorer är ointressanta som specialiserade sökmotorer. Bloggen är ett ”format” för att publicera sig på en hemsida, och det är allt alla dessa bloggar har gemensamt. Det som skrivs i ett specifikt blogginlägg på en blogg är oftast mycket mer intressant om det är så att jag har läst de tidigare blogginläggen – lite som att Kapitel 2 i en deckare känns mera meningsfullt om jag tidigare har läst Kapitel 1. Att göra bloggar sökbara kan dock ha intressanta sidoeffekter, som t.ex. att kunna analysera hur ofta ett namn nämns bland bloggarna, eller för att analysera till vilka andra sajter som bloggarna länkar, som t.ex. Twingly, Knuff, eller Frisim.

Slutsatsen är att jag inte borde lägga tid på att skapa en specialiserad sökmotor för bloggar utan att dessutom ha ett index eller en lista med kategoriserade bloggar.

Denna typ av bloggämneslistor går rimligt bra att skapa genom att analysera uppmärkta/taggade inlägg på ett större antal bloggar och det görs idag hos t.ex. Technorati och Blogtips.se. Listorna har alltså som syfte att hjälpa till att hitta bloggar som (ofta) skriver om ett ämne som man är intresserad av, för att kunna läsa flera inlägg från den bloggen och kanske bevaka framtida inlägg på just dessa bloggar.

Ett annat sätt är försöka kategoriera ”hela” bloggen manuellt. Det är en sådan kategorisering som gjorde sajter som Yahoo.com och Dmoz gigantiska.

Så, slutsatsen blir att jag ska komplettera Frisims index med lista med kategoriserad information. Jag tror att jag kommer att satsa på att skapa den manuellt. Kanske är det mycket jobb att kategorisera ”alla” bloggar manuellt, men samtidigt så tror jag inte att det finns mer än några hundratals svenska bloggar som verkligen är kategoriserbara (dvs som skriver om specifika ämnen). Bloggar som inte är möjliga att klämma in i en kategori får man väl försöka hitta med hjälp av bloggsök – trots allt.

Jag har redan skapat mig ett fint gränssnitt för att försöka bygga upp kategorier i vilka det bör gå att klämma in informationen. (Idealt vore om jag kunde hitta någon som är beredd att hjälpa till med vissa kategorier. Är du intresserad, maila mig på clas@nic-sys.se.) Utöver kategori-gränssnittet finns inte mycket mer än ett arbetsnamn, och det är idag Nettopp.se (typ, på norska, eller också kommer jag att återanvända någon av n7.se eller nyhetr.se, eller något annat). Själva sättet som lagringen i kategorierna är uppbyggd är, om jag får säga det själv, otroligt smart uppbyggd för att kunna skapa manuella kategoriseringar, kategorisering baserade på taggar, och kategoriseringar baserade på bloggsökresultat.

Blogglänksdesign

Posted in Frisim on mars 18th, 2008 by Clas – Kommentering avstängd

Frisims Aktuellt-flik, men nyheter som det länkas till från ”bloggosfären” har fått sig en kosmetisk uppdatering. Dels så visas hur många som länkar inte bara till ”huvudnyheter”, utan även till de relaterade nyheterna, dels namnges bloggarna som länkar och listas inte bara i en numrerad lista som tidigare.


Blogglänkar

Namnge era bloggar lite spexigt nu, länka till någon populär nyhet och pinga, så får vi se hur kul det blir :-)

Dags för Ruby?

Posted in Sökmotorer on mars 18th, 2008 by Clas – 2 Comments

Jag har aldrig provat Ruby eller Ruby-on-Rails, men när jag ser alla tips och script som det skrivs om på diverse bloggar så verkar det som om det är dags snart. Det senaste som triggat mitt intresse är HTML-parsern Hpricot som ser fantastisk ut. Tillsammans med verktyg som FireBug så ser det ut som om man kan bygga en enkel OpenKapow, med bara något tiotal rader kod. För somliga så verkar det inte ta mer än 60 sekunder.

Frisim använder idag HTML-parsern HTMLparser 2.0, ett Java-bibliotek, och det är betydligt omständligare än 60-sekundsexemplet ovan. Å andra sidan så bygger inte Frisims HTML-scraping på att det finns en fast placering eller taggar för textstycken som är rubrik eller brödtext, utan på ett antal ”regler” som används för att hitta rubrik och löptext. Reglerna är generella for nyhetssajter och samma inställningar används för alla nyhetssajter. Frisim fungerar alltså ungefär som Tailranks spindel Spinn3r 2.1 ser ut att göra.

För övrigt tycker jag det känns som om amerikanska sajter som använder en teknik liknande det för Frisim, såsom Tailrank och Techmeme, hittar så mycket mer intressant nyhets- och bloggmaterial än vad som jag hittar på svenska. Kanske är det dags att prova att ett mer internationellt projekt parallellt. Kanske blir det projektet kodat i Ruby ;-)

Startup?

Posted in Osorterad on mars 11th, 2008 by Clas – Kommentering avstängd

Är du, eller vill du vara, ett svenskt ”startup”-företag? Prova att gå med i NING-communityn swedishstartups.ning.com.

Nu är ju inte Frisim någon ”startup”, men jag gick med i alla fall ;-)

Twingly – arkitektur för massivt skalbara webbapplikationer

Posted in Sökmotorer on mars 6th, 2008 by Clas – Kommentering avstängd

”Twingly – arkitektur för massivt skalbara webbapplikationer” är titeln på Twingly-Martins UppLYSnings-seminarium 1/4.

Twingly är en sökmotor för bloggar från hela världen med en arkitektur baserad på öppen källkod som gör det möjligt att indexera stora mängder data och att klara stora mängder sökningar med korta svarstider. Martin går igenom hur sökmotorn är uppbyggd och visar exempel på hur man enkelt kan bygga applikationer som använder sig av Twinglys öppna API.

Min gissning är att den öppna källkod som används för indexering är Lucene. Undrar om jag bör ta i beaktande att seminariet är den första april ;-) Ska du gå?

Subscribers är det nya PageRank

Posted in Osorterad on mars 6th, 2008 by Clas – 4 Comments

Googles PageRank har, sedan Google började visa ett värde i sin toolbar, varit ett populärt sätt att bedöma hur viktig en webbsida är. Detta vikitghetsmått bygger helt på Googles sätt att värdera webbsidor på, och även om det inte är direkt förknippat med hur många engagerade besökare som en webbsida har så känns värdet ”rätt”. Alternativa mått som t.ex. Compete och Alexa försöker, baserat på relativt begränsad information, uppskatta antalet besökare på webbsidan.

Eftersom RSS-feeds är väldigt vanligt på webbsidor numera så har det dykt upp ytterligare ett sätt att mäta ”vikigheten” hos en sajt (eller i alla fall hos en feed) och det är att ta reda på hur många som ”läser” en feed i Google Reader. Det går naturligtvis inte att se exakt hur många som läser feeden, men det är en exakt siffra på hur många som har feeden i sin Google Reader lista. Har du tillgång till statistik-data för din sajt så kan man utläsa antalet ”subscribers” i Google Reader direkt från besöks-loggen. Den ser ut såhär:

72.14.199.80 – - [06/Mar/2008:18:29:10 +0100] ”GET /blog/feed/ HTTP/1.1″ 304 20 ”-” ”Feedfetcher-Google;(+http://www.google.com/feedfetcher.html; 17 subscribers; feed-id=8073987544856608394)”

och det framgår att min RSS-feed till denna blogg har 17 ”subscribers” i Google Reader. Google visar också detta antal ”subscriber” när man söker efter feeden i Google Reader. Det innebär att det är möjligt att hämta detta tal från en webbsida. Webbsidan för denna blogg finns på: denna URL.

I och med att antalet subscribers finns på en hemsida så går det att automatisera hämtningen, och vips så är det möjligt att skapa en ”toolbar” för att visa upp antal ”subscribers” så fort du besöker en webbsida som har en eller flera feeds. Enklaste sättet idag att skapa en ”toolbar” för Firefox är att använda Greasemonkey. Därför finns det naturligtvis redan någon som gjort ett Greasemonkey-script för att visa upp detta. Så här ser det ut för denna blogg:


subscribers

Coolt, eller hur? Siffrorna anger att det är 17 ”subscribers” på RSS-feeden och 4 ”subscribers” på ATOM-feeden. Det innebär att jag kan surfa runt och kolla antalet ”subscribers” i farten. Direkt noterar jag att DN har vääääldigt många fler RSS-prenumeranter än t.ex NyTeknik har. IDG.se tycker jag verkar ha förvånandsvärt få med tanke på målgruppen, och att den typiska landsortstidningen, ekuriren.se, har bara 32 ”subscribers”.

Hmmm, IDG.se har c:a 2000 ”subscribers, amerikanska Techmeme.com har nästan 18000!

Opartiskt om Blocket?

Posted in Osorterad on mars 5th, 2008 by Clas – Kommentering avstängd

Aftonbladet och SvD sajten E24 (alla Schibsted) har idag en artikel om Blocket och dess konkurrenter. Blocket är en Aftonbladet/Schibsted-sajt. Varför tycker jag det känns om de är liiite partiska när de skriver:

Blocket är för stort för att folk ska lämna sajten. [...] Folk gillar Blocket, det är enkelt, snabbt, både lokalt och nationellt, och du får oftast något tillbaka. [...] Detta ger en bild av hur stort och därför svårslaget Blocket är.

För att sedan övergå till att såga andra Köp-och-sälj-sajter

Koll försökte tidigt, men tog aldrig riktigt fart. [...] [Trots att] Lokus [har en] vinstmarginal på runt 20 procent 2006 är det inte mer än godkänt för ett bolag som funnits i över tio år. [...] HD startade i somras sajten Rubbet. [...] Sajten [Rubbet] är dessutom smått obegriplig. [...] Lokaltidningarna Mitt i lanserade i januari sin rubrikannonssajt Mitti.se. [...] Problemet är att det redan finns en lokal sajt som heter Blocket.

Det är inte lätt att kämpa mot Schibsted ;-)