Archive for augusti, 2005

SEW om AOL News

Posted in Sökmotorer on augusti 27th, 2005 by Clas – Kommentering avstängd

Search Engine Watch (SEW) skriver om Amerika Onlines (AOL) nya nyhetssöktjänst AOL News. AOL, som är lite av USA:s svar på Spray (*hihi*), har sedan tidigare en webbsöktjänst som baseras på Google. AOL News verkar dock inte drivas av data från Google News. Eftersom AOL är en så stor aktör på ”det amerikanska internetet”(?) så visar besöksstatitik redan för tjänstens första månad att AOL News är den näst mest välbesökta nyhetssöktjänsten, efter Yahoo News, och den distanserar både Google News och Topix när det gäller antalet besökare.

Som vanligt med amerikanska nyhetssajter så känns de nog inte så användbara för mig som svensk, och jag tror inte de är så flitigt besökta av svenskar. Det är mest när jordens fortlevnad står på spel, eller om jag skulle få för mig att läsa om Michael Jacksson, som jag besöker dem.

Technorati på svenska

Posted in Osorterad on augusti 23rd, 2005 by Clas – Kommentering avstängd

Technorati har visst börjat med språkfiltrering för bland annat svenska. Det gör att jag äntligen kan börja använda Technorati för att söka bland ”svenska” bloggar. Eftersom filtreringen sker automatiskt så fungerar det väl bara 99%-igt, men det är gott nog för mig, nu. Technorati verkar också ha blivit lite bättre på att återge de svenska tecknen korrekt i rubriker och ingresser. Så, trots Kottke:s klagomål – börja pinga Technorati nu!

Söndagshack: Menade du Google News?

Posted in Frisim on augusti 21st, 2005 by Clas – Kommentering avstängd

När jag gör webbsökningar så stavar jag ofta rätt kass. Det händer till och med att jag använder sökmotorn för att se hur ett ord stavas – jag skriver in det ord jag är osäker på i Googles sökruta och ser om Google svarar med ett ”Menade du?”-förslag. På så sätt får jag en hint om jag stavat rätt eller inte.

Söndageftermiddagen har ägnats åt att implementera en liknande funktion i vår nyhetssökmotor. För sökningar som inte resulterar i någon länk till en artikel, och där vi tycker oss kunna hitta ett rimligt stavningsalternativ, ger Frisim nu en länk med ”Menade du [nytt sökord]?”

Söker du t.ex. på [goigle news] i hopp om att hitta artiklar om Google News så ser svaret ut som:

Tekniken jag använder bygger på en ordlista skapad av de ord som finns i våra insamlade artiklar. Om sökningen du gjort inte matchar mot någon artikel så analyseras orden i söksträngen och vi försöker hitta likande ord som finns i ordlistan. Detta är en vanlig teknik för att skapa sig en ordlista som innehåller den typ av ord finns sökbara i indexet. Med denna teknik så får vi en ordlista som innebåller ”nya” ord och teknik-ord. Tyvärr innebär det också att det inte är omöjligt att få ett förslag på ett felstavat ord, eftersom det troligen finns med några sådana i de nyhetsartiklar vi sparat.

Just nu väger vi inte in hur ofta ett ord har använts i artiklarna, utan tar det som verkar stavas mest likt sökordet. Förhoppningsvis kommer detta att kunna utvecklas vidare. Nuvarande ordlista innehåller lite för många stavfel för att det ska fungera helt perfekt. Än så länge går det i all fall att leka lite t.ex. genom att söka på ”ord” som alldrig och alvarligt.

Stavningsfunktionen finns bara under .se-verisonen av Frisim, dvs på frisim.se. Detta ”hack” är ett försök att förbättra vår söktjänst samtidigt som vi kan kräma ut lite mer ur vår nya server.

Akamai visar nyhetsläsningsstatistik

Posted in Osorterad on augusti 19th, 2005 by Clas – Kommentering avstängd

Akamai lanserade igåren intressant form av nyhetsstatistiktjänst. Akamai är ett företag som servar större webbsajter med bandbredd. Några av de sajter som anlitar dem är nyhetssajter som Reuters, NBC och ESPN. Detta gör att de kan skaffa sig spännande information om vilka nyheter som läses på ett relativt stort antal stora nyhetssajter. Sammanlagt så handlar det om statistik på nerladdning av runt en miljard nyhetssidor per dygn. Denna information delar de nu med sig av på sin Akamai Net Usage Index – News-sajt. Under de månadar av data som de visar upp så kan man se bl.a. tydliga toppar i antalet besökare på de övervakade nyhetssajterna t.ex. den 7, 21 och 26 juli. De har kopplat dessa toppar till enskilda nyhetshändelser; de första bombningarna i London den 7:e, och de andra bombningarna den 21:a, och den 26:e sköts rymdfärjan upp. Utöver dessa toppar i nyhetsläsning och kopplingen till vilka händelser som triggar läsningen så ges statistik om nyhetsläsande den senaste dagen på sajten. De presenterar, just nu, t.ex. en siffra som säger att under den senaste dagen har det lästs 3% mindre nyhetsartiklar i Europa, än under norm-dagen. C|Net News har en kort artikel om Akamai-sajten.

[Via Via Marketing VOX]

Google Maps med Flash-gränssnitt

Posted in Osorterad on augusti 17th, 2005 by Clas – Kommentering avstängd

Wow, FlashEarth är verkligen cool! (Sidan kräver en Flash-plugin i browsern). Nästan som Google Maps konverterad till Google Earth.

Mer datorkraft åt Frisim

Posted in Frisim on augusti 16th, 2005 by Clas – Kommentering avstängd

När vi startade Frisim.com 2002 så körde vi den på webhotellet Levonline, där vi sedan tidigare körde, och fortfarande kör, vår tjänst Nyhetsrubriker.com. Efter något år flyttade vi Frisim till en server som vi själva kan kontrollera allt på och som är placerad utanför London. Servern sköts av Bytemark. Denna server använder vi fortfarande, och vi är nöjda med denna lösning. Trots det, så för att kunna utveckla sökmotortjänsten vidare och kanske göra den lite snabbare, så har jag nu flyttat över av en kopia av sajten till en ny server. Den nya servern har rätt mycket internminne, så vår förhoppning är att vårt index med nyhetsartiklar kommer att få rum i sin helhet i internminnet. Det bör göra att sökningar kommer gå snabbt även om servern belastas hårt.

Servern är under vad vi kan kalla ”utprovning” fortfarande; mest för att se om hårdvaran verkar fungera som den ska. Allt på servern är dock installerat för att kunna driva Frisim ”skarpt” redan nu. Min ursprungliga idé var att köra servern hemifrån under några månader innan den ställdes hos en ISP men då det är en burk som passar för rackmontering så väsnas den så mycket att jag helst inte kör den hemma under någon längre tid. Servern är därför redan nu placerad (co-locatation) hos en ISP med B2 som bandbreddsleverantör.

Servern kör en i det närmsta identisk kopia av Frisim-koden, och den enda skillnaden är i princip att vi passat på att installera uppdaterade versioner av operativsystemet och Java-VM:et. Vill du ”provköra” den nya servern så är den åtkomlig på www.frisim.SE, dvs, under .SE istället för .COM. Vill du ge kommenterar om hastigheten så är vi mycket tacksamma.

Google News med RSS

Posted in Sökmotorer on augusti 9th, 2005 by Clas – Kommentering avstängd

Google ger dig nu möjlighet att göra sökningar på deras Google News och få resultatet som en RSS-feed. De låter dig dels hämta hem deras vanliga nyhetskategorier, som toppnyheter, sport, affärer, osv., som RSS, dels resultatet av sökningar i nyhetsarkivet. En nyhetssökning resulterar inte bara i en lista med nyhetslänkar, utan de returnerar en samling relaterade nyheter till varje nyhetsnyhet – precis som en sökning på t.ex. Google hos Google News. I den nyhetsläsare som jag använder (Bloglines) så ser en sökresultatbaserad feed ut så här:

Det är uttryckligen tillåtet att visa upp resultaten i dessa RSS på din egen webbsida. Förutsättningarna är att det är en ”icke-kommersiell” hemsida, och att du 1) skriver att du använder en Google News feed, 2) vid varje länk skriver till vilken källa länken leder, 3) inkluderar en länk till ”relaterade nyheter” på Google News, och 4) anger vilka sökord du använder för att generera feeden. Rätt generöst tycker jag. Detta borde leda till viss oro hur de omvärldsbevakningsföretag som säljer digital omvärldsbevakning till mindre (amerikanska/engelskspråkiga) företag och privatpersoner.

På Googles beskrivningssida hittar du alla detaljer. [Via JZ.]

Adderat: Kommentarer om de friheter Google tar sig genom att sprida vidare andra sajters texter och bilder med sin egen licens.

Aftonbladet förstorar svenska militärbaser

Posted in Osorterad on augusti 2nd, 2005 by Clas – Kommentering avstängd

Nu har Aftonbladet tittat lite på satellitbilderna över Sverige i Google Maps och försöker få det till att Google Maps är ett verktyg för terrorister. Svenska försvaret verkar, tursamt nog, ta det med ro och konstaterar att ”det inte olagligt att sprida satellitbilder av militära baser” och ”de är inte särskilt bekymrade.”

Topix.net och miljonerna

Posted in Osorterad on augusti 1st, 2005 by Clas – Kommentering avstängd

Jag har tidigare skrivit en del om nyhetssöksajten Topix.net och dess utveckling. Senast var det värderingen av det bakomliggande företaget, i och med att de sålde ut 75% till tre tidningar. Då talades det om att Topix.net var värt runt en sisådär $15 miljoner. Nu, när två av tidningarna har släppt sina kvartalsrapporter, så visar det sig att de tre tillsammans betalde c:a $50 miljoner för de 75 procenten av sajten/företaget (företaget Topix äger och driver bara Topix.net).

Enligt denna blog så värderas Topix nu till $64 miljoner. Där nämns också att av de $50 miljonerna som de tre tidningarna köpte in sig med så hamnade $40 miljoner i grundarens (en eller två?) ficka. Det är flera som är avundsjuka. Om någon vill investera 300 miljoner kronor i min sajt så är det bara att maila…

(Topix har en ”utvecklingsblog även om den numera sällan tar upp något om den tekniska utvecklingen utan tyvärr, i princip, bara presenterar konferenser där Topix finns representerade.)

Update: GwG länkar till en intervju hos Online Journalism Review med snubbarna bakom Topix.

tags: