Archive for september, 2003

news.google.se

Posted in Sökmotorer on september 22nd, 2003 by Clas – Kommentering avstängd

Nu har news.google.se startat! Men den visar samma som .com-domänen ;-)

www.google.se pekar dock till en ”svensk version” av Googles användargränssntt.
[Via mymarkup.net.]

Internetbrus recenserar Gooliat

Posted in Sökmotorer on september 20th, 2003 by Clas – Kommentering avstängd

Internetbrus uppmärksammar den svenska nyhetssökmotorn Gooliat. Internetbrus är (som vanligt) sunt skeptisk, men imponeras precis som jag, av det stora antalet källor som avsöks.

Tyvärr saknar Gooliat instruktioner om hur en giltig sökning ser ut. Det verkar dock som om de använder ”default OR” principen, dvs. skriver du in flera sökord så hittar den alla artiklar som innehåller minst ett av orden.

Det verkar som om Gooliat (och Izaxon) har tänkt sig att få intäkter genom att sälja program för att visa nyheter/artiklar på slutanvändarens PC.

Det finns ett antal skillnader mellan Frisim och Gooliat:

- Gooliat avsöker många fler källor.

- Gooliat ”slarvar” med indexering av artiklarna då det bara går att söka på ord som finns i artikelns rubrik och/eller ingress (c:a 130 första tecknen på nyhetssidan). Det gör sökresultaten mindre intressanta och begränsar möjligheterna att efterbehandla och bilda kluster av nyheter. Fördelen är dock att mycket plats och CPU-kraft sparas på detta, samt att det direkt är tydlygt att ordet man sökt på förekommer i artikeln då det visas (med fetstil) i sökresultatet. (Jag gissar på att Gooliat använder en off-the-shelf-lösning för att göra sökningar. Kanske kör de FULLTEXT-indexering i någon SQL-databas.) Frisim indexerar hela artikeln.

- Gooliat kör på en ”egen” server och har bandbredd från hem-ISP:n Bostream. Frisim körs på ett vanligt webbhotellkonto på ett billigt (men bra) svenskt webbhotell dvs. på en server som delas med något hundratal andra.

Altavista lever fortfarande

Posted in Osorterad on september 19th, 2003 by Clas – Kommentering avstängd

Jag som trodde att sökmotorn Altavista var i det närmaste nedlagd. Ack så fel. Under onsdagkvällen lade jag upp ”här finns de senaste nyheterna om nk-mannen” med en länk till en sökning på ”nk-mannen” på startsidan. Ett dygn senare så har denna sida fått med än 500 besökare från Altavista. Alla har sökt på endera nk-mannen, ”nk-mannen” eller ”nk mannen” (det senare utan citattecken). Hade det varit Google så hade jag inte varit förvånad, eftersom de brukar vara snabba med att uppdatera sitt index (med den robot som tidigare kallades ”fresh-bot”). I detta fall var dock Altavista mycket snabbare. Cool.

Utveckling av backend till Frisim

Posted in Frisim on september 7th, 2003 by Clas – Kommentering avstängd

Utveckling går lite långsamt av den nya versionen av Frisim. Dock inte så långsamt som det kan se ut på webbsidan. Just nu bygger vi en ”backend” för våra betalande prenumeranter. I denna ”backend” kan prenumeranten övervaka (studera t.ex. klickstatistik odyl.) och modifiera den sökning som sedan genomförs var 10:e minut och sedan exporteras i en datafil. Datafilen kan hämtas i ett gäng format, ”ren” XML, RSS och Javascript, dessutom med ett antal format på bl.a. datum.

Det som ännu inte är färdigt i denna ”backend” är exempel på hur man presenter dessa data på eget intranet/webbsida. Förhoppningen är att jag kan hitta några vältestade ”open source”-script för RSS som våra kunder sedan kan använda. Var hittar jag sådana script för ASP, PHP och JSP? Kanske får jag gräva lite i källkoden till PHPNuke och liknande verktyg.

labs.frisim.se finns dock den senaste versionen av sökmotorn. Denna version är t.ex. ”bättre” i den mening att du kan söka även på siffror och t.ex. produktnamn med siffrer. T.ex. fungerar en sökning på ”T610″ alldeles utmärkt, vilket det inte gör på www.frisim.se eftersom där indexeras inte tal överhuvudtaget och typiska ”produktnamn” kastas helt enkelt bort innan indexeringen görs.