Archive for mars, 2004

Google prov-indexerar Javascriptfiler

Posted in Frisim on mars 20th, 2004 by Clas – Kommentering avstängd

I min server-log för Nyhetsrubriker.com är det tydligt att Google nu gör tester med att indexera innehållet i Javascript filer. Eftersom prenumerationerna på Nyhetsrubriker.com sköts just via Javascript så finns det många sidor som laddar Javascript-kod från oss. Då Google nu börjar indexera dem så genererar de en hel del extra trafik i och med sitt spindlande. Undrar om det kommer att påverka antalet länkar till oss som registreras hos Google?

I server-loggen hittar jag rader som denna:
64.68.89.162 – - [20/Mar/2004:00:02:29 +0100] ”GET /news/allanyheter.php3?login=XXXXXX HTTP/1.1″ 200 1710 ”-” ”Googlebot/Test”
och det verkar ha pågått ett antal dagar nu.

Mer om Topix.net och lokala nyheter

Posted in Sökmotorer on mars 20th, 2004 by Clas – Kommentering avstängd

I artikeln Web site faces battle for users in market for local news kommenterar Rich Skrenta sin nyhetsportal Topix och hur den fokuserar på lokala nyheter. ”Skrenta believes people eschew the Web for local news because they think they can’t find it there, or they don’t want to visit the multiple small news Web sites that serve all their local communities.”

Yahoo news search 2.0 beta

Posted in Sökmotorer on mars 19th, 2004 by Clas – Kommentering avstängd

Yahoo har lagt ut en beta-version av Yahoo news search 2.0. Med hjälp av ”avancerad sökning” kan man begränsa sina sökningar till att bara gälla svenska nyheter. Detta är förvisso inte nytt i beta-versionen, utan finns även på den tidigare versionen av Yahoo News Search.Yahoo verkar spara artiklarna i en månad. Söker jag på ”och”, bland nyheter mellan 18 februari och 18 mars med kravet att artiklarna skall vara på svenska så får jag 24667 träffar. frisim.se ger för samma tidsperiod 23945 träffar på artiklar med ordet ”och” i. Det verkar med andra ord som Yahoo indexerar ungefär lika många svenska källor som vi gör. Senaste.info verkar indexera c:a 16000 artiklar under 30 dagar. Mer info finns hos SearchEngineJournal.

Topix.net klar!

Posted in Sökmotorer on mars 9th, 2004 by Clas – Kommentering avstängd

Topix.net plockade igår bort sin ”beta”-stämpel på startsidan. Samtidigt finns en intervju med grundaren av sajten, Rich Skrenta, även känd som grundare till DMOZ, på Resource Shelf. Fler nyheter om Topix hittar man, naturligtvis, på topix.net/news/topix. Topix.net har samma fuktionalitet som Frisim i det att de erbjuder Javascript (och även RSS) feeds till sina källor. [Via Internetbrus]

Lite filindexproblem

Posted in Frisim on mars 9th, 2004 by Clas – Kommentering avstängd

De senaste dagarna har Frisim ”tappat” sitt index ett par gånger. Det innebär att sökningar bara görs bland de artiklar som samlats in därefter, vilket är mycket få. Alla artiklar finns dock kvar i två MySQL-tabeller, en med kompletta artiklar (oindexerad), och en mindre tabell med bara rubrik, länk och ingress för snabb access (indexerad). Jag vet inte exakt vad det beror på att fildatabasen ”försvinner”, men troligen försöker jag ”optimera” det filbaserade artikelindexet samtidigt som jag uppdaterar det – någon som egentligen inte kan hända ;-) Lösningen just nu är att inte optimera fildatabasen efter varje adderad källa utan endast en gång per timme. Det bör innebära att spindlingen går rätt mycket snabbare, samtidigt som sökningar kan ta mer tid, eller i alla fall ger lite mer diskaccess. Hittills, dvs. idag, har detta fungerat bra.

Vore det inte så att det var så mycket på jobbet just nu så skulle jag meka lite mer med den portalsida som jag börjat på – en härmning av news.google.com, men på svenska förstås – som baseras på ”word bursts” för att identifiera ”toppnyheter” och som listar de senaste nyheterna i ett antal kategorier.