Archive for april, 2004

Google IPO

Posted in Sökmotorer on april 29th, 2004 by Clas – Kommentering avstängd

Google ansöker idag om ”Initial Public Offering”, dvs börsnotering hos Securities and Exchange Commission.

Här finns det officiella dokumentet. Verkar dock ”slashdotted” just nu.

Innebär det att Googlekoll lägger ner nu. :-(

Ett litet haveri

Posted in Frisim on april 27th, 2004 by Clas – Kommentering avstängd

Ett litet haveri uppstod nyss 12:30-13:30, troligen ”tack vare” den senaste uppdateringen av sökmotorkoden. Återställer indexet med bara 10.000 artiklar, orkar inte sätta in de äldre nu tyvärr.Undersöker vidare senare…

Uppdatering: Frisim-servern har gått på ”för hög” belastning (~12) några timmar. Inte 100% vad det beror på; endera disk-thrashing, kraschat tomcat, eller skum inkommande trafik.

Uppdatering igen: Problemet beror, tyvärr, helt och hållet på mina senaste ändringar i sökmotorkoden. Försöker byta tillbaka till något som fungerar inom ett par dagar. Just nu fungerar det mesta i alla fall hjälpligt. När skall jag lära mig att inte peta i koden här, utan prova på hemdatorn först? ;-)

Några sökmotorwebbloggar

Posted in Sökmotorer on april 26th, 2004 by Clas – Kommentering avstängd

Postar några länkar till bra bloggar om sökmotorer:

Battellemedia Searchblog bloggar om allt som har med sökmotorer att göra. Där finns många bra länkar till intervjuer med ”sökmotorkändisar” som Gigblasts Matt Wells och Nutchs Doug Cutting.

Topix webblogg är informativ. Speciellt bloggen om Googles hårdvara och deras påstådda 100 000 servrar är spännande.

Genomför samma sökning hos Google.se eller slå upp hos Susning.nu

Posted in Frisim on april 11th, 2004 by Clas – Kommentering avstängd

Nu har Frisim uppdaterats för att köra Java 1.4, istället för den tidigare Java 1.3.1. Anledningen till att jag inte uppdaterat tidigare var att jdk1.4 gav mig vissa problem med de svenska tecknen i artikeldatabsen. Det problemet är nu löst, tror jag. Uppdateringen gör också att den uppdeteringen som gjordes senast är tillbaka, och sortering i datumordning skall nu vara ”snabb” igen.

Varje sökning länkas nu också till samma sökning hos Google, och en länk för att slå upp ordet hos Susning.nu har lagt till längst ner på söksidan. Inlänkarna från Susning har fixats till så att å,ä och ö, och andra konstiga tecken, fungerar. Detta ordnades genom ett annat sätt att vidarebefodra från nic-sys.se-domänen än tidigare; nu finns en servlet Search på nic-sys.se som bara skickar söksträngen vidare till frisim.se.

Geotargeting av nyheter

Posted in Frisim on april 4th, 2004 by Clas – Kommentering avstängd

Jag har haft funderingar på att koppla nyhtsartiklarna till ett geografiskt område, baserat på innehållet i artikeln. Tillsamman med information om var besökaren befinner sig så skulle mer intressanta/lokala nyheter kunna presenteras.

För att ta reda på var besökaren befinner sig skulle han/hon kunna mata in det i någon form av dialogruta. Ett smidigare sätt att göra det på är att basera det på IP-nummret hos användaren. Databaser som håller reda på geografisk plats hos varje IP-nummer finns, men de är inte 100%-igt korrekta och de kostar ofta pengar eftersom denna typ av ”targeting” är intressant i bl a annonseringssammanhang. Efter lite surfande hittade jag i alla fall hostip.info som är ett öppet projekt för kopplingen IP till stad över hela jorden. Stora delar av informationen samlas från databaser som ARIN och RIPE osv. Jag har provinstallerat databasen (225MB) på min dator. Databasen som den ser ut just nu har fokus på USA, men klarar, tack vara ARIN, RIPE osv att identifiera landet hos de flesta IP:n.

Bristen med hostip.info för mitt behov är att det bara finns 62 svenska städer med i databasen. Kan inte du bidra med ditt IP-nät-nummer och din stad till databasen? Databasen är som sagt öppen för alla att använda, gratis.

Uppdatering av Frisim

Posted in Frisim on april 4th, 2004 by Clas – Kommentering avstängd

En sökning på ”och”, sorterad i tidsordning, tog tidigare c:a 6 sekunder, nu tar samma sökning c:a 0.7 sekunder. Uppdateringen som gjorts är den som gjordes precis före den 21 januari (dvs., före diskhaveriet då vissa uppdateringar ”tappades” på grund av för gammal backup). Nu är denna ändring i alla fall tillbaka igen. Sökmotorn har dock blivit långsammare på att sortera små resultatmängder i tidsordning, men det gör inte så mycket eftersom de ändå inte belastar så hårt. Med denna modifiering skulle standard kunna vara sortering i tidsordning. Detta är dock inte fallet ännu.

Ytterligare en uppdatering har gjorts. Nu uppfattas en sökning på 1-0, utan citattecken, som en sökning på just ”1-0″. Tidigare har den uppattats som 1 -0, dvs 1 men inte 0, vilket varit lite snurrigt.