Archive for december, 2007

Trendgrafer

Posted in Frisim on december 26th, 2007 by Clas – Kommentering avstängd

Frisim har nu en trendgraf på startsidan. Graferna skapas med hjälp av Google Chart API och beräknas och genereras i realtid. Orden som ska användas slumpas fram ur en mindre mängd för-specificerade ord.

Nyhets- och blogg-trendgrafer

Posted in Frisim on december 23rd, 2007 by Clas – Kommentering avstängd

I brist på fler julklappar att slå in så har jag istället provat Googles nya graf API. Tanken är att funktionen skulle gå att använda för att skapa trendgrafer över hur vanligt ett sökord är över tiden bland blogginlägg och nyhetsartiklar.


graf-julklappar

Grafen visar antalet nyheter respektive blogginlägg som innehåller ordet ”julklappar” under de senaste fyra veckorna. Data är inte normerat på något vis, men det är uppenbart från grafen att just ordet julklappar verkar förekomma ungefär lika ofta bland de nyhets- och bloggdata jag samlar in. Dessutom verkar det vara viss korrelation mellan dem. Kanske är det till och med så att om det skrivs mycket om just julklappar på nyhetssajterna en viss dag så skriver också många bloggare om det samma dag? Eller är det möjligen tvärt om? ;-)

Rent tekniskt så måste två ”sökningar” göras för att skapa en tredgraf som den ovan, en sökning för bara nyheter och en sökning för bara bloggar. Jag behöver inte hämta upp själva sökresultaten, utan grafen är skapad från data av två datum-fasett-resultat. Jag är lite osäker på hur snabbt dessa fasetter skapas och innan jag lägger upp möjligheter att skapa grafer publikt så måste jag nog undersöka lite mer så att jag inte inför någon flaskhals i onödan.

Googles API verkar fungera ganska bra. Det enda jag saknar är möjligheten att få små ”tick-marks” på x-axeln. De dyker upp per automatik på y-axeln, men verkar inte gå att sätta på x-axeln i grafer av typen ”line chart”.

Frisim uppdaterad

Posted in Frisim on december 16th, 2007 by Clas – 1 Comment

Frisim.com är nu uppdaterad till det jag kallar Frisim2. Jag har provkört en testversionFrisim.se-domänen ett tag, och det har för det mesta fungerat väl. Nu får vi se hur det fungerar när det görs lite fler sökningar.

Det som skiljer den nya versionen från den gamla är ett lite ändra grafiskt upplägg men framförallt att även bloggar är sökbara. Detaljer som är ändrade är att de nyheter som listas under ”Aktuellt”-fliken är aktuella nyheter som det har länkats till från många bloggar. Vilka bloggar det är som länkar syns i den länklist som finns i anslutning till nyhetslänken.


aktuellt

De bloggar som vill vara med och påverka vilka nyheter som dyker på får gärna pinga in sina inlägg till vår Ping-lista.

pinglista

Vid sökningar så presenteras nu sökresultaten i datumordning. I resultatlistan är nyheter och bloggar blandade, men det går bra att begränsa till bara nyheter eller bara bloggar genom att klicka på en kategori ute till höger på resultatsidan.

fasett

Ute till höger på resultatsidan så går det också att klicka en någon av de källor där matchande dokument har hittats. Genom att klicka på en av källorna så visas bara resultat från den källan. Till varje sökresultat sida ett kort utdrag av nyheten, dels en bit av ingressen, dels en liten snutt runt sökordet för att ge lite mer information om i vilket sammanhang som sökordet förekommer.

Du får gärna kommentera det nya utseendet eller funktionen hos den nya versionen, endera här eller genom mail till clas@nic-sys.se.

När det kommer till det tekniska så är det antagligen en del som inte fungerar riktigt som det gjort tidigare. Det har blivit uppenbart att det inte är så lätt att flytta en sajt från en server till en annan. Själv sökmotordelen var lättflyttad, det bara bara Java-kod så där gäller det mest att hålla koll på sökvägar och URLs. Även Servlet-motorn (tidigare Tomcat4, nu Tomcat5) är enkel att uppdatera eftersom det går bra att ha båda versionerna installerade samtidigt, och när allt är uppsatt är det bara att stänga den ena ”servicen” och starta upp den andra – inga problem. Värre är Apache-PHP och dess extra-bilbiotek. För att få XMLRPC att fungera blev jag tvungen att uppdatera till en ny PHP-version. Teckenkodning är också ett ständigt problem- jag fattar inte varför tre små svenska bokstäver (och tre stora) ska behöva ställa till det.

I och med denna uppdatering lagras inte längre några sökdata i MySQL, utan data lagras bara i sökindexet. I och med denna uppdatering så har också uppdelningen mellan sökmotor och front-end blivit bättre. Uppdelningen av sökmotor och front-end gör dels att sökningar kan cachas bättre och därmed bli snabbare, dels att det kommer att bli enklare att sprida indexet över flera datorer om det skulle behövas.

Djuplänka bostadssajter?

Posted in Osorterad on december 14th, 2007 by Clas – Kommentering avstängd

Di.se skriver om att djuplänkning fortfarande upprör, i alla fall i mäklarbranschen. Hemnet.se verkar vara sugna på att prova om de har lagen på sin sida när de inte vill tillåta länkningar direkt till deras bostadsannonser.

Sydsvenskan liiite avundsjuka på Knuff.se

Posted in Osorterad on december 14th, 2007 by Clas – 1 Comment

Andreas Ekström, lite känd i bloggvärlden för sitt ”klavertramp” om personen bakom sajten Knuff.se har grävt lite till.

I sin blogg berättar han om årsredovisningen från det enmansföretag som skapat och driver just Knuff.se. Artikeln om årsredovisningen finns i dagens Sydsvenskan. Enmansföretaget ska tydligen omsätta en dryg halvmiljon på en handfull sajter. Det låter inte orimligt, och jag gissar på att 99% av intäkten kommer från annonsering på webbbsidorna. Så mycket jobb som är nedlagt på just dessa sajter så är jag inte alls förvånad att det går att få in 50kkr per månad i annonsintäkter med hjälpa av så många bra och välbesökta sajter. Att sajterna tillsammans skulle vara värda 5-10 miljoner låter också helt okej. Det är alltid spännande att läsa om hur de ekonomiska möjligheterna för bloggar och bloggtjänster riktade mot enbart svenska användare ser ut.

Nu väntar vi bara på att Sydsvenskan eller Mindpark ska lansera sin egen Knuff-kopia. ;-)

Lite nertid skadar bara lite…

Posted in Frisim on december 5th, 2007 by Clas – Kommentering avstängd

Frisim har varit nere mellan 22:32 och 00:04 på grund av brand i serverhallen.

Knappt en vecka efter det att jag flyttat Frisim-servern till ny co-location så får den lilla burken vara med om en brand. Inte illa ;-) Tursamt nog klarade den sig bra, och efter lite avtorkning av släckningsdimma i serverhallen så gick den att få igång igen, som vanligt efter lite trixande. Som vanligt när servern går ner så får jag mig en genomgång av hur backup-rutinerna fungerar :-)

Sökresultat

Posted in Sökmotorer on december 3rd, 2007 by Clas – Kommentering avstängd

Det finns olika sätt att presentera sökresultat på – men nästan alla text-sökmotorer presenterar dem på samma sätt! I mitt tidigare inlägg om kattungar så listade jag ett antal bloggsökmotorer. Ingen av dem är så nydanande när det gäller att presentera sökresultaten. Gissningsvis beror det på att alla är så vana vid hur Google presenterar sin sökreultat, så om det inte ser ut som hos Google så är det ingen som känner igen det som just sökresultat.

Även svenska Sesam liknar Google. Sesam har dock ett antal systersajter som använder sig av ”anpassade” sökresultat. Dessa systersajter, delvis sådana som finns inom Schibstedkoncernen, är nyhetssajter som använder Sesams nyhetssökning för att visa sajtsökningsresultat. Systersajterna är Aftonbladet, Metro, SvD och fz.se. Sökresultatsidorna hittar du på Aftonbladet, Metro, SvD och fz.se.

Sökresultatsidorna på systersajterna har lite olika utseende, och features. Utseendet är anpassat för att passsa huvudsajten, men det skiljer även i vissa features som hur ”fasetterna” som visar nyhetskategorier fungerar. Hos Metro verkar kategorierna vara automatgenererade, vilket jag anar när jag ser kategorier som ”Digitalt”, ”Pdf”, ”sok”, ”Rubriker”, ”Kontakt” och ”Annonsera i Metro”. Hos Aftonbladet fungerar det lite bättre, och där känner jag igen kategorierna från sajtens menyer. Längst upp bland Aftonbladets sökresultat finns länkar till relaterade(?) resultat hos Aftonbladet Webb-tv – snyggt! SvD visar inga kategorier alls, men visar hela sitt normala menysystem på sökresultatsidan. Snyggast är sökresultatsidan för fz.se. Där finns bilder till de resulat som förknippas med speltitlar, och av de kategorier som visas framgår att det inte bara är nyhetsartiklar och recensioner som är sökbara, utan även inlägg i sajtens forum. På sökresultatsidan hos fz.se så kan man även begränsa sökningen till ett givet år, månad och dag, genom att begränsa i den kategorivalsliknande menyn. Rätt snyggt, om än inte supersmidigt.

Undrar hur jag kan förfina Frisims sökresultatsidor