<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="wordpress/1.5.1.3" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
>

<channel>
	<title>Frisim utvecklingsblogg</title>
	<link>http://www.frisim.com/blog</link>
	<description>Detta är en utvecklingsblogg för Frisim nyhetssök  där vi dokumenterar dess utveckling och dess omvärld.</description>
	<pubDate>Wed, 02 Jul 2008 07:20:49 +0000</pubDate>
	<generator>http://wordpress.org/?v=1.5.1.3</generator>
	<language>sv</language>

		<item>
		<title>TT och källorna</title>
		<link>http://www.frisim.com/blog/2008/07/02/tt-och-kallorna/</link>
		<comments>http://www.frisim.com/blog/2008/07/02/tt-och-kallorna/#comments</comments>
		<pubDate>Wed, 02 Jul 2008 07:20:30 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Osorterad</category>
		<guid>http://www.frisim.com/blog/2008/07/02/tt-och-kallorna/</guid>
		<description><![CDATA[	Jag försöker ha lite koll på vad som skrivs om Google News i svenska tidningar. Jag använder RSS från Nyhetsfilter.com och mail-alarm från Aitellu (värsta nördnamnet på den tjänsten) och Newsmachine, dels för se vilken tjänst som fungerar bäst, dels också för att jag vill hitta inte missa något.  Det skrivs inte så mycket, [...]]]></description>
			<content:encoded><![CDATA[	<p>Jag försöker ha lite koll på vad som skrivs om <a href="http://news.google.com">Google News</a> i svenska tidningar. Jag använder RSS från <a href="http://www.nyhetsfilter.com/?q=%22google+news%22">Nyhetsfilter.com</a> och mail-alarm från <a href="www.aitellu.se">Aitellu</a> (värsta nördnamnet på den tjänsten) och <a href="http://www.newsmachine.se">Newsmachine</a>, dels för se vilken tjänst som fungerar bäst, dels också för att jag vill hitta inte missa något.  Det skrivs inte så mycket, och oftast nämns bara Google News i förbifarten när Googles alla tjänster listas. </p>
	<p>Som jag <a href="http://www.frisim.com/blog/2008/04/12/tt-eniro-google-news-agent25-och-kriget/">tidigare skrivit</a> så verkar inte <a href="http://www.tt.se">TT</a> så glada över svenska Google News. Till min stora förvåning så verkar det dock inte som om alla på TT har förstått vad Google News är för något. Häromdagen kablade <a href="http://www.ttspektra.se/">TTSpektra</a> ut en artikel som publicerades i rätt många nyhetssajter som köper TT-feeds. Artikeln finns bland annat i min lokaltidning <a href="http://www.corren.se/archive/2008/6/28/js2ff5pfzvmvndh.xml">Corren.se</a>. Artikeln innehåller texten (min markering):</p>
	<blockquote><p>Nobelpristagaren och frihetskämpen Nelson Mandela, som fyller 90 år den 18 juli, fanns självklart på hedersplats under konserten, <strong>rapporterar Google News</strong>.</p></blockquote>
	<p>Känns en aning skumt att TT hänvisar till Google News som en &#8220;rapporterande&#8221; källa. Google News aggregerar nyheter från andra sajter, och producerar inga enga rapporter alls. Ja ja, kanske är det bara en miss som kanske uppkommit på grund av sommarjobbare som tagit över nyhetsrapporteringen i Sverige.
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/07/02/tt-och-kallorna/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Google News och långsam utveckling</title>
		<link>http://www.frisim.com/blog/2008/06/26/google-news-och-langsam-utveckling/</link>
		<comments>http://www.frisim.com/blog/2008/06/26/google-news-och-langsam-utveckling/#comments</comments>
		<pubDate>Thu, 26 Jun 2008 22:33:20 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Osorterad</category>
		<guid>http://www.frisim.com/blog/2008/06/26/google-news-och-langsam-utveckling/</guid>
		<description><![CDATA[	I veckan har det publicerats en artikel hos New York Times som handlar om varför Google News inte växer så snabb som de andra Google-tjänsterna.
	Artikeln har sitt ursprung i att någon konstaterat att det tog mer än en timme för nyheten om bortgången av en NBC News reporter att dyka upp på framsidan av Google [...]]]></description>
			<content:encoded><![CDATA[	<p>I veckan har det publicerats en artikel hos <a href=”http://www.nytimes.com/2008/06/24/technology/24google.html?_r=2&#038;partner=rssnyt&#038;emc=rss&#038;oref=slogin&#038;oref=slogin”>New York Times</a> som handlar om varför <a href=””>Google News</a> inte växer så snabb som de andra Google-tjänsterna.</p>
	<p>Artikeln har sitt ursprung i att någon konstaterat att det tog mer än en timme för nyheten om bortgången av en NBC News reporter att dyka upp på framsidan av Google News. Google skyller på tekniska problem, men faktum är att jag tycker att det speglar lite hur en ”nyhetsaggregator” fungerar. Det tar säkert en halvtimme för en algoritm att avgöra om det är en ”viktig” nyhet eller inte.</p>
	<p>En nyhetsaggregator kan bara basera ”viktigheten” på vilken källa det är som publicerar, var på sajten nyheten visas, hur många andra källor som skriver om samma händelse, och i vilken ordning som källorna tar upp nyheten. Det är helt enkelt de nyhetsproducerande källorna som bestämmer vad som är viktigt, och en aggregeringssajt kan bara försöka följa efter så gott det går. Blandar man in andra typer av ”sociala tjänster” som t.ex. bloggar, mikrobloggar och sociala nätverk där folk länkar och kommenterar nyheter så har man ytterligare ett antal källor till att rangordna nyheternas ”viktighet”. Jag gissar att Google News använder sitt bloggsök, och de som pingar in sina uppdateringar till Google, inte bara för sitt bloggsök, utan även för att rangordna sina nyheter på Google News. Det gör även <a href=”http://www.frisim.com”>Frisim</a> och t.ex. <a href=”http://www.knuff.se/nyheter”>Knuff/nyheter</a>.</p>
	<p>Google säger att du får ut mycket av sin nyhetssökningsfunktion, och påpekar att de använder nyhetslänkar bland sina vanliga sökresultat, där de också visar annonser. John Battelle <a href=”http://battellemedia.com/archives/004510.php”>kommenterar</a> och tror att den svaga tillväxten för Google News beror på att Google fortfarande saknar en affärsmodell för nyheter. Och visst är det väl lite märkligt att Google inte har någon koppling mellan Google News och någon av sina video-tjänster.</p>
	<p>Många använder Google News, som är den 8:e största nyhetssajten med sina 11.4 miljoner besökare under maj månad. Många tycker också den fungerar bra, och i New York Times-artikeln intervjuas experter som tror att det inte går att göra så mycket bättre med en algoritm. Själv är jag inte lika imponerad. Det är inte funktionen i sig som jag tycker fungerar dåligt, utan problem ligger i att den svenska versionen har ganska få aktiva källor, samtidigt som det för mig som besökare är svårt att förflytta sig mellan den svenska och US-versionen av sajten. Dessutom tycker jag att det är synd att större bloggar inte räknas in bland nyhetsskällorna. Idag tittar jag hellre på <a href=”http://www.techmeme.com”>Techmeme</a> för att hitta dator-nörd-nyheter än på <a href=”http://news.google.se/nwshp?ned=us&#038;topic=t”>Google News Sci/Tech</a>. Skillnaden i hur Techmeme och Google News fungerar rent tekniskt tror jag inte är så stor (även om Techmeme eventuellt bara läsa RSS-data, medan Google News, precis som Frisim, läser hela webbsidor). Skillnaden ligger i vilka källor som är med. Ibland är bloggar och pressmeddelanden väl så intressanta att länkas vidare till som en nyhet på en ”nyhetssajt”. Tyvärr är det också uppenbart för mig när jag jämför dessa sajter, att antalet och bredden på källor som finns i Sverige jämfört med USA är stor. Sverige har ingen egen <a href="http://www.techcrunch.com">Techcrunch</a>, och heller ingen <a href0"http://www.nytimes.com">NYTimes</a>, ingen <a href=”http://www.nature.com”>Nature</a>, och definitivt ingen <a href=”http://www.boston.com/bigpicture/”>Boston.com/bigpicture</a>. (Appropå Nature så har de en <a href=”http://www.nature.com/news/2008/080625/full/4531149b.html?s=news_rss”>aktuell artikel</a> om <a href=”http://esciencenews.com/”>eScienceNews</a> som är en Google News som är nischad bara mot naturvetenskap.)</p>
	<p>Så hur kan en svensk nyhetsaggregeringssajt utvecklas? Kanske kan den göras bättre genom att samla in mer data från ”social media”-sajter där besökare länkar till nyhetsartiklar, kanske kan den bli bättre genom att förbättra funktionaliteten på metoderna för att koppla ihop nyheter med varandra, och kanske kan den bli bättre om man tillåts blanda in nyheter på engelska – eventuellt genom att först automatöversätta dem till svenska för att enklare kunna koppla ihop dem med eventuella svenska versioner. Men innan jag funderar mer så ska jag provprogrammera lite :-)
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/06/26/google-news-och-langsam-utveckling/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Från Woopra till Google Trends</title>
		<link>http://www.frisim.com/blog/2008/06/22/woopra-eller-google-trends/</link>
		<comments>http://www.frisim.com/blog/2008/06/22/woopra-eller-google-trends/#comments</comments>
		<pubDate>Sun, 22 Jun 2008 18:52:58 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Osorterad</category>
		<guid>http://www.frisim.com/blog/2008/06/22/woopra-eller-google-trends/</guid>
		<description><![CDATA[	Alla som har en webbsida vill ha koll på sin besöksstatistik, så är det bara. Det spelar ingen roll om sidan har få eller många besökare, av någon anledning så vill man alltid veta. Kanske känns statistiken viktigare om sidan har många besökare, eller om sidan omsätter mycket pengar, men även med få besökare och [...]]]></description>
			<content:encoded><![CDATA[	<p>Alla som har en webbsida vill ha koll på sin besöksstatistik, så är det bara. Det spelar ingen roll om sidan har få eller många besökare, av någon anledning så vill man alltid veta. Kanske känns statistiken viktigare om sidan har många besökare, eller om sidan omsätter mycket pengar, men även med få besökare och utan intäker så vill man &#8220;ha koll&#8221;. Jag har tidigare provat <a href="http://www.statcounter.com">Statcounter</a> och <a href="http://www.google.com/analytics">Google Analytics</a>. Dessa båda funkar rätt bra, Statcounter uppdaterar sin statistik &#8220;i realtid&#8221;, medan Google Analytics har ungefär en dags fördröjning. </p>
	<p>Lite beroende på vilken typ av sajt det gäller så är olika typer av statistik intressantare än annan. Har du t.ex. en e-butik så är du säkert intresserad av hur &#8220;surfvägen&#8221; för en besökare som köper skiljer sig från de som inte köper. Sånt kan man hålla koll på relativt enkelt med Google Analytics. Där kan man också göra så kallade A/B-test som gör att man kan utvärdera vilken av två versioner av en webbsida som &#8220;funkar bäst&#8221; (dvs kanske leder till flest köp, eller fler annonsvisningar). </p>
	<p>På Frisim använder jag  Google Analytics. Senaste veckan har jag också provat <a href="http://www.woopra.com">Woopra</a> som är en statstiktjänst som bygger på att man i realtid vill hålla koll på vad som händer på sajten. Statistiken tittar du på genom den Java-client som du kör lokalt på din dator. Programmet är snyggt och funkar bra. </p>
	<p><center><br />
<img src="http://www.frisim.com/images/woopra1.gif" alt="woorpa"/><br />
</center></p>
	<p>Från skärmbilden ovan kan man se att webbsidan där Woopra är installerat har 5 akriva besökare (dvs., 5 besök under de senaste c:a 30 sekunderna), varifrån de kommer (alla är från Sverige i mitt fall), och få en massa annan statistik om operativ och webbläsare.</p>
	<p>Jämfört med Google Analytics är dock Woopra mesigt. Ok, det är säkert lite cool att hålla koll på sina besökare i realtid, t.ex via den karta där dina besökare plottas upp, men det bygger nog på att du har massvis med besök från hela världen. För en sajt som Frisim, som bara har svenska besökare, så blir kartan rätt ointressant. Jag fick inte Woopra  att logga interna &#8220;exitsidor&#8221;  som görs med &#8220;redirects&#8221;, så jag har inte lyckats använda det för att hålla koll på vilka nyhetslänkar det är som besökaren klickar på. För att göra det måste jag även i fortsättningen använda egna script.</p>
	<p>Slutsatsen blir att Woopra säkert är lite kul om du har en internationell sajt med mycket besökare, men för en mindre svenska sajt så är det inte så användbart. För oss med små hemsidor, eller för dig som inte har någon hemsida alls, men ändå vill titta på webbsidesstatistik så är <a ref="http://trends.google.com/">Google Trends</a> för &#8220;websites&#8221; intressant. Där kan du t.ex. konstatera att Allaannonser.se <a href="http://trends.google.com/websites?q=sesam.se%2C+allaannonser.se&#038;geo=all&#038;date=all&#038;sort=0">ser ut att ha fler besökare</a> än Sesam.se.
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/06/22/woopra-eller-google-trends/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Allt och inget</title>
		<link>http://www.frisim.com/blog/2008/06/15/allt-och-inget/</link>
		<comments>http://www.frisim.com/blog/2008/06/15/allt-och-inget/#comments</comments>
		<pubDate>Sun, 15 Jun 2008 20:56:31 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Osorterad</category>
		<guid>http://www.frisim.com/blog/2008/06/15/allt-och-inget/</guid>
		<description><![CDATA[	Många bloggare är intresserade av att kommentera det kommande beslutet om FRA ska ha rätt att bedriva &#8220;signalspaning&#8221; i kabelbunden trafik (dvs, övervaka internettrafiken i Sverige). Knuff.se är den självklara samlingsplatsen för blogginläggen. Nu verkar det dock gått lite över styr och den så kallade Knuff-bombningen verkar ha gjort att Knuff just nu nöjer sig [...]]]></description>
			<content:encoded><![CDATA[	<p>Många bloggare är intresserade av att kommentera det kommande beslutet om FRA ska ha rätt att bedriva &#8220;signalspaning&#8221; i kabelbunden trafik (dvs, övervaka internettrafiken i Sverige). <a href="http://www.knuff.se">Knuff.se</a> är den självklara samlingsplatsen för blogginläggen. Nu verkar det dock gått lite över styr och den så kallade <a href="http://tianmi.info/blogge/posts/08/06/15/Knuffbombning/">Knuff-bombningen</a> verkar ha gjort att Knuff just nu nöjer sig med att bara länka till nyhetsartiklar (precis som Frisim alltid gör). Lite synd, men så har jag ju ingen aning om vilken trafik/press som Knuff utsätts för.</p>
	<p>&#8212;</p>
	<p>Svagt relaterat till ovanstående om FRAs befogenheter så har <a href="http://www.twinly.com">Twingly</a> lanserat sin bloggsökmotor <a href="http://www.twingly.com">Twingly</a> i veckan. Ironiskt nog så ger en sökning på just <a href="http://twingly.com/search?q=fra">FRA</a> inga resultat alls. Lite otur kanske? Annars lovar Twingly gott, och inte minst trevligt är det att det är ett Linköpingsföretag. </p>
	<p>&#8212;</p>
	<p><a href="http://www.mindpark.se">Mindpark</a> har, för första gången, lanserat en &#8220;tjänst&#8221; - ett <a href="http://www.mindpark.se/sok/">Mediesök</a>. Det är en söksida som bygger på <a href="http://www.google.com/coop/cse/">Google CSE/Site search</a>. Googles Site Search verkar erbjuda en del riktigt schyssta funktioner för sina betalande ($100 per år) användare, som t.ex. möjlighet att påverka ordningen i vilken sökresultaten kommer. Mina gamla försök med gratisversionen av Google CSE <a href="http://www.nyhetr.se">för nyheter</a> blev <em>inte</em> så bra. Jag tror att &#8220;Mediesök&#8221; skulle förbättras avsevärt om listan med källor fanns tillgänglig.</p>
	<p>&#8212;-</p>
	<p>För några veckor sedan så lade <a href="http://www.bbc.co.uk">BBC</a> upp samlingssidor under namnet <a href="http://bbc.co.uk/topics">BBC/Topics</a> som <a href="http://www.bbc.co.uk/blogs/bbcinternet/2008/06/bbc_topics_in_beta.html">beta-version</a>. Samlingssidorna är automatgenererade och syftar till att samla ihop allt material som BBC har på sin sajt inom utvalda teman och runt &#8220;kända&#8221; personer. En kortare funktionsbeskrivning finns i <a href="http://www.bbc.co.uk/blogs/bbcinternet/2008/06/bbc_topics_in_beta.html">deras blogg</a>.  Jag tror att denna typ av sidor borde kunna fungera bra även för svenska sajter som SR, TV4 och SVT. </p>
	<p>BBC har också mycket annat kul på sina &#8220;backstage&#8221;-sidor. Till exempel så finns där ett test-sida för att använda <a href="http://lucene.apache.org">Lucene</a> och <a href="http://www.wikipedia.org">Wikipeda</a> för att göra <a href="http://www.bbc.co.uk/blogs/radiolabs/2008/06/wikipedia_plus_lucene_morelikethis.shtml">automatisk taggning av texter</a>. Spännande, men lite för långsam för att det ska fungera i drift, tror jag. (<a href="http://del.icio.us/mymarkup">källa</a>.)</p>
	<p>&#8212;</p>
	<p>Det svenska företaget med det schyssta namnet <a href="http://www.tailsweep.com">Tailsweep</a> fortsätter att bygga på sin sökmotor. En massa detaljer hittar du på <a href="http://www.mail-archive.com/solr-user@lucene.apache.org/msg11336.html">Lucene/Solr</a>-maillistan.</p>
	<p>&#8212;</p>
	<p>Och eftersom alla läsare av denna utvecklingsblogg är väldigt intresserade av att se hur det ser ut på den plats där <a href="http://www.frisim.com">Frisim</a> utvecklas så kommer här en bild :-)<br />
<center><br />
<img src="/images/P1000432.JPG" alt="frisim dev zone" /><br />
</center>
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/06/15/allt-och-inget/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Newsmill - kan det bli något?</title>
		<link>http://www.frisim.com/blog/2008/06/10/newsmill-kan-det-bli-nagot/</link>
		<comments>http://www.frisim.com/blog/2008/06/10/newsmill-kan-det-bli-nagot/#comments</comments>
		<pubDate>Tue, 10 Jun 2008 22:15:20 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Osorterad</category>
		<guid>http://www.frisim.com/blog/2008/06/10/newsmill-kan-det-bli-nagot/</guid>
		<description><![CDATA[	De flesta stora svenska nyhetssajter som kommer från &#8220;pappersvärlden&#8221;. De jag tänker på som inte gör det är möjligen DagensPS, Realtid, IDG, som är många tidningar, och TV-nyhetssajterna från TV4 och SVT och deras undersajter. Jag har uppfattningen att engelska och amerikanska nyhetssajter som inte har eller har haft någon pappersupplaga är betydligt fler och [...]]]></description>
			<content:encoded><![CDATA[	<p>De flesta stora svenska nyhetssajter som kommer från &#8220;pappersvärlden&#8221;. De jag tänker på som <em>inte</em> gör det är möjligen <a href="http://www.dagensps.se">DagensPS</a>, <a href="http://www.realtid.se">Realtid</a>, <a href="http://www.idg.se">IDG</a>, som är många tidningar, och TV-nyhetssajterna från TV4 och SVT och deras undersajter. Jag har uppfattningen att engelska och amerikanska nyhetssajter som inte har eller har haft någon pappersupplaga är betydligt fler och många av dessa är riktigt stora. Flera av dessa sajter kallas visserligen &#8220;flerpersonsbloggar&#8221;, men skillnaden mellan dessa och en svensk nyhetssajter känns relativt liten.</p>
	<p>PM Nilsson och Leo Lagercrantz startar snart tillsammans med Bonnier med flera sajten <a href="http://www.newsmill.se">Newsmill</a>. Enligt beskrivningar på mediasajterna <a href="http://www.resume.se/nyheter/2008/06/09/pm-och-leo-gor-svensk-huff/index.xml">Resumé</a> och  <a href="http://www.dagensmedia.se/mallar/dagensmedia_mall.asp?version=171665">Dagens media</a> så har Newsmill den amerikanska &#8220;nyhetsbloggen&#8221; <a href="http://www.huffingtonpost.com">Huffingtonpost</a> som förebild. Det låter som ett bra mål om man vill starta en blogg med nyhetsfokus, kombinerat med nyheter och användarkommentarer, eftesom den är störst; bloggen är den med störst auktoritet (antal inlänkningar?) enligt <a href="http://technorati.com/pop/blogs?type=links">Technoratis topp 100-lista</a>. En annan <a href="http://www.journalisten.se/artikel/16256/aeven-nyheter-pa-bonniers-debattsajt">inspirationskälla sägs</a> vara <a href="http://www.newsvine.com">Newswine</a> som också innehåller en hel den &#8220;användargenererade&#8221; nyheter. (Jag betatestade Newsvine innan den <a href="http://www.frisim.com/blog/2006/03/03/mobila-nyheter/">lanserades</a> i mars 2006.)</p>
	<p>Förhoppninsvis innebär Newsmill.se att vi får se &#8220;den nya typen&#8221; av nyhetssajt (eller debattsajt, som <a href="http://www.journalisten.se/artikel/16256/aeven-nyheter-pa-bonniers-debattsajt">Jounalisten</a> kallar den) anpassad för svenska nyheter. Kanske blir det inte mer än en re-write sajt av DagensPS-snitt men med lite bättre placering av läsarkommentarerna, men lite spännande blir det.</p>
	<p>Newsmill.se har en <a href="http://pmnilsson.wordpress.com/">blogg</a> där man kan följa en liten del av utvecklingen.
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/06/10/newsmill-kan-det-bli-nagot/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Rundgång i nyhetsinsamlandet</title>
		<link>http://www.frisim.com/blog/2008/06/09/rundgang-i-nyhetsinsamlandet/</link>
		<comments>http://www.frisim.com/blog/2008/06/09/rundgang-i-nyhetsinsamlandet/#comments</comments>
		<pubDate>Mon, 09 Jun 2008 22:05:38 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Frisim</category>
		<guid>http://www.frisim.com/blog/2008/06/09/rundgang-i-nyhetsinsamlandet/</guid>
		<description><![CDATA[	För första gången i Frisims historia har jag noterat att det har blivit &#8220;rundgång&#8221; i nyhetsinsamlandet. Jag noterade att domänan Frisim.com plötsligt flaggades som en av de domäner som betraktas som nyhetskälla till Frisim (inte bara blogg-källa alltså). Det verkade konstigt&#8230; Anledningen till att det kan hända är att någon blogg har länkat till en [...]]]></description>
			<content:encoded><![CDATA[	<p>För första gången i Frisims historia har jag noterat att det har blivit &#8220;rundgång&#8221; i nyhetsinsamlandet. Jag noterade att domänan Frisim.com plötsligt flaggades som en av de domäner som betraktas som nyhetskälla till Frisim (inte bara blogg-källa alltså). Det verkade konstigt&#8230; Anledningen till att det kan hända är att någon blogg har länkat till en nyhetsartikel genom att klippa och klistra in ett par nyhetslänkar som leder via Frisims klickräknings-script. Eftersom Frisim tyckte sig &#8220;förstå&#8221; att länken går till en nyhet, och då URL:en inte finns indexerad så indexeras den (igen) och Frisim står som ägare och adderas därför bland källorna.<br />
<center><br />
<img src="http://www.frisim.com/images/rundgang.gif" alt="rundgång"/><br />
</center><br />
Det resulterar bl.a. i att en sökning begränsad till domänen frisim.com (som i bilden ovan) visar att det finns två nyheter från nyhetskällan Frisim. Klick på dessa nyheter kommer dessutom att passera klickräknings-scriptet två gånger.  Buggen kommer förhoppningsvis inte att dyka upp så ofta, men den visar i alla fall att konstigheter kan inträffa är man programmerar sökmotorer, som om jag inte redan visste det ;-)
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/06/09/rundgang-i-nyhetsinsamlandet/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Coola saker att göra när jag orkar ta mig tid</title>
		<link>http://www.frisim.com/blog/2008/05/28/coola-saker-att-gora-nar-jag-far-tid-over/</link>
		<comments>http://www.frisim.com/blog/2008/05/28/coola-saker-att-gora-nar-jag-far-tid-over/#comments</comments>
		<pubDate>Wed, 28 May 2008 20:37:55 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Osorterad</category>
		<guid>http://www.frisim.com/blog/2008/05/28/coola-saker-att-gora-nar-jag-far-tid-over/</guid>
		<description><![CDATA[	Google öppnar imorgon Google App Engine för alla, samtidigt som de tar bort begränsningen på max 500MB lagrad data. Prislistan blir:
	Användare får betala mellan 10 till 12 cent per processorkärna och timme samt mellan 15 till 18 cent per gigabyte lagrad data och månad. Till det kommer trafikavgifter. 11 till 13 cent per utgående gigabyte [...]]]></description>
			<content:encoded><![CDATA[	<p>Google öppnar <a href="http://www.idg.se/2.1085/1.164737">imorgon</a> Google App Engine för alla, samtidigt som de tar bort begränsningen på max 500MB lagrad data. Prislistan blir:</p>
	<blockquote><p>Användare får betala mellan 10 till 12 cent per processorkärna och timme samt mellan 15 till 18 cent per gigabyte lagrad data och månad. Till det kommer trafikavgifter. 11 till 13 cent per utgående gigabyte och mellan 9 till 11 cent per ingående gigabyte.</p></blockquote>
	<p>När jag har tid vill jag flytta in term-vector-data från Frisims index till Googles &#8220;datastore&#8221; Big Table  för lagring, och använda Google App Engine för att beräkna nyhetskluster. </p>
	<p>&#8212;&#8212;&#8212;&#8212;</p>
	<p>Amazon har färdiga images för att köra <a href="http://wiki.apache.org/hadoop/AmazonEC2">Hadoop på EC2</a>. När jag får tid ska jag sätta upp ett litet kluster av Hadoop-noder och se hur det fungerar. <a href="http://developer.amazonwebservices.com/connect/entry.jspa?externalID=873">Amazon EC2</a> har också färdiga &#8220;images&#8221; av operativsystem för att köra Hadoop MapReduce för distribuerade datahantering. När jag har tid ska jag prova hur denna typ av distribuerade processning fungerar i ett litet Amazon EC2-kluster. Vet inte rikitgt vilken typ av nyhetsdataanalys som är intressant att gör på dessa vis, men det ska nog gå att hitta på något.</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/05/28/coola-saker-att-gora-nar-jag-far-tid-over/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Eniro, RSS och åter RSS</title>
		<link>http://www.frisim.com/blog/2008/05/22/eniro-rss-och-ater-rss/</link>
		<comments>http://www.frisim.com/blog/2008/05/22/eniro-rss-och-ater-rss/#comments</comments>
		<pubDate>Thu, 22 May 2008 21:09:45 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Osorterad</category>
		<guid>http://www.frisim.com/blog/2008/05/22/eniro-rss-och-ater-rss/</guid>
		<description><![CDATA[	Eniro lanserar sin Supersök. Det innebär att man, likt Sesam, får se sökträffar från flera av Enrios databaser på en och samma sökning. Nyhetsresultat finns också med. 
	Gota media bestämmer sig för att skicka med hela hela artiklarna i flera av sina tidningars RSS-feeds. Jag har skivit om hela artiklar i RSS tidigare. De väljer [...]]]></description>
			<content:encoded><![CDATA[	<p>Eniro lanserar sin <a href="http://www.eniroblogg.se/supersok-mitt-i-prick/">Supersök</a>. Det innebär att man, likt Sesam, får se sökträffar från flera av Enrios databaser på <a href="http://www.eniro.se/query?search_word=wii&#038;geo_area=&#038;what=all&#038;lang=&#038;ax=">en och samma sökning</a>. Nyhetsresultat finns också med. </p>
	<p>Gota media bestämmer sig för att skicka med hela <a href="http://www.networkers.se/2008/05/varsgod-hela-texten-i-rss-fldet.html">hela artiklarna</a> i flera av sina tidningars RSS-feeds. Jag har skivit om hela artiklar i RSS <a href="http://www.frisim.com/blog/2008/03/02/nyhetssajter-och-rss-feeds/">tidigare</a>. De väljer dock att inte ta med hela artikeln om det är så att den kommer från TT, av någon anledning.</p>
	<p>Konceptet på <a href="http://www.aiderss.com/">AideRSS</a> fascinerar mig. Jag funderar lite smått på om det inte går att göra en liknande tjänst fokuserad på svenska nyheter. Tanken blir då att du tar en eller flera RSS-feeds från en eller flera tidningar och tjänsten mixar ihop den till en, men den lägger bara in sådana inlägg (nyheter) som har väckt viss uppmärksamhet från &#8220;andra nyhetsläsare&#8221;. Mått på uppmärksamhet bygger  man nog enklast genom att samla data från tjänster som del.icio.us, jaiku, twitter och från bloggar. Låter det användbart?
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/05/22/eniro-rss-och-ater-rss/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Techmeme sökbar med Lucene</title>
		<link>http://www.frisim.com/blog/2008/05/20/techmeme-sokbar-med-lucene/</link>
		<comments>http://www.frisim.com/blog/2008/05/20/techmeme-sokbar-med-lucene/#comments</comments>
		<pubDate>Tue, 20 May 2008 21:34:45 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Sökmotorer</category>
		<guid>http://www.frisim.com/blog/2008/05/20/techmeme-sokbar-med-lucene/</guid>
		<description><![CDATA[	Min favorit bland engelskspråkiga teknik-nyhets-insamlar-sidor Techmeme har idag lagt till en sökruta. De verkar använda Lucene som sökmotor.
]]></description>
			<content:encoded><![CDATA[	<p>Min favorit bland engelskspråkiga teknik-nyhets-insamlar-sidor <a href="http://www.techmeme">Techmeme</a> har <a href="http://www.techcrunch.com/2008/05/20/techmeme-is-finally-searchable/">idag</a> lagt till en <a href="http://www.techmeme.com/search">sökruta</a>. De verkar använda <a href="http://lucene.apache.org">Lucene</a> som sökmotor.</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/05/20/techmeme-sokbar-med-lucene/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Sphinx, Lucene och&#8230; Minion</title>
		<link>http://www.frisim.com/blog/2008/05/20/sphinx-lucene-och-minion/</link>
		<comments>http://www.frisim.com/blog/2008/05/20/sphinx-lucene-och-minion/#comments</comments>
		<pubDate>Tue, 20 May 2008 21:05:56 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Sökmotorer</category>
		<guid>http://www.frisim.com/blog/2008/05/20/sphinx-lucene-och-minion/</guid>
		<description><![CDATA[	Sun har lanserat en sökmotor vid namn Minion som &#8220;open source&#8221;.  Minion ser lite intressant ut. Flera av de &#8220;finesser&#8221; som finns, som lagom smart &#8220;stemming&#8221;, verkar bara vara utprovat för engelska tyvärr. Tydligen ska indexeringen vara snabbare med Minion än med Lucene, men ingen jämförelse finns med t.ex. Sphinx.
	Snubben som verkar jag gjort [...]]]></description>
			<content:encoded><![CDATA[	<p><a href="http://www.sun.com">Sun</a> har <a href="http://blogs.sun.com/searchguy/entry/minion_an_open_source_search1">lanserat</a> en sökmotor vid namn <a href="https://minion.dev.java.net/">Minion</a> som &#8220;open source&#8221;.  <a href="https://minion.dev.java.net/">Minion</a> ser lite intressant ut. Flera av de &#8220;finesser&#8221; som finns, som lagom smart &#8220;stemming&#8221;, verkar bara vara utprovat för engelska tyvärr. Tydligen ska indexeringen vara <a href="http://blogs.sun.com/searchguy/entry/minion_and_lucene_performance">snabbare</a> med Minion än med Lucene, men ingen jämförelse finns med t.ex. <a href="http://www.sphinxsearch.com">Sphinx</a>.</p>
	<p>Snubben som verkar jag gjort större delen av jobbet bloggar om jämförelser mellan <a href="http://lucene.apache.org">Lucene</a> och Minion på sin <a href="http://blogs.sun.com/searchguy/tags/lucene">Sun blogg</a>. Där länkar han bl.a. till en <a href="http://stream.fas.harvard.edu/ramgen/permanent/IIC/Seminars/04.02.2008.rm">föreläsningsfilm</a> som tar upp lite typiska sökmotorkonstruktionsproblem, men den handlar tyvärr inte om Minion specifikt.
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/05/20/sphinx-lucene-och-minion/feed/</wfw:commentRSS>
	</item>
		<item>
		<title>Jaikugenererad Google-intervju</title>
		<link>http://www.frisim.com/blog/2008/05/16/google-intervju/</link>
		<comments>http://www.frisim.com/blog/2008/05/16/google-intervju/#comments</comments>
		<pubDate>Fri, 16 May 2008 18:06:50 +0000</pubDate>
		<dc:creator>Clas</dc:creator>
		
	<category>Sökmotorer</category>
		<guid>http://www.frisim.com/blog/2008/05/16/google-intervju/</guid>
		<description><![CDATA[	Jag skrev tidigare lite om svenska Google News och spekulationerna om att den inte innehåller artiklar från TT.
	Bison@Jaiku lät meddela att han skulle intervjua de två &#8220;publika&#8221; personer som jobbar på Google Sverige, och ville ha frågor till intervjun från Jaiku-användare.  Jag kunde inte hålla mig, och önskade att han frågade dem om ryktet [...]]]></description>
			<content:encoded><![CDATA[	<p>Jag skrev tidigare lite om svenska <a href="http://news.google.se">Google News</a> och <a href="http://www.frisim.com/blog/2008/04/12/tt-eniro-google-news-agent25-och-kriget/">spekulationerna</a> om att den inte <a href="http://www.greenhillrelations.se/2008/03/28/tt-censurerar-google-i-hemlighet">innehåller artiklar från TT</a>.</p>
	<p>Bison@Jaiku lät meddela att han skulle intervjua de två &#8220;publika&#8221; personer som jobbar på Google Sverige, och ville ha <a href="http://bison.jaiku.com/presence/34058325#c-1088036">frågor till intervjun från Jaiku-användare</a>.  Jag kunde inte hålla mig, och önskade att han frågade dem om ryktet om Google News och TT var sant. Bison-Fredrik ställde den frågan, och många andra, och presenterar intervjun <a href="http://bisonblog.blogs.com/blog/2008/05/jaikububblan-vs.html<br />
">på sin blogg</a>. På frågan som Google News så var svaret detta:</p>
	<blockquote><p><i>Michael Zackrisson: Varför är svenska Google News så sunkig? Finns några ambitioner att göra den mer heltäckande? Och att t ex. låta användare söka i flera olika språk? Clas Rydergren: Det vore intressant att höra hur ni ser på utvecklingen av Google News Sverige utan samarbete med TT.</i></p>
	<p>Nicklas: Meh! Sunkig? Det tycker inte jag den är, men okej, jag är ju partisk. Tricket är ju att en nyhetsaggregator blir ju bättre ju fler källor den har och det där kan växa över tid. Vi utvecklar den även genom olika samarbeten. Om vi har missat någon bra nyhetskälla får ni gärna tipsa om den så att vi kan lägga in den och göra tjänsten ännu bättre.</p></blockquote>
	<p>Zackrisson@Jaiku, som ställde första-frågan, bloggar om svaret hos <a href="http://www.va.se/asikter/bloggar/natet/2008/05/16/pa-google-ar-till-och-med-/">VA.se</a>. Även <a href="http://www.frisim.com/nyhetssok/?searchString=google+intervju+jaiku">andra</a> har kommenterat intervjun. </p>
	<p>Nu blev svaret på Google News-frågan inte så intressanta, men sättet att få ihop intervjufrågor är intressant. Speciellt intressant blir det på grund av att Bison@Jaiku har många &#8220;kompisar&#8221; bland sina Jaiku- followers som är relativt väl insatta i Googles verksamhet.
</p>
]]></content:encoded>
			<wfw:commentRSS>http://www.frisim.com/blog/2008/05/16/google-intervju/feed/</wfw:commentRSS>
	</item>
	</channel>
</rss>
