Archive for september, 2005

Trendgrafer

Posted in Frisim on september 27th, 2005 by Clas – Kommentering avstängd

Idag har jag (förhoppningsvis) fixat det sista på mina trendgrafer. Sökningar där det passar att visa en trendgraf länkas med en Visa trendgraf-bild uppe till höger på SERP-sidan.

Till varje trendgraf länkas till knuff.se:s motsvarighet. Tyävrr verkar det inte gå att länka direkt till Knuffs sida med grafer, utan länken går bara till söksidan.

Söndagshack: Trendgrafer

Posted in Frisim on september 25th, 2005 by Clas – Kommentering avstängd

Trendgrafer har vi sett för söksajter förut. De flesta digitala omvärldbevakningssajterna har dessa i en eller annan form, allt från otroligt avancerade till enkla. De trendgrefer (eller tidslinjer?) som jag har implementerat är av den enkla typen. En trendgraf för [Google] ger detta resultat:

Google-trend

Som sagt, trendgrafer är inget nytt, och det är uppenbart att jag har hämtat inspiration till utseendet på grafen från de grafer som finns på Knuff.se. Koden som jag använder har jag, naturligtvis, gjort själv. Kanske skulle det vara intressant att jämföra trendgrafer för bloggar och för nyheter. Ska fundera lite mer på det. Just nu är min trendgraf bara hälften så lång som den hos Knuff.se vilket gör en grafisk jämförelse lite svårt, men det är ju lätt fixat.

Tyvärr blev koden inte riktigt klar för publik användning. Eftersom sökningarna som används för att generera trendgrafen tar samma sök-syntax som Frisims vanliga sökningar kan man t.ex. skapa en graf för att se hur många artiklar vi har samlat in från en specifik källa. En sökning på www.corren.se ger följande graf:

Corren-trend

Det ser alltså ut som om vi samlar in c:a 160 artikelsidor om dagen från Corren en vardag, och ungefär hälften under helgdagar.

Blocket vs. Allaannonser och teaser-annonser

Posted in Sökmotorer on september 22nd, 2005 by Clas – 1 Comment

Idag har tingrätten givit ett första uttalande (ett interimistisk beslut och frågan inte är slutgiltigt avgjord) om den stämning mellan den som äger sajterna Blocket och sajten Allaannonser. Blocket tycker i stämningen, kortfattat, att Allaannonser missbrukar Blockets annonser genom att visa upp text och ingess till annonsen, tillsammans med en länk, och att de gör intrång i deras databas genom att samla in Blockets annonser.

Tingsrätten, som jag tolkar det, friar Allaannonser, och gör det därmed ok att samla in och visa rubriker och delar av övrig information på en annan kommersiell sajt. Flera nyhetssajter har skivit mer i detalj om vad stämningen gäller.

Intressant att notera är att Blocket verkar fått rätt i det att det inte anses ”fair use” att länka via vad Dagens media kallar för ”teaser-annonsering”. Förstår jag det rätt så innebär ”teaser-annonsering” att en besökare som klickar på en länk som ser ut att leda till Blocket först leds till en annan webbsida som delvis innehåller reklam.

Pierre Siri, vd på Blocket, är glad över förbudet.
- Vi har haft stora problem med det eftersom annonsen refererar till Blocket, men klickar användaren där kommer han eller hon till en mellansida med reklam för Allaannonser.se och andra aktörer.

Idg skriver:

Tingsrätten har också givit Blocket rätt i kravet med vite om 200 000 kronor att stoppa Alla Annonser bruk av en mellansida med reklam när användaren hoppar från Alla Annonsers sökresultat till Blocket.

Jag har diskuterat detta otyg i samband med länkning av nyhetsrubriker i mitt inlägg om Sökmotor eller “scraper site” – var går gränsen?.

Hos Computer Sweden kan man också läsa att

- Jag är jätteglad att vi fått bevis för att vi inte ägnar oss åt varumärkesintrång. Vi kommer åter att indexera Blockets annonser, säger Jonas Söderqvist, vd för Alla Annonser till Svenska Dagbladet.

Jag förstår dock inte hur Allaannonser resonernar. Bara för att tingsrätten inte gick på Blockets linje, utan kom fram till att det Allaannonser gör troligen inte är olagligt, så innebär det ju inte det att Blocket kommer att tillåta att Allaannonser indexerar deras eftertextannonser, om de nu inte vill det. Det är ju relativt enkelt för Blocket att se till att de inte behöver se sina annonser hos Allaannonser genom en teknisk lösning.

Internetreklam och nyhetstexter

Posted in Osorterad on september 10th, 2005 by Clas – Kommentering avstängd

Affärsvärlden har, i onsdagens nummer, en artikel om internetannonsering. Där poängteras att reklam på internet numer handlar om reklam som har stark koppling till de texter som finns på sidan där reklamen visas. Där framgår också att det är texterna, informationen, som är en nyckelfaktor för att tjäna pengar på reklam:

”Men det som stimulerar annonsmarknaden är den lättflytande informationen, och innan allt innehåll kan flyta helt fritt mellan olika medier återstår ett gigantiskt problem att lösa – vem har rätt till innehållet? Googles ambition är att organisera all världens information, men de har inget eget innehåll. Bolaget har testat motståndet genom att länka sökande till franska nyhetsbyrån AFP, samt till filmer och böcker från andra medier, vilket orsakat en proteststorm hos ägarna till innehållet, förlag och tv-bolag.”

Sökmotor eller ”scraper site” – var går gränsen?

Posted in Osorterad on september 2nd, 2005 by Clas – 13 Comments

Det är inte svårt att skriva en egen sökmotor. Bygger man på verktyg som t.ex. MySQL så går det väldigt enkelt – i princip det enda som behöver programmeras är den del som sparar ner själva webbsidan i databasen.

Eftersom det nu är enkelt att skapa sig en egen ”sökmotor” så görs det många försök som sedan läggs ut på internet. Vad dessa sökmotorer ska användas till varierar. Tyvärr är förekommer det att det skapas sökmotorliknande sajter som används för att bygga en så kallad ”scraper site”. En scraper site bygger på en databas med textmaterial som är insamlat från andra webbsidor. Utifrån dessa texter så återskapas en massa ”nya” webbsidor. Syftet är ofta att ”lura” andra sökmotorer (vanligen Google) att skicka besökare till scraper-sidan. När sedan Google börjar skicka besökare till sidan så utnyttjar skaparen av scraper site:n det. Endera genom att lägga till reklam på sidan, eller skicka en besökare vidare till en annan sajt som skaparen vill ha besökare till. Ofta visar dessa automatgenererade sidor Google Adsense-reklam.

Google, och andra sökmotorer, är redan ganska bra på att detektera denna typ av scraper sites, och kan oftast undvika att skicka allt för många besökare till dem. Dock är Google, och andra sökmotorer, lite sämre på identifiera denna typ av skräp om sidorna är på svenska – och det utnyttjas.

Till exempel på skrivs det på Intressants.se:s utvecklingsblogg om svenska Dabloid.se som har skapat en scraper site baserad på bloggmaterial från svenska bloggar. Det Dabloid gjort är helt enkelt att man samlat in RSS-feeds från ett antal svenska bloggar, och lagt upp texterna på sin sajt – troligen (jag kan bara gissa) för att få sökmotorer att skicka besökare till Dabloid.se istället för direkt till den blogg där materialet publicerats från början. Dabloid verkar skapa sidor av denna typ. Det fiins många fler exempel på denna typ av scraper site, men det kan räcka med detta.

Jag tycker inte att detta är ”fair use” av RSS-data. Det är uppenbart att materialet inte används för att hjälpa en besökare att hitta till källan, som trots allt lagt ner tid och engagemang att skapa texterna. Samtidigt tycker jag att det är svårt att se var gränsen går för vad som är ”fair use”, och vad som inte är det.

Ta t.ex. sajten Intressant som också använder sig av blogginnehåll för att skapa, vad de kallar lite mer Google-karma till sajten. Det är dock en tydlig skillnad mellan Intressant.se och Dabloid – dels i hur texterna presenteras, dels i frivilligheten att låta sina texter vara med. På Intressant.se är det frivilligt att vara med eftersom sajten bygger på att man medddelar att man uppdaterat sin blogg med nya inlägg. Vill man inte att t.ex.en Google-sökning på det ämne man kommenterat på sin blogg eventuellt ska leda Google-sökare till Intressant.se, utan direkt till sin egen blogg, ja då är det enkelt att bara inte ”pinga” Intressant.se. Detta tillsammans med att data från bloggarna används på Intressant.se för att skapa länkar till ”liknande bloggar”, och annat, gör att användandet av RSS-data känns ”fair”, även om det är samma typ av data som nyttjas t.ex. av Dabloid.

Det finns fler exempel på vad jag tycker känns som ”fair use” och inte. Intressant.se:s(?) nya blog-sök-tjänst, som finns på Knuff.se ser ut att använda RSS-data på vad jag tycker är ett sökmotormässigt sätt när det gäller blogg-sökningar. Till exempel så leder länkar som ”ser ut” att vara länkar direkt till källan också direkt till källan. Det känns schysst. (När det gäller nyhetslänkarna på knuff.se, som inte leder direkt till källan, så är jag lite mer tveksam.) Som jämförelse kan vi ta en annan bloggsöktjänst – feeder.se. På feeder.se så kan du söka på bland annat bloggmaterial. Efter en sökning så får du en lista på rubriker på blogginlägg som matchar din sökning, precis som på vilken sökmotor som helst. Varje rubrik är en länkad text. Länken leder dig dock inte direkt till källan, utan den leder till en ny sida, där rubriken ges ännu en gång, samt att ”ingressen” presenteras. Denna ”undersida” är dessutom optimerad för sökmotorer, bland annat genom utformingnen av själva URL:en. På denna undersida visas reklam, och naturligvis, om än något undangömd, länken till källan. Detta sätt att länka tycker jag inte är ”fair use” av RSS-data.

Ok, vad har jag dragit för slutsats av detta? Ingen, men jag har i alla fall funderat igenom vad jag tycker är ”fair use” av RSS-data. Generellt blir min åsikt är att det inte är ”fair use” av RSS-data, vare sig från bloggar eller nyhetssajter, om huvudsyftet är använda materialet för att dra trafik till den sajten. Vad syftet är, det vet naturligtvis bara den som skapar sajten, men det är ju var och en fritt att göra sin egen tolkning.