Recension av boken Informationssökning på Internet

Om du är intresserad av att hitta information på nätet så är du troligen en van användare av nätets sökmotorer. Själv använder jag Google, Scirus och Researchindex väldigt ofta. Boken ”Informationssökning på Internet” av Lars Våge, Hercules Dalianis och Lars Iselid sägs vända sig till ”alla intresserade användare av söktjänster på Internet, oavsett kunskapsnivå”. Boken har nio kapitel, de första fyra presenterar ett antal söktjänster och webbkataloger, kapitel fem och sex innehåller tips om hur man användar sökmotorer och några vanliga sökmöjligheter – detta utan att gå in djupt i specifika tjänsters möjligheter och söksyntax. Kapitel sju beskriver hur sökmotorer sorterar sökresulten och tar upp fenomenet sponsrade länkar bland resultaten. Kapitel åtta har som mål att på djupet beskriva tekniken och matematiken för hur en sökmotor fungerar. Boken avslutas i kapitel nio med en beskrivning över ett antal av de större sökmotorerna i ett historiskt perspektiv. Boken har 227 sidor och c:a 45 av dem är referenslistor och listor med webbadresser. Den är utgiven på Studentlitteratur och kostar c:a 180kr.

Informationssökning på Internet behandlar inte bara sökmotorer utan åtminstone de inledande kapitlen behandlar även s.k. webbkataloger – manuellt kategoriserade listor med webbadresser. Detta gör det lite okart om tanken är att täcka allt inom informationssökning på Internet eller bara sökmotorer. Webbkataloger är ju som bekant inte det ända sättet att hitta information på förutom sökmotorer, även uppslagsverk på nätet och Wiki:s, något som inte tas upp alls, skulle kunna ges plats. Det är inte uttalat att kapitlen skall stå för sig själva, men samma information återfinns delvis i flera av kapitlen.

De första kapitlen presenterar ett antal webbkataloger (Yahoo, ODP osv.) och söktjänster. Olika typer av faktasöktjänster gås igenom för t.ex. text, bilder och ljud. Dessutom förklaras vad som brukar kallas ”den osynliga webben” – information på nätet som kan vara svårt för en sökmotor att hitta.

Kapitel sex presenterar praktiska söktips för informationssökning i allmänhet och specifika söktips för några sökmotorer, framförallt Google, Alltheweb och Internet Archive samt mycket kort om Really Simple Syndication (RSS). Tipsen presenteras i flytande text, vilket tyvärr gör att kapitlet inte lämpar sig som uppslagsverk när jag gör mina webbsökningar.

I flertalet av de inledande kapitlen hänvisas till kapitel åtta för en mera grundlig genomgång av de tekniska funktionerna hos en sökmotor. Kapitel åtta beskriver relativt kort de grundläggande tekniska begreppen i sökmotorsammanhang. Här separeras beskrivningen för insamling av webbsidor, indexering av data och sökning. Tekniker som vektorrymdsmodellen och termviktning beskrivs kort. Här är presentationen aningen bristfällig och momenten indexering och sökning hålls inte isär tillräckligt noggrant. Relativt stor plats ägnas åt s.k. stoppord (eng. stopwords), vilket är en teknik för att spara plats vid indexeringen, men detta är något som ingen nu stor sökmotor använder sig av (bl.a. på grund av att stoppord är problematiskt om man indexerar dokument med olika språk, eller om man vill möjliggöra frassökning). Tyvärr känns det som om indexering och sökning i nyhetsartiklar får oproportionerligt stor plats i detta kapitel. Delen om det nedlagda demo-projektet Nyhetsguiden känns både inaktuell och ointressant, även om tekniker för att hitta grundformer för ord och tekniker för textsammanfattningar är intressant. Här skulle författarna istället kunna presentera mer detaljer om textbehandling eller kunna hämta inspiration från de inledande kapitlen i Soumen Chakrabartis Mining the web, som har en mycket bra beskrivning av de problem som förknippas med sökmotorer på Internet i och med de stora datamängder som behöver hämtas in, behandlas och lagras. Kapitlet behandlar också sökmotorer för intranet, vilket känns lite malplacerat.

Kapitel nio är en trevlig presenation och beskrivning av alla de större sökmotorerna och bakomliggande företag. Här hade jag gärna sett en lite djupare beskrivning av de nordiska lösningarna, ännu mer om FAST, som fått relativt mycekt utrymme redan nu, något om eniro/nyhetssök eller retriever.se och framför allt, mer om svenskstartade men avsomnade Euroseek vilken jag dessutom tror att en av författarna har varit inblandad i.

Boken håller generellt god kvalitet, speciellt om man jämför med andra förstaupplagor som finns utgivna på Studentlitteratur. Några syftningsfel har smygit sig in, och lite skiljetecken saknas här och var, och hur var det nu, hur stavas aluminium egentligen? Generellt har boken en trevlig och lagom personlig ton.

Största bristen med boken? Att Frisim inte nämns! Men vi får väl vara med i nästa upplaga, eller hur? ;-)

Comments are closed.