Allt och inget

Många bloggare är intresserade av att kommentera det kommande beslutet om FRA ska ha rätt att bedriva ”signalspaning” i kabelbunden trafik (dvs, övervaka internettrafiken i Sverige). Knuff.se är den självklara samlingsplatsen för blogginläggen. Nu verkar det dock gått lite över styr och den så kallade Knuff-bombningen verkar ha gjort att Knuff just nu nöjer sig med att bara länka till nyhetsartiklar (precis som Frisim alltid gör). Lite synd, men så har jag ju ingen aning om vilken trafik/press som Knuff utsätts för.

Svagt relaterat till ovanstående om FRAs befogenheter så har Twingly lanserat sin bloggsökmotor Twingly i veckan. Ironiskt nog så ger en sökning på just FRA inga resultat alls. Lite otur kanske? Annars lovar Twingly gott, och inte minst trevligt är det att det är ett Linköpingsföretag.

Mindpark har, för första gången, lanserat en ”tjänst” – ett Mediesök. Det är en söksida som bygger på Google CSE/Site search. Googles Site Search verkar erbjuda en del riktigt schyssta funktioner för sina betalande ($100 per år) användare, som t.ex. möjlighet att påverka ordningen i vilken sökresultaten kommer. Mina gamla försök med gratisversionen av Google CSE för nyheter blev inte så bra. Jag tror att ”Mediesök” skulle förbättras avsevärt om listan med källor fanns tillgänglig.

—-

För några veckor sedan så lade BBC upp samlingssidor under namnet BBC/Topics som beta-version. Samlingssidorna är automatgenererade och syftar till att samla ihop allt material som BBC har på sin sajt inom utvalda teman och runt ”kända” personer. En kortare funktionsbeskrivning finns i deras blogg. Jag tror att denna typ av sidor borde kunna fungera bra även för svenska sajter som SR, TV4 och SVT.

BBC har också mycket annat kul på sina ”backstage”-sidor. Till exempel så finns där ett test-sida för att använda Lucene och Wikipeda för att göra automatisk taggning av texter. Spännande, men lite för långsam för att det ska fungera i drift, tror jag. (källa.)

Det svenska företaget med det schyssta namnet Tailsweep fortsätter att bygga på sin sökmotor. En massa detaljer hittar du på Lucene/Solr-maillistan.

Och eftersom alla läsare av denna utvecklingsblogg är väldigt intresserade av att se hur det ser ut på den plats där Frisim utvecklas så kommer här en bild :-)


frisim dev zone

  1. Lars Iselid skriver:

    Är det denna du syftar på vad gäller Tailsweep?: http://search.tailsweep.com/

  2. Clas skriver:

    @Lars: Ja just det. Det som finns på search.tailsweep.com är den publika delen av ”nuvarande version”.

  3. Anton skriver:

    Ang. att det inte finns några resultat på ”fra” på Twingly så finns en väldigt naturlig förklaring. Det är helt enkelt så att ”fra” är ett stoppord. Inte för den svenska förkortningen vi använder det som precis just nu, utan för det norska ordet ”fra” som betyder från. Lite olyckligt förstås, men inte helt lätt att lösa heller.

    /Anton

  4. Clas skriver:

    @Anton skriver (och även Jörgen på Twingly-feedback-supporten): ”Lite olyckligt förstås, men inte helt lätt att lösa heller.”

    Det beror nog på att ni applicerar stopporden innan ni gör språkigenkänningen på Twingly. Det går att ordna genom att göra språkingenkänningen först och sedan applicera språkberoende stoppord efteråt. Vore det inte schysst att kunna söka på ”is” till vintern ;-)

  5. Anton skriver:

    Jodå, så långt hänger jag också med Clas :)

    Men det finns (som jag förstått det) klara fördelar med det vi gör nu, framförallt går det väldigt mycket snabbare.

    Kanske något vi fixar i framtiden men just nu måste vi fokusera på allt annat. Är ett ganska stort projekt att lägga om vår språkidentifiering…

    :) /A

  1. There are no trackbacks for this post yet.