Lite filindexproblem

De senaste dagarna har Frisim ”tappat” sitt index ett par gånger. Det innebär att sökningar bara görs bland de artiklar som samlats in därefter, vilket är mycket få. Alla artiklar finns dock kvar i två MySQL-tabeller, en med kompletta artiklar (oindexerad), och en mindre tabell med bara rubrik, länk och ingress för snabb access (indexerad). Jag vet inte exakt vad det beror på att fildatabasen ”försvinner”, men troligen försöker jag ”optimera” det filbaserade artikelindexet samtidigt som jag uppdaterar det – någon som egentligen inte kan hända ;-) Lösningen just nu är att inte optimera fildatabasen efter varje adderad källa utan endast en gång per timme. Det bör innebära att spindlingen går rätt mycket snabbare, samtidigt som sökningar kan ta mer tid, eller i alla fall ger lite mer diskaccess. Hittills, dvs. idag, har detta fungerat bra.

Vore det inte så att det var så mycket på jobbet just nu så skulle jag meka lite mer med den portalsida som jag börjat på – en härmning av news.google.com, men på svenska förstås – som baseras på ”word bursts” för att identifiera ”toppnyheter” och som listar de senaste nyheterna i ett antal kategorier.

Comments are closed.