15.Bevaka – söka passivt

Nedanstående är ett kapitel som kommer ifrån boken Effektivare informationssökning på webben (2007) och som i vissa delar har uppdaterats.

Aktiv och passiv sökning

Informationssökning kan ta mycket tid, allt för mycket tid. Men det finns sätt att gör passiva sökningar, så att informationen kommer till dig. Men den inkommande informationen måste sållas, bara en liten del är guldkorn.

Enligt Marcia Bates (professor i informationsvetenskap) är det vanligaste sättet att söka information passiv sökning. Passiv sökning innebär att man tar tillvara informationen när den dyker upp, man söker inte aktivt efter den. Den passiva sökningen tar mycket mindre tid och energi än den aktiva.

Bäst är att kombinera de två sätten. Att aktivt skapa strukturer som levererar informationen, som du sedan passivt kollar av.

Stående sökning i sökmotor

Genom s.k. alerts får du mejl när det kommer in nya träffar i träfflistan (vanligen topp 50 eller 100) på en viss sökning. Varianter som söker i Google:

Googles egen alert-tjänst (beta) (www.google.com/alerts)

Fig. Google Alert-mejl för “invisible web” OR “deep web”. Mejlet är indelat i tre delar: News alert, Blogs alert och Web alert.

I Live Search kan sökningarna levereras via RSS. Se längre fram i kapitlet för mer om RSS.

Webbplatsbevakning

Det finns både webbaserade tjänster och lokalt installerade program som bevakar webbsidor. De tar en kopia av sidan som de ska bevaka. Sedan återkommer de, enligt inställningarna, och tar en ny kopia som jämförs med den gamla. Har något ändrats, tillkommit eller i vissa fall tagits bort på sidan så skickas ett meddelande, en s.k. alert.

Ett problem är att enkla ändringar på en webbsida, som ett ändrat datum, resulterar i en “alert”. I somliga tjänster kan man bestämma när man påbörjar bevakningen att t.ex. minst fem ord ska ha ändrats för att en ändring ska meddelas.

När är det bra att använda en webbsidebevakare?

  • När informationen inte är tillgänglig via RSS (se längre fram i kapitlet för mer om RSS).
  • För webbplatser utan RSS. Många informationsrika webbplatser saknar RSS. Eller så publiceras bara utvalda delar med RSS, t.ex. pressmeddelanden.
  • När det är specifik information man är ute efter. Kanske är det bara en undersida med ett speciellt ämne eller tjänst som ska bevakas, t.ex. en organisations personalsida för att se om någon nyanställts eller om det finns lediga tjänster.
  • För att hålla koll på nyheter eller uppdateringar genom att bevaka t.ex. en webbplats första sida eller nyhetssida, en webbguides sida för “nya uppdateringar” eller en organisations “aktuellt”-sida. På så sätt får man indikationer på förändringar och vad som är på gång, utan att behöva bevaka en hel mängd sidor.

De flesta webbsidor förändras någon gång. Att besöka alla intressanta sidor regelbundet tar mycket tid och är ineffektivt.

Exempel på användning:

  • För att hålla koll på en företagssida med lediga tjänster
  • Ett förlags webbsida för nya böcker

Olika leveranssätt:

  • e-post
  • RSS
  • inom tjänsten eller programmet

Registrera webbadressen och välj inställningar: Hur ofta sidan ska kontrolleras och hur meddelandet ska levereras. Kontrollera också så att inte mejlen från tjänsten fastnar i något spamfilter.

Olika tjänster har olika möjligheter. De kan ha alert vid:

  • förändring av en viss storlek (kb)
  • om vissa ord eller fraser används
  • om vissa ord inte förekommer
  • ändring i länk, bild eller datum
  • visst antal förändringar (antal ord eller tecken).

Olika vad som meddelas:

  • förändringar
  • nytt innehåll
  • borttaget innehåll

Problem:

  • Webbadresser som ändras (den gamla bevakas men inte den nya)
  • Fria alerttjänster kan försvinna (notera vilka sidor som vilken tjänst bevakar).
  • Problem att bevaka sökmotorovänliga sidor med frames, scripts osv.

Olika bevakningstjänster och program

Fria tjänster Follow that page www.followthatpage.com
Urlwatch www.urlwatch.be
Watchthatpage www.watchthatpage.com
Webagent www.webagent.nl
Tjänster med 3-5 fria bevakningar Changedetect www.changedetect.com
Feedwhip www.feedwhip.com
Trackengine www.trackengine.com
Betaltjänster Infominder www.infominder.com/webminder
Trackle www.trackle.com
Tracerlock www.tracerlock.com
Programvara Website-watcher www.aignes.com
Copernic tracker www.copernic.com/en/
products/tracker

Se även www.searchengineshowdown.com/alerts för en längre och uppdaterad lista.

Programvara

Webbplatsbevakningsprogram låter dig hålla koll på mängder av webbsidor, utan att själv vara ute på webben. Ett par exempel (som går att ladda hem och testa gratis):

WebSite-Watcher

WebSite-Watcher är ett program som kollar om de bevakade webbsidorna har ändrats. Du slipper surfa in och kolla själv. (www.aignes.com)

Copernic Tracker

Copernic (som har ett bra desktop search-program) har ett webbplatsbevakningsprogram, i stil med WebSite-Watcher, som körs i bakgrunden. (www.copernic.com/en/products/tracker)

Fig. Copernic Tracker visar förändringar på Platsbanken.

Webbtjänster

WatchThatPage (www.watchthatpage.com) är en webbtjänst som övervakar webbsidor åt dig. När sidor ändras skickas ett mejl med ändringarna. WatchThatPage skickar bara ändringarna på sidan som text, men var på sidan ändringarna är framgår inte. TrackEngine (www.trackengine.com) däremot visar hela sidan med ändringarna markerade.

Fig. Alert-meddelande via e-post från TrackEngine.

E-postalerts

Alerts via mejl är en tjänst som en del webbplatser tillhandahåller. Man får ett mejl när sidor uppdaterats eller nya dokument publicerats som matchar kriterierna man satt upp.

En fördel är att mejlalerts ger färre “falska positiva resultat” än RSS-flöden och webbplatsbevakare. Mejlen skickas bara när något tillkommit, sedan gäller det att ställa upp bra kriterier för tjänsten. Att välja rätt ämne eller formulera en bra sökfråga. I en del tjänster meddelas man alla förändringar inom en viss del av webbplatsen, och då blir det givetvis mindre precision och mer brus.

Man kan hitta olika specifika alert-tjänster via e-post genom att söka på: “e-mail alerts” OR “email alerts” tillsammans med ämnesord, t.ex.:

“e-mail alerts” OR “email alerts” “oil price”

På Yahoo! Alerts (alerts.yahoo.com) finns många valbara alerts som nyheter eller händelser på Yahoo!:s auktioner. Tyvärr finns det inte möjlighet att ha alerts på webbsökningar.

Google alerts (www.google.com/alerts) är däremot en tjänst helt inriktad på webbsökning, bloggar och nyheter. Googlealert (www.googlealert.com) är en alert-tjänst helt fristående från Google men som söker i Google.

RSS

Vad är RSS?

RSS är ett enkelt XML-format för distribution av bl.a. nyhetsrubriker på webben. Hela eller delar av webbaserade textstycken skickas tillsammans med en länk till det ursprungliga materialet. RSS-flödet kan man läsa i en RSS-läsare (även kallad nyhetsaggregator), i nyare webbläsare är den funktionen inbyggd. Ett format som fungerar som RSS är Atom, men det är ingen RSS-standard. RSS består av flera standarder:

  • RDF Site Summary (RSS 0.9 och 1.0)
  • Rich Site Summary (RSS 0.9x)
  • Really Simple Syndication (RSS 2.x)

Vilken typ av RSS-flöde det rör sig om, eller om det är Atom, spelar ingen roll så länge RSS-läsaren klarar av det. RSS-flöden markeras ofta med en orange ikon:

Fig. RSS-symbol som används av de största webbläsarna.

Utnyttja RSS

RSS kan användas till mycket:

Alerts via RSS

Via Live Search kan du ha stående sökningar där du får resultaten via RSS istället för e-post. Även i databaser finns RSS-alerts för stående sökningar, t.ex. den medicinska databasen PubMed (www.ncbi.nlm.nih.gov/sites/entrez).

Nyheter med RSS

Många nyhetsleverantörer har RSS-flöden. Genom att prenumerera på RSS följer man lätt med i rubrikerna utan att behöva besöka webbplatserna och kan enkelt bevaka allt från lokala till internationella nyheter.

Följa bloggar med RSS

Prenumerera på RSS-flöden och läs blogginläggen i koncentrerade pass eller när de poppar upp i din RSS-läsare. Du slipper söka upp webbplatserna för att spana av, speciellt bra om bloggen publicerar med ojämna mellanrum.

  • Följa bloggar utan att besöka dem.
  • Ta hem poster och arkivera dem för framtiden.
  • Spara posterna utan att sålla.
  • Indexera posterna med en skrivbordssöktjänst.
  • Söka i ditt eget arkiv när behov uppstår.

Bevaka webbplatser med RSS

Webbplatser har ofta RSS-flöden för nyheter av olika slag, t.ex. pressreleaser, tekniska nyheter eller produktinformation.

RSS-läsare

RSS-läsarna kan delas in i fyra grupper:

  • Helt webbaserade läsare som inte kräver någon installation på din dator och som kan nås varifrån som helst på nätet (t.ex. Bloglines, www.bloglines.com).
  • Skrivbordsläsare som är ett program på din dator (kräver installation) och bara kan användas vid den specifika datorn (t.ex. Mozilla Thunderbird).
  • Hybrid-läsare som är läsare som fungerar som webbaserade läsare men där det finns program att installera för att öka funktionaliteten.
  • Integrerade läsare som är en funktion i ett annat program, t.ex. en webbläsare.

Mozilla Thunderbird (www.mozilla.org) är en RSS-läsare (och ett e-postprogram). I Thunderbird är det enkelt att lägga upp prenumerationer på RSS-flöden. Flödena är separata och du får kolla av vad som kommit från de olika källorna var för sig. I Thunderbird slängs inget automatiskt, i en del webbtjänster kan det finnas en bortre tidsgräns för hur länge inlägg sparas.

Hur du hittar flöden (1)

Enklaste sättet att hitta flöden är att gå till den webbplats du är intresserad av och titta efter länkar som innehåller RSS eller XML. Ofta ligger det länkar till RSS-flödena längst ned i sidans sidfot. Ibland är det lättast att söka på RSS i webbplatsens sökfunktion.

Dessa länkar (URL:er) ska läggas in i RSS-läsaren. Lättast är att kopiera-och-klistra-in dem. I en del fall kan man även få dem inlagda med automatik i sin läsare (se nedan).

Ibland finns det olika enkla sätt att lägga till flödet till sin favoritläsare. Det finns länkar eller knappar till: Feedbirner, Rojo, MyMSN, Bloglines, myFeedster, NewsGator, Pluck, My Yahoo! och Google. Så är det ofta på it-inriktade sidor, det finns mängder med genvägar för inläggningen i olika läsare.

Fig. RSS-snabblänkar på searchenginewatch.com.

Hur du hittar flöden (2)

Ett annat sätt att hitta flöden är söktjänster för RSS-flöden. Några tjänster är:

  • Feedster (http://feedster.com)
  • Syndic8 (www.syndic8.com)
  • RSS Network (www.rss-network.com)

Hur du hittar flöden (3)

Både Internet Explorer 7 och Mozilla Firefox 2 har automatisk funktion för att upptäcka RSS-flöden. I Internet Explorer tänds RSS-symbolen som finns till höger om flikarna.

Fig. RSS-symbolen tänd i Internet Explorer.

I Internet Explorer får man välja bland webbplatsens olika RSS-flöden genom att trycka på den lilla pilen jämte symbolen. När man kommit till det valda RSS-flödets sida kan man trycka på stjärnan men plustecken till vänster om fliken (se bilden ovan). Därefter får man välja var flödets mapp ska placeras.

I Firefox visas RSS-symbolen i adressfältet. Genom att klicka på den kan man välja vilka av RSS-flödena på svd.se som man vill prenumerera på.

Fig. RSS-symbolen i Mozilla Firefox.

När man valt RSS-flöde får man välja var det ska läggas i webbläsaren, bland bokmärkena eller i bokmärkesfältet. Varje RSS-flöde skapar en mapp där posterna samlas.

De valda RSS-flödena uppdaterar sedan automatiskt innehållet i mappen där de senaste posterna alltid kommer visas.

3 comments for “15.Bevaka – söka passivt

  1. October 7, 2010 at 17:31

    I ended up at this website from Google after in the market for an substitute to WatchThatPage considering that WTP has been out of service. I found myself joining ChangeDetect. This is a superior provider, but unfortuantely counter to the assertions on their web-site is not really free of charge. But at least ChangeDetect is working for tracking web content updates.

  2. Kalle
    March 25, 2012 at 17:48

    Bra sammanställning. Tack!

Leave a Reply

Your email address will not be published. Required fields are marked *