|
Hur fungerar en sökmotor?
Presentationsordningen i
sökmaskinerna styrs av en algoritm, som är unik för
varje sökmaskin och som dessutom varierar över tiden. Algoritmen tilldelar
olika
element och egenskaper hos websidorna högre eller mindre vikt i avsikt att
åstadkomma så relevanta söksvar som möjligt. Man ska komma ihåg att detta
ändras hela tiden, så för att lyckas måste man ha gjort bra ifrån sig i
alla
element som näms. De element och egenskaper som ofta viktas upp är.
URL (sajtens domännamn
och sidans filnamn, www.searchengine-optimization.nu/sokmotor.html)
Title (Den osynliga titel, som endast visas i söksvar, ej på
websidan)
Description (en osynliga beskrivningen av sidan som endast visas i
söksvar)
Keywords (osynliga uppräknade nyckelord.)
H1-header (huvudrubrik i största storleken,men kan även styras med
font size )
Ingress, d.v.s. textstycke som följer direkt efter H1.
Mellanrubriker, d.v.s. H2, H3 o.s.v.
Länk-popularitet (antalet externa länkar som pekar mot sidan)
Länk-kvalitet (hur populära de sajter är som innehåller länkar
pekande mot sidan)
Länk-text (den text som beskriver länken som pekar mot sajten.)
Klick-popularitet (hur många som klickat på länken i söksvaret)
Retur-benägenhet (om den som klickat återvänder till söksvaret inom
en viss tidsrymd.)
Sökmotorernas spindlar så har fungerar dom.
1. Spindel : ett robot liknande program som
laddar hem hemsidor.
2. Den vandrande spindeln : En spindel som kryper runt på webben och
följer länkar
på dom olika sidorna som den hittar.
3. Ett slags redaktörsprogram som delar upp hemsidorna som spindlarna
samlat ihop
4. Databasen : Här hamnar hemsidorna och delas upp i olika element.
5. Sökmotors resultat : Här hämtas det slutgiltiga sökmotorsvaret .
Spider.
En spindel är ett robotliknande program som
tankar hem hemsidor. Fungerar som
din webbläsare. När du kopplar upp dig mot Internet så laddas hemsidan ner
i din
webbläsare.
Crawler:
Crawlern har ungefär samma funktion som spindeln,
men den kan dela upp en hemsida
och leta, följa länkar. Det är crawlerns jobb att tala om för spindeln hur
den ska
navigera och hur den ska läsa länkar. Detta sköts av ett special
programmerat länk program. Indexer.
En indexer delar upp sidan i olika element och
analyserar den. Som tex. Titel, huvudrubrik,
beskrivning, länkar, text, fet stil på text..
Databasen.
Databasen är ett stort varuhus med information om
hemsidor som sökmaskiner
laddar hem och analyserar.Detta kräver ett enormt utrymme på dom olika
servrarna. Sökmotors resultat.
Av allt detta jobb är det resultats maskinens
uppgift att matcha användarens sökresultat.
Du gör en sökning i en sökmotor så vet du nu att det ligger ett enormt
jobb bakom varje
söksvar du får. När en användare skriver in
sitt sökord i en sökmotor och får sitt svar så måste sökmotorn
analysera detta ord och vikta upp i vilken kategori det finns i och hur
den ska leta för att
få det mest relevanta söksvar. Detta kallas för sökmotorns algoritm
(se det översta stycket
som handlar om algoritmen.). Se även en engelsk version
how a searchengine work Register och
sökmaskiner.
För att hitta rätt i de
ofantliga informationsmängderna använder 85 procent av alla användare
antingen register eller sökmaskiner eller bägge. Sifo Interactive uppger
att häften av alla svenska
surfare använder svenska sökmaskiner och lika många utländska. Varje dag
sker
omkring 750 miljoner sökningar Begreppet "sökmaskiner" används i dagligt
tal
ofta som samlingsterm för båderegister och för regelrätta sökmaskiner,
vilket inte är helt korrekt.
Skillnaden mellan dessa är att
sökmaskiner läser och indexerar alla ord på websidorna
(upp till 65.000 tecken per sida) och ofta även alla sidor i en websajt,
åtminstone ner till
fjärde nivån i bibliotekshierarkin. Register presenterar däremot endast
websajter,
inte enskilda sidor, och ordnar dem i hierarkisk form efter ämnesområden.
Regelrätta sökmaskiner är
databaser ur vilka information hämtas på begäran, genom att
någon gör en sökning. Sökmaskinerna erhåller denna information på två
sätt.
Dels genom att ägare till hemsidor anmäler dessa hos sökmaskinen, dels
genom att sända ut en s.k.
sökspindel. Sökspindeln är en robot som följer länkar i dokument, läser in
de sidor
som länkarna pekar mot, samlar på sig nya länkar och kryper vidare från
sida till sida.
Innehållet i sidorna indexeras
och placeras i databaserna, som efterhand får enorm omfattning.
Metoden har sin begränsning därigenom att sidor som inte har några länkar
pekande mot sig aldrig
kommer att upptäckas, såvida ägaren inte registrerat dem hos sökmaskinen.
Den ofantliga mängden information i databaser kan heller inte nås,
eftersom sökspindeln
inte förmår att fylla i det formulär (vanligtvis en enkel sökruta) som
krävs för att databasen
skall skapa en dynamisk websida.
Färdiga länkar till sökningar i
databaser kan i princip följas. En begränsad mängd data i en
databas, kan dock varieras på ett oändligt antal sätt. Sökspindlarna kan
inte avgöra om så är
fallet och ägarna till sökmaskinerna vill undvika att deras egna register
översvämmas av
överlappande information. Man tillåter därför normalt inte sökspindlarna
att följa länkar som
innehåller frågetecken ”?” eller ampersand ”&”, vilket indikerar att
länken pekar mot en databas.
Detta är anledningen till att information i databaser tillhör den osynliga
eller ”djupa”
delen av webben, som inte indexeras av normala sökmaskiner.
Två undantag är f.n. kända från
denna regel. Google har under hösten börjat följa
länkar till dynamiskt innehåll. Altavista indexerar dynamiska sidor om
länkarna till
sidorna matas in manuellt i deras anmälningsrutin.
Sökningar mot databaser kan bara ske med hjälp av särskild programvara hos
användaren själv.
Den studie som Bright Planet publicerat torde ha varit avsedd att
understödja försäljningen av
deras eget nya verktyg LexiBot, som söker av
databaser i realtid.
Dessa sökningar blir av naturliga skäl mycket tidsödande – 30-40 minuter –
men
genererar å andra sidan svar som inte kan erhållas på annat sätt.
Även programvara för
sökmaskiner ät lätt tillgänglig som shareware eller freeware.
Vanligtvis används dessa för s.k. ”site-search”, d.v.s. sökning i en viss
sajt.
Men det finns även gratis sökmaskinsprogram som klarar att indexera
externa sajter inom en
definerad sfär, t.ex. en bransch eller ett ämnesområde.
Det finns därför flera tusen sökmaskiner i drift.
Av världens 15 populäraste
websidor är 13 antingen register, sökmaskiner
eller startsidor knutna till sökmaskiner eller register.
Detta skall dock inte tolkas som att alla användare utgår från sökmaskiner
när de surfar.
Sett ur
användarperspektiv ser det annorlunda ut. För att ta sig till en websida
utgår
36 procent från länkar på en sajt till en annan sajt, 30 procent från en
länk på en
sida till en annan sida i samma sajt, 28 procent från länkar som sparats
på egen
dator som ”bokmärken” (i Netscape) eller ”favoriter" (i Internet Explorer)
eller från adresser
som knappats in i webläsarens adressruta. Endast 6 procent utgår från
sökmaskiner eller register.
Dessa 6 procent räcker dock för att föra upp de ledande sökmaskinerna och
registren
till den absoluta Internet-toppen. Det är viktigt att inse att länkar som
pekar mot en annan sajt,
antagligen kommit dit sedan den som lagt ut länken hittat sajten via en
sökmaskin
|