SEO 1

Vad är en sökmotor?

En sökmotor består av tre separata delar:

Spindelprogrammet

Det är detta datorprogram som står för själva insamlandet av webbsidor och länkar. Vad som händer när spindeln besöker en webbsida är att den även lagrar alla länkar. Länkarna listas för att sorteras. Eventuellt hittar man också nya url. Senare bestäms också i vilken ordning de skall besökas. Ofta finns begränsningar hur djupt man vill skanna en hemsida och hur många kb text innehåll man vill hämta. Ibland kallas spindelprogrammet även crawler men avser samma komponent.

Indexeringsprogrammet

Det är här det stora arbetet börjar. Programmet registrerar och sorterar t.ex. tidpunkt för nedladdning, filtyp, filstorlek, automatisk språkigenkänning, textmassan extraheras också för att bl.a. registrera nyckelordstäthet mm. Programmet letar också efter försök att manipulera texten. Hur mycket metadata som används kan variera från olika söktjänsters algoritmer. Troligtvis är det numera inte mer än description och title som hämtas och registreras av head-taggarna.

Allt detta bygger på söktjänstens hemliga recept av algoritmer för att optimera sökresultatet. Ibland justeras de över tid om någon uppenbar brist upptäcks eller helt enkelt bara för att förbättras och göras smartare.

Vanligt är att söktjänsten har en lista med s.k. stoppord. Stoppord är ord som är så vanliga att de är betydelselösa för en sökning. Det kan vara ord som och, på, av, i, vid, osv. Detta hjälper söktjänsten förenkla indexering av nyckelord och fraser. Ett annat vanligt sätt att förenkla är att inte registrera skillnaden mellan stora och små bokstäver. Till slut blir det ändå enorma mängder data att sortera och indexera.

Sökmodulen

Det är ofta detta gränssnitt som man avser när man talar om sökmotorer. Idag är det också vanligt med specialiserade sökmotorindex för t.ex. bilder, nyheter, bloggar, enkel och avancerad sökning mm. På engelska heter den query processor eftersom den matchar en söksträng eller en hel sökfras med den webbsida (av alla tidigare indexerade) som mest troligen har den information som användaren letade efter.

Nästa avsnitt >>

Tillbaka >>

Fördjupning

Internet och nätet vad är skillnaden?
Internet är hela den infrastruktur som gör det möjligt att koppla samman datorer inom olika användningsområden. Internet täcker flera olika system såsom filhämtning FTP, e-post SMTP och kommunikationsprotokollet HTTP.

World Wide Web (nätet eller webben) är en del av Internet.

 

Logga
 
Kontakt | Länka till oss | Min Blogg | Bohuslän   | Mötesmakarna