Bookmark and Share

Kuinka hakukoneet toimivat

Vastoin yleistä luuloa, hakukoneet eivät suorita hakua netistä silloin kun kirjoitamme halutut hakusanat sen hakulaatikkoon. Haku kohdistuu hakukoneen omaan tietokantaan, johon se on kerännyt hakurobottiensa avulla verkossa olevia sivuja. Tämä selittää esimerkiksi sen, että hakukoneet eivät löydä aivan vastikään verkkoon lisättyjä sivuja. Iso osa verkon  informaatiosta jää hakukoneiden ulottumattomiin useista eri syistä. Tätä ilmiötä kutsutaan syväksi webiksi

Kuinka hakukoneet etsivät informaatiota?

Hakukoneiden hakurobotit etsivät informaatiota verkosta omien indeksointikriteeriensä perusteella. Ne vaihtelevat hakukonekohtaisesti. Indeksointikriteereitä ja hakukoneiden hakualgoritmeja ei kerrota julkisuudessa yksityiskohtaisesti, koska ne ovat liikesalaisuuksia. Etsiessään uusia sivuja Internetistä ne huomioivat muun muassa seuraavia seikkoja:

  • Hakutermien esiintymistiheys
  • Sivun otsikossa esiintyvät termit
  • Sivun metatiedoissa esiintyvät termit
  • Sivulle johtavat linkit
  • Sivulla olevat linkit

Yleistäen voidaan sanoa, että sivu, jolla haluttu hakutermi esiintyy mahdollisimman monta kertaa suhteessa koko tekstin määrään, indeksoidaan hakutuloksessa kärkeen. Jos termi esiintyy myös sivun otsikossa, niin sivun painoarvo nousee. Suositut sivut nousevat helposti hakutuloksessa listan kärkeen – tämä ei suinkaan tarkoita, että ne olisivat laadukkaimpia. Esimerkiksi Wikipediaan sisältyvät artikkelit ovat lähes kaikissa hakutuloksissa ja hakukoneissa ensimmäisten joukossa riippumatta niiden laadusta.

Googlen PageRank –periaate

Google analysoi sivujen välisiä linkkejä ja käyttää tätä perustana järjestäessään sivut paremmuusjärjestykseen hakutuloksessa. Se laskee linkin sivulta A sivulle B ääneksi sivun B hyväksi. Samalla se myös analysoi millaiselta sivulta kyseinen linkki on. Googlen oman ilmoituksen mukaan ”tärkeiden” sivujen linkeillä on enemmän painoarvoa kuin ”vähemmän tärkeiden”. Sitä, mitkä ovat ”tärkeitä” sivuja, Google ei kerro suoraan. Google arvottaa sivuja niiden tärkeyden mukaan antaen sivuille sitä korkeamman PageRank –arvon, mitä tärkeämpänä se niitä pitää.

PageRank –arvo yhdistetään sanojen esiintymistiheyteen ja linkkien sisältöön, jonka perusteella lopullinen sivun arvo ja sen sijoitus hakutuloksessa määräytyy. Kaikkiaan Google huomioi yli 200 kriteeriä järjestäessään lopullista hakutulosta

Niin Googlen kuin muidenkin hakukoneiden algoritmeja muutetaan jatkuvasti muun muassa hakukoneoptimoinnin (ks. jäljempänä) ja haun tehokkuuden parantamisen takia.

Google PageRank Check –palvelulla voi tarkistaa eri sivujen painoarvon Googlen PageRankissa. Tarkistus tuottaa kiintoisia tuloksia: esimerkiksi Tampereen kaupunki, Haaga-Helia ammattikorkeakoulu ja Wikipedia saavat kaikki saman painoarvon (7/10).

Hakutulokseen voidaan myös vaikuttaa monella tavoin. Google on ilmoittanut että se ei  myy tiedon tuottajille parempaa sijoitusta hakutuloksessa. Joidenkin hakukoneiden epäillään kuitenkin toimivan tällä tavoin. Myös hakukoneoptimoinnilla voidaan vaikuttaa siihen kuinka hyvin sivusto sijoittuu hakutuloksessa.

Lisätietoa:

Google PageRank Check – Palvelu, joka tarkistaa Googlen Page Rank –arvon.