Vastoin yleistä luuloa, hakukoneet eivät suorita hakua netistä silloin kun kirjoitamme halutut hakusanat sen hakulaatikkoon. Haku kohdistuu hakukoneen omaan tietokantaan, johon se on kerännyt hakurobottiensa avulla verkossa olevia sivuja. Tämä selittää esimerkiksi sen, että hakukoneet eivät löydä aivan vastikään verkkoon lisättyjä sivuja. Iso osa verkon informaatiosta jää hakukoneiden ulottumattomiin useista eri syistä. Tätä ilmiötä kutsutaan syväksi webiksi.
Hakukoneiden hakurobotit etsivät informaatiota verkosta omien indeksointikriteeriensä perusteella. Ne vaihtelevat hakukonekohtaisesti. Indeksointikriteereitä ja hakukoneiden hakualgoritmeja ei kerrota julkisuudessa yksityiskohtaisesti, koska ne ovat liikesalaisuuksia. Etsiessään uusia sivuja Internetistä ne huomioivat muun muassa seuraavia seikkoja:
Yleistäen voidaan sanoa, että sivu, jolla haluttu hakutermi esiintyy mahdollisimman monta kertaa suhteessa koko tekstin määrään, indeksoidaan hakutuloksessa kärkeen. Jos termi esiintyy myös sivun otsikossa, niin sivun painoarvo nousee. Suositut sivut nousevat helposti hakutuloksessa listan kärkeen – tämä ei suinkaan tarkoita, että ne olisivat laadukkaimpia. Esimerkiksi Wikipediaan sisältyvät artikkelit ovat lähes kaikissa hakutuloksissa ja hakukoneissa ensimmäisten joukossa riippumatta niiden laadusta.
Google analysoi sivujen välisiä linkkejä ja käyttää tätä perustana järjestäessään sivut paremmuusjärjestykseen hakutuloksessa. Se laskee linkin sivulta A sivulle B ääneksi sivun B hyväksi. Samalla se myös analysoi millaiselta sivulta kyseinen linkki on. Googlen oman ilmoituksen mukaan ”tärkeiden” sivujen linkeillä on enemmän painoarvoa kuin ”vähemmän tärkeiden”. Sitä, mitkä ovat ”tärkeitä” sivuja, Google ei kerro suoraan. Google arvottaa sivuja niiden tärkeyden mukaan antaen sivuille sitä korkeamman PageRank –arvon, mitä tärkeämpänä se niitä pitää.
PageRank –arvo yhdistetään sanojen esiintymistiheyteen ja linkkien sisältöön, jonka perusteella lopullinen sivun arvo ja sen sijoitus hakutuloksessa määräytyy. Kaikkiaan Google huomioi yli 200 kriteeriä järjestäessään lopullista hakutulosta
Niin Googlen kuin muidenkin hakukoneiden algoritmeja muutetaan jatkuvasti muun muassa hakukoneoptimoinnin (ks. jäljempänä) ja haun tehokkuuden parantamisen takia.
Google PageRank Check –palvelulla voi tarkistaa eri sivujen painoarvon Googlen PageRankissa. Tarkistus tuottaa kiintoisia tuloksia: esimerkiksi Tampereen kaupunki, Haaga-Helia ammattikorkeakoulu ja Wikipedia saavat kaikki saman painoarvon (7/10).
Hakutulokseen voidaan myös vaikuttaa monella tavoin. Google on ilmoittanut että se ei myy tiedon tuottajille parempaa sijoitusta hakutuloksessa. Joidenkin hakukoneiden epäillään kuitenkin toimivan tällä tavoin. Myös hakukoneoptimoinnilla voidaan vaikuttaa siihen kuinka hyvin sivusto sijoittuu hakutuloksessa.
Google PageRank Check – Palvelu, joka tarkistaa Googlen Page Rank –arvon.