We gaan in 2021 wereldwijd misschien wel de twee miljard websites halen. Stel dat iedere website 20 pagina’s zou hebben, dan hebben we het in totaal over 40 miljard pagina’s met informatie. Om het zoeken naar informatie te vergemakkelijken heeft Google een rangschikkingssysteem gemaakt op basis van algoritmen.
Betekenis van de zoekopdracht
Het eerste wat Google doe is kijken naar de intentie van je zoekopdracht. Wat is nu de daadwerkelijk informatie waar je naar zoekt? Google werkt met taalmodellen om te ontcijferen welke woordenreeksen er worden gebruikt en logischerwijze bij elkaar horen. Daar horen bijvoorbeeld ook de synoniemen bij. Dit om maar zo goed mogelijk de vraag achter de vraag te achterhalen om de juiste zoekresultaten te presenteren.
Daarnaast werken ze bij Google ook met ‘actualiteitsalgoritmen’. Als het programma ‘Wie is de verrader?’ populair is, gaat Google direct op zoek naar de pagina’s met de relevante informatie om het publiek de beste antwoorden en informatie te kunnen voorschotelen.
Relevantie webpagina’s
De algoritmen analyseren de content van webpagina’s en beoordelen of de pagina informatie bevat die relevant kan zijn voor datgene wat je zoekt. Het meest basale is of het zoekwoord voorkomt op de tekst van de pagina of bijvoorbeeld in de titel. Daarnaast beschikt Google over grote hoeveelheden van interactiegegevens van anderen naar de zoekterm. De resultaten van het zoeken door anderen op de betreffende zoekterm in combinatie met bijvoorbeeld de duur van het verblijf op de betreffende pagina geven aan of zoekresultaten relevant zijn voor de zoekopdracht. Deze gegevens verwerkt Google in signalen die de machine learning-systemen bedienen.
Kwaliteit content, Google, zoekopdrachten en algoritmes: ‘Content is king‘
Een signaal dat de informatie betrouwbaar is, is bijvoorbeeld als andere belangrijke websites naar die pagina linken. Met een mooi woord noemen we dit PageRank. Spamalgoritmen zorgen er voor dat pagina’s van lage kwaliteit en misleidende informatie niet worden weer gegeven.
Gebruiksgemak webpagina’s
Er zijn ook algoritmen die bruikbaardere pagina’s ten opzichte van minder bruikbare onderscheiden. Denk bijvoorbeeld aan of de webpagina correct wordt weergegeven in verschillende browsers. Ook of de site ontworpen is voor alle typen apparaten van alle afmetingen zoals desktops, tablets en smartphones. Een belangrijke is ook de laadtijd niet te lang is van een pagina voor gebruikers met een trage internetverbinding.
Context en instellingen
Google betrekt in dit alles ook je eerdere zoekgeschiedenis en je zoekinstellingen. Een voorbeeld is dat als je ‘Barcelona’ zoekt en onlangs hebt gezocht naar ‘Barcelona tegen Arsenal’, dan kan dat een aanwijzing zijn dat je op zoek bent naar informatie over de voetbalclub en niet over de stad. Als je bijvoorbeeld zoekt naar ‘evenementen in de buurt’, kan Google aanbevelingen voor een evenement afstemmen gebaseerd op je zoekgeschiedenis. Overigens geven ze wel aan dat de algoritmes niet zijn ontworpen om kenmerken zoals je ras, religie of politieke partij af te leiden.