Tekninen SEO kattaa verkkosivuston rakenteen, suorituskyvyn ja indeksoitavuuden optimoinnin, jotta hakukoneet voivat tehokkaasti ryömiä, indeksoida ja ymmärtää sivuston sisältöä. Se liittyy sivuston taustalla oleviin käytännön asioihin: palvelimen vasteajoista aina sivuston koodin toteutukseen. Alla käsittelemme teknisen SEO:n tärkeimmät osa-alueet – selkeästi jäsenneltynä ja helposti luettavana, jotta voit tunnistaa parannuskohteet. Tekniseen SEO:hon panostaminen parantaa sekä hakukonenäkyvyyttä että käyttäjäkokemusta. Esimerkiksi noin 65–66 % sivustojen indeksoinnista tapahtuu jo mobiililaitteilla, joten tekniset parannukset (kuten sivuston nopeuttaminen) voivat suoraan vaikuttaa kävijöiden pysyvyyteen ja konversioihin. Tekninen perusta muodostaa muiden hakukoneoptimointitoimien perustan – ilman sitä hyväkin sisältö saattaa jäädä löytymättä.

Robots.txt-asetukset ja crawlauksen / ryöminnän ohjaaminen
XML- ja HTML-sivukarttojen luonti ja optimointi
Indeksoinnin hallinta: noindex-, canonical- ja hreflang-tagit
HTTP-tilakoodit ja uudelleenohjaukset (301, 302, 410)
Palvelimen vasteajat ja hosting-valinta SEO-näkökulmasta
CDN‑ratkaisut suorituskyvyn parantamiseksi
Välimuististrategiat: selain- ja palvelinvälimuisti
Kuvien latauksen optimointi: laiska lataus (lazy loading), WebP ja responsiiviset kuvat
JavaScript-renderöinnin ja dynaamisen sisällön lataamisen SEO-haasteet
Mobiiliyhteensopivuus ja responsiivinen suunnittelu
AMP (Accelerated Mobile Pages) – käyttökohteet ja rajoitukset
Verkkoyhteyksissä HTTP/2-, HTTP/3- ja TLS-optimoinnit
Suurten sivustojen ryömintäbudjetin (crawl budget) hallinta
HTTPS-siirtymä, SSL/TLS-varmenteet ja turvallisuus
Sivuston nopeuden analysointityökalut ja jatkuvat auditoinnit
Kirjasinten latausstrategiat ja web-fonttien optimointi
URL-parametrien ja fragmenttien hallinta (Google Search Console -asetukset)
Lokitiedostojen analyysi ja virheiden seuranta (esim. Screaming Frog, GSC-lokit)
Tietoturva ja SEO: CSP-, HSTS- ja X-Frame-Options -käytännöt
Automaattiset teknisen SEO:n auditoinnit ja tarkistuslistat

1. Robots.txt-asetukset ja crawlauksen / ryöminnän ohjaaminen

Robots.txt on sivuston juurihakemistossa sijaitseva tekstitiedosto, jolla ohjataan hakukoneiden indeksointirobottien toimintaa. Tiedostossa määritellään säännöt (User-agent) kullekin botille ja kerrotaan, mitkä polut Disallow- tai Allow-direktiiveillä estetään tai sallitaan indeksoitavaksi. Oikein konfiguroidulla robots.txt-tiedostolla voit estää hakukoneita tuhlaamasta crawl budgetia epäolennaisiin osioihin (esim. kirjautumissivut, suodatusparametrit) ja suojata yksityisiä sivuja näkymästä hakutuloksissa. On kuitenkin oltava varovainen: robots.txt ei estä sivun indeksointia, jos jokin muu sivu linkittää siihen, vaan estää vain sivun sisällön crawlauksen. Tämä tarkoittaa, että esimerkiksi Disallow: /sivu voi estää Googlebottia lukemasta sivua, mutta sivu saattaa silti näkyä hakutuloksissa pelkän URL-osoitteen varassa. Mikäli haluat varmasti sulkea sivun pois hakemistosta, käytä noindex -metatunnistetta sivulla (ja varmista, ettei sitä ole estetty robots.txt:ssä).

Robots.txt-asetuksilla voit myös vaikuttaa crawl-nopeuteen epäsuorasti. Joillakin hakukoneilla (kuten Bing) on tuki Crawl-delay -direktiiville, jolla voi hidastaa ryömintää, jos palvelin kuormittuu. Google ei tätä direktiiviä tue, mutta Google Search Console -työkalussa voit säätää indeksointinopeutta jonkin verran. Yleisesti ottaen robots.txt:llä kannattaa sallia kaikki tärkeä sisältö indeksoitavaksi ja estää vain toissijaiset sivut, duplicaatit tai esimerkiksi rajapintaurlit. Huomaa, että puuttuva robots.txt tulkitaan kaikkien sivujen indeksoinnin sallimiseksi (HTTP 404 robots.txt:lle = ei rajoituksia). Jos siis et tarvitse erityisiä estoja, yksinkertainen tapa on sallia kaikki (tai käyttää tyhjää tiedostoa). Tarkista robots.txt-tiedosto huolellisesti aina päivitysten jälkeen – yksikin virheellinen sääntö voi estää koko sivuston näkymisen hakukoneissa. (Esimerkki pahimmasta tapauksesta: Disallow: / estää kaiken crawlauksen sivustolla.)

2. XML- ja HTML-sitemapien luonti ja optimointi

Sivukartat (sitemaps) auttavat hakukoneita löytämään sivustosi URL-osoitteet tehokkaammin. XML-sivukartta on hakukoneille tarkoitettu tiedosto (yleensä sitemap.xml), johon on listattu sivuston tärkeät URL-osoitteet ja usein niihin liittyvää metadataa (kuten viimeisin päivityspäivä). XML-sivukartta kannattaa luoda dynaamisesti tai ylläpitää säännöllisesti, jotta kaikki uudet ja tärkeät sivut ovat mukana. Google ja muut hakukoneet lukevat sivukarttoja nopeuttaakseen indeksointia, erityisesti jos sivusto on laaja tai siinä on sivuja, jotka eivät löydy helposti sisäisten linkkien kautta. Yhdessä XML-sivukartassa voi olla enintään 50 000 URL-osoitetta tai 50 Mt dataa (pakkamattomana) – suuremmat kokoelmat tulee jakaa useampiin sivukarttatiedostoihin. Tarvittaessa voit luoda sitemap-indeksin, joka listaa useita sivukarttoja (myös näitä indeksejä voi olla useita, kukin 50 000 sivukartan viitteellä). Hakukoneet yleensä löytävät sivukartan, jos linkität sen robots.txt-tiedostoon (Sitemap: https://www.example.com/sitemap.xml), tai voit lähettää sen suoraan hakukoneiden Search Console -työkaluihin.

HTML-sivukartta puolestaan on käyttäjille (ja hakukoneille) tarkoitettu sivu, joka listaa sivuston keskeiset sivut hierarkkisesti. Se parantaa navigoitavuutta ja varmistaa, että syvälläkin hierarkiassa olevat sivut saavat ainakin yhden sisäisen linkin. Hakukoneet voivat hyötyä HTML-sivukartoista eritoten silloin, jos sivusto on vaikeasti ryömittävä – ne seuraavat linkkejä sivukartalta ja indeksoivat löydetyt sivut. HTML-sivukartan tulisi olla selkeästi organisoitu (esim. jaettu aihealueittain) eikä liian pitkä; jos sivuja on erittäin paljon, harkitse eri osa-alueiden jakamista omille sivukartoilleen.

Sivukarttojen optimointi: Sisällytä vain uniikit ja indeksoitavat URL-osoitteet. Älä listaa sivuja, jotka on merkitty noindexillä tai blokattu robots.txt:ssä – se on turhaa ja saattaa hämmentää hakukonetta. Päivitä -kentät realistisesti merkittävien päivitysten jälkeen (Google hyödyntää lastmod-tietoa, jos se on johdonmukainen ja luotettava). Huomaa, että Google sivuuttaa mahdolliset – ja -arvot, joten niihin ei kannata tuhlata aikaa. Pidä sivukartta ajan tasalla: poista poistetut sivut ja lisää uudet. Tämä auttaa erityisesti suurilla sivustoilla Googlea indeksoimaan tuoretta sisältöä nopeammin.

3. Indeksoinnin hallinta: noindex-, canonical- ja hreflang-tunnisteet

Kaikki sivut, jotka hakukone crawlaa, eivät välttämättä päädy indeksoiduiksi hakemistoon – eikä tarvitsekaan. Indeksoinnin hallinnan välineitä ovat HTML-koodin -osassa käytettävät metatunnisteet ja attribuutit, joilla ohjaat hakukoneiden toimintaa sivukohtaisesti:

– Tällä metatunnisteella kerrot hakukoneille, ettei sivua saa lisätä indeksiin (eikä näyttää hakutuloksissa). Sivu voidaan silti crawlata ja sen linkkejä seurata, mutta itse sivu pysyy poissa hakemistosta. Käytä noindexiä esimerkiksi kiitos-sivuilla, kirjautumissivuilla tai sisällössä, jonka et halua näkyvän haussa. Tärkeää: noindex toimii vain, jos hakurobotti pystyy lukemaan sivun – eli sitä ei pidä estää robots.txt:llä, muuten botti ei näe noindexiä.
– Kanoninen URL-tunniste sijoitetaan sivun -osaan kertomaan hakukoneille sivun ensisijainen versio. Tätä käytetään, kun samasta tai hyvin samankaltaisesta sisällöstä on useita URL-osoitteita (esim. sivutus, UTM-parametrit, www- ja non-www-versiot, monikieliset samansisältöiset sivut ilman käännöstä). Canonical-tunniste ohjaa hakukonetta ymmärtämään, että kyseinen sivu on kopio tai versio, ja osoittaa osoitteeseen, jota pidetään pääasiallisena. Hakukoneet pyrkivät yhdistämään signaalit kanoniseen osoitteeseen ja näyttävät pääosin vain sen hakutuloksissa. On tärkeää asettaa kanoniset tunnisteet oikein: jokaisella sivulla itsellään viittaamaan itseensä (poislukien tapaukset, joissa oikeasti haluat ohjata toiseen). Väärin käytettynä canonical voi vahingossa tiputtaa sivuja pois indeksistä – esim. jos asetat kaikkien sivujen canonicalin kotisivulle, Google pitää muita sivuja kopioina kotisivusta.
hreflang-attribuutit – Monikielisillä tai maakohtaisilla sivustoilla käytetään hreflang-merkintöjä (tyypillisesti HTML-sivun -osassa linkkielementteinä tai XML-sivukartassa), jotta Google ymmärtää eri kieli- ja alueversiot. Esimerkiksi: ja vastaavasti en, sv jne. Hreflang auttaa Googlea näyttämään käyttäjälle oikean kieliversion hakutuloksissa. Hreflangien hallinta on teknisesti haastavaa: jokaisen sivuparin tulee viitata toisiinsa (molemmilla sivuilla on oltava toisen kieliversion hreflang-linkit). Yleinen virhe on puuttuvat vastinlinkit tai väärät kielikoodit, jolloin merkinnät eivät toimi. Itse asiassa erään laajan tutkimuksen mukaan yli 67 % hreflang-tagia käyttävistä sivustoista tekee siinä virheitä, mikä korostaa huolellisuuden tarvetta. Hreflang ei suoraan vaikuta rankingeihin, mutta se estää ”väärän” kieliversion näkymistä vaikkapa suomalaiselle käyttäjälle ja parantaa siten osumatarkkuutta ja käyttökokemusta.

Indeksoinnin hallinnassa on olennaista käyttää näitä tunnisteita johdonmukaisesti. Noindex poistaa sivun hakemistosta, canonical yhdistää samankaltaiset sivut ja hreflang erottelee kieliversiot – näiden yhteispelillä varmistat, että jokainen indeksoitu sivu on tarkoituksella indeksoitu oikeana versiona. Muista myös, että hakukone saattaa ohittaa canonical-ehdotuksen, jos algoritmi on vahvasti eri mieltä (esim. huomaa sisällön olevan erilaista); yleensä näin ei tapahdu, jos sisältö ja tunnisteet on kunnossa. Seuraa Search Consolesta peittoraporttia (Index Coverage) – sieltä näet, mitkä sivut on jätetty pois indeksoinnista (esim. ”Sivu merkattu ’noindex'” tai ”Kanoninen URL on jokin muu kuin käyttäjän asettama”), ja voit tarvittaessa korjata merkintöjä.

4. HTTP-statuskoodit ja uudelleenohjaukset (301, 302, 410)

HTTP-tilakoodit kertovat hakukoneelle (ja selaimelle) sivupyynnön tuloksen. Teknisen SEO:n kannalta keskeisiä ovat uudelleenohjaukset ja virhekoodit, koska ne vaikuttavat indeksointiin ja linkkien periytymiseen:

301 Redirect (Moved Permanently) – 301-uudelleenohjaus tarkoittaa, että pyydetty sivu on siirretty pysyvästi toiseen osoitteeseen. Hakukoneet siirtävät lähes kaiken sivun kerryttämän ”auktoriteetin” (esim. ulkoisten linkkien vaikutuksen) uuteen osoitteeseen ja jatkossa indeksoivat sekä näyttävät hakutuloksissa uuden URL-osoitteen. Käytä 301-ohjausta aina, kun sivu on lopullisesti vaihtanut osoitetta – esimerkiksi domainin vaihdon, URL-rakenteen uudistuksen tai sisällön yhdistelyn yhteydessä.
302 Redirect (Found / Moved Temporarily) – 302-uudelleenohjaus on virallisesti väliaikainen ohjaus. Se kertoo hakukoneelle, että alkuperäinen URL on yhä voimassa, mutta käyttäjä ohjataan tilapäisesti toisaalle. Hakukoneet eivät aluksi siirrä PageRankia tai indeksointia 302-ohjauksella osoitettuun kohteeseen (vaan pitävät alkuperäisen URL:n indeksoituna). Jos ohjaus on pitkäaikainen, Google saattaa lopulta tulkita sen käytännössä 301:ksi – mutta parasta on valita heti oikea koodi. 302:ta kannattaa käyttää vain erikoistapauksissa, kuten A/B-testauksessa tai kampanjasivuilla, joiden jälkeen aiot palauttaa alkuperäisen sivun.
410 Gone – Tämä statuskoodi kertoo, että sivu on poistettu pysyvästi eikä korvaavaa osoitetta ole. Erona 404-virheeseen (Not Found) on sävy: 404 merkitsee ”ei löydy (mahd. väliaikaisesti)”, kun taas 410 tarkoittaa nimenomaisesti, että sivu on lähtemättömissä. Hakukoneet käsittelevät 404:ää ja 410:tä käytännössä samoin, mutta yleisen käsityksen mukaan 410 voi johtaa hieman nopeampaan poistoonsivun poistumiseen indeksistä. Käytä 410-koodia, jos tiedät varmasti, ettet aio palauttaa sisältöä etkä halua ohjata kävijää toisaalle. Esimerkiksi vanhentunut tuotesivu, jolle ei ole suoraa vastinetta, voidaan palauttaa 410:llä. (Jos samankaltainen tuote on saatavilla, parempi ratkaisu voisi kuitenkin olla 301-uudelleenohjaus korvaavaan tuotteeseen, jotta käyttäjä löytää jotain relevanttia.)
404 Not Found – Vaikkei otsikossa mainittu, tämä on olennainen statuskoodi: sivua ei löydy. 404-virheet ovat väistämättömiä suurilla sivustoilla (poistuneet sivut, virheelliset URL:t). Hakukone huomioi 404-koodin siten, että sivu poistetaan indeksistä, jos se ennen oli siellä. Yksittäiset 404-sivut eivät haittaa sivuston terveyttä, mutta massoittain esiintyvät 404-virheet voivat viitata huonoon ylläpitoon (rikkinäiset linkit) ja syövät crawl budgetia turhaan. Suositeltavaa on tarjota käyttäjäystävällinen 404-sivu, joka ohjaa hyödyllisesti eteenpäin (esim. hakutoiminnon tai suosittujen sivujen kautta).

Uudelleenohjausten hallinnassa pidä huoli, ettei synny ketjuja tai silmukoita: useat peräkkäiset 301/302-ohjaukset lisäävät viivettä ja voivat katkaista Googlen ryömintäpolun. Googlebot seuraa enintään 5 peräkkäistä uudelleenohjausta kerralla; seuraavalla ryömintäkerralla se voi jatkaa taas 5 hyppyä, mutta yli 10 hyppyä yhteensä ei enää yhdistä linkkivoimaa perille asti. Käytännössä: ohjaa suoraan lopulliseen kohteeseen aina kun mahdollista.

Yhteenvetona: käytä 301-ohjausta pysyvissä muutoksissa, 302 vain poikkeustapauksissa, ja poista tarpeettomat sivut mieluiten 410-koodilla (tai 404, jos et erikseen halua viestiä ”pysyvää poistoa”). Seuraa Search Consolesta ”Peitto”-raporttia ja indeksointivirheitä – sieltä näet mahdolliset uudelleenohjausketjut tai -virheet ja 404-tilojen määrän. Korjaa sivuston sisäiset rikkinäiset linkit, jotta käyttäjät (ja botit) eivät eksy umpikujiin.

5. Serverivasteajat ja hostingin valinta SEO-näkökulmasta

Hakukoneet ja käyttäjät arvostavat nopeaa palvelinvastetta. Serverivasteajalla tarkoitetaan aikaa, joka kuluu siitä, kun selaimen (tai botin) pyyntö lähtee, siihen asti kun palvelin vastaa ensimmäisellä tavulla (Time To First Byte, TTFB). Hidas palvelin voi merkittävästi viivästyttää sivun latautumista, vaikka muu optimointi olisi kunnossa. Google onkin suositellut, että palvelimen vasteaika tulisi pitää alle 200 millisekunnin. Nopea hosting ja huolellinen palvelinoptimointi varmistavat, ettei sivusto menetä sijoituksia tai kävijöitä turhan viiveen takia.

Hosting-palvelun valinnassa tulee huomioida muutamia seikkoja SEO:n kannalta:

Sijainti ja CDN: Jos kohdeyleisö on pääosin tietyssä maassa, valitse palvelin mahdollisimman läheltä sitä maantieteellisesti (pienempi latenssi). Globaalille yleisölle taas CDN:n (sisällönjakeluverkon) käyttö on oleellista, mutta siitä lisää kohta erikseen.
Palvelintyyppi ja resurssit: Varmista, että palvelin (oli se jaettu, VPS, pilvi tai dedikoitu) pystyy käsittelemään sivuston liikenteen ja kuorman. Ylikuormittunut jaettu palvelin voi hidastella ruuhka-aikoina. Myös riittävä muisti ja CPU-teho dynaamisten sivujen (kuten WordPress) pyörittämiseen on tärkeää. Käytännön vinkki: seuraa serverin kuormitusastetta ja vastausaikoja esimerkiksi ping- tai uptime-työkaluilla.
Palvelinohjelmisto ja välimuisti: Nykyaikaiset web-palvelinteknologiat (kuten LiteSpeed, Nginx + PHP-FPM, HTTP/2/3 -tuki) sekä palvelinpuolen välimuistitus (esim. opcache, mikrocache) voivat tuoda huomattavia nopeushyötyjä. Esimerkiksi PHP-sivustoilla opcode-välimuisti vähentää prosessorikuormaa ja nopeuttaa vasteita.
Skaalautuvuus: Onko hostausympäristö valmis liikenteen piikkeihin? Hakukonenäkyvyys voi tuoda yllättäen paljonkin käyttäjiä – hyvä hosting joustaa (automaattinen skaalaus pilvessä tai ainakin mahdollisuus nopeasti nostaa resursseja). Myös varmuuskopiot, tietoturva ja HTTPS-tuki ovat minimivaatimuksia nykyään, mutta niistä lisää myöhemmin.

6. CDN-ratkaisut suorituskyvyn parantamiseksi

Nopean palvelinvasteen merkitystä ei voi liikaa korostaa: esimerkiksi 53 % mobiilikävijöistä poistuu, jos sivu ei lataudu ~3 sekunnissa. Hidas palvelin on usein pullonkaula, joka tekee tuon tavoitteen saavuttamisen vaikeaksi. Panosta siis hyvään hostingiin – se luo perustan kaikille muille nopeusoptimoinneille.

CDN (Content Delivery Network) on verkko maantieteellisesti hajautettuja palvelimia, jotka säilövät sivustosi staattista sisältöä (kuten kuvia, tyylejä, skriptejä) ja toimittavat sitä käyttäjille lähimmästä solmusta. CDN:n käyttö voi merkittävästi pienentää latausviivettä etenkin, jos sivustolla on kansainvälistä yleisöä tai raskaita tiedostoja. Kun eurooppalainen käyttäjä hakee sivua Yhdysvalloissa sijaitsevalta palvelimelta, voi pelkkään tiedonsiirtoon kulua satoja millisekunteja. CDN ratkaisee tämän pitämällä kopioita sisällöstä EU-alueella – näin pyynnöt eivät aina joudu matkustamaan maailman ympäri.

CDN:n hyödyt SEO:n ja käyttökokemuksen kannalta:

Nopeampi latausaika: Staattisten elementtien latenssi pienenee. Tämä näkyy suoraan käyttäjälle nopeampana sivunäkymänä ja hakukoneille parempina Core Web Vitals -mittareina (esim. Largest Contentful Paint voi parantua, kun kuvat tulevat nopeammin). Nopeuden parantuminen on kriittistä, sillä kuten todettu, yli 3 sekunnin viiveellä yli puolet mobiilikävijöistä katoaa.
Parempi luotettavuus: CDN voi tasapainottaa kuormaa ja jatkaa sisällön jakelua, vaikka alkuperäispalvelimella olisi häiriö. Monet CDN:t tarjoavat myös suojauksia DDoS-hyökkäyksiä vastaan ja älykkäitä reititysoptimointeja.
Säästää origin-palvelinta: Kun iso osa liikenteestä (toistuvat resurssipyynnöt) menee CDN:n välimuistista, varsinainen palvelimesi kuormittuu vähemmän. Tämä tarkoittaa nopeampia vasteita dynaamisille pyynnöille ja mahdollisesti pienempiä hosting-kuluja kapasiteetin osalta.

CDN-ratkaisuja tarjoavat mm. Cloudflare, Fastly, Amazon CloudFront, Akamai ja monet muut – myös useilla webhotelleilla on integroidut CDN-palvelut. Käyttöönotto on yleensä melko suoraviivaista: otat CDN:n käyttöön, päivität tarvittaessa nimipalvelinasetuksia ja varmistat, että resurssit latautuvat CDN:n URL:eista. On hyvä tarkistaa, ettei CDN aiheuta ongelmia indeksoinnille: hakukoneet yleensä pitävät CDN:n kautta tulevaa sisältöä samana kuin suoraan palvelimelta tulevaa, kunhan URL-polut ja domainit on oikein asetettu (yleensä CDN toimii niin sanottuna reverse proxynä alkuperäisdomainille tai omalla cdn.domain.com -alihostilla).

Yhteenveto: CDN parantaa suorituskykyä erityisesti globaalisti suunnatuilla sivuilla. Se toimii parhaiten staattiselle sisällölle – dynaamiset sivutkin voidaan välimuistittaa, mutta varoen (esim. kirjautuneiden käyttäjien sisällöt eivät saa mennä väärille). Oikein hyödynnettynä CDN on tehokas työkalu nopeuden ja siten myös hakukonesijoitusten parantamiseen.

7. Välimuististrategiat: selain- ja palvelinvälimuisti

Välimuisti (cache) tarkoittaa kopion tallentamista usein käytetystä tiedosta, jotta se voidaan toimittaa käyttäjälle nopeammin seuraavalla kerralla. Verkkosivujen kohdalla välimuisti toimii useassa tasossa:

Selainvälimuisti (Browser cache): Voit ohjeistaa HTTP-otsakkeilla selainta tallentamaan tietyt resurssit (kuten kuvat, CSS- ja JS-tiedostot) paikalliseen välimuistiin. Otsakkeilla kuten Cache-Control: max-age=31536000 määritellään, kuinka kauan (sekunteina) resurssi on voimassa. Esimerkiksi sivuston logokuvan voi hyvin välimuistittaa vaikka vuodeksi, jos se harvoin muuttuu – tällöin toistuvilla käynneillä selain lataa kuvan omasta välimuististaan eikä uudelleen palvelimelta. Myös ETag– ja Last-Modified-otsakkeet auttavat toteuttamaan ehdollisen välimuistin: selain kysyy palvelimelta vain, onko resurssi muuttunut, ja palvelin vastaa 304 Not Modified -koodilla, jos sisältö on ennallaan, välttäen turhan tiedonsiirron. Hyvin toteutettu selainvälimuisti voi pienentää sivulatauksen siirrettävää datamäärää huomattavasti ja nopeuttaa käyttäjän kokemaa latausta erityisesti sivuston toistuvilla vierailuilla.
Palvelinvälimuisti: Tämä tarkoittaa joko sovelluskerroksen välimuistia (kuten sisällönhallintajärjestelmän luomat staattiset HTML-versiot sivuista) tai palvelintason välimuistia (esim. Nginx microcache tai Varnish), joka tallentaa dynaamisten sivujen vastaukset tietyn ajan. Jos sivun sisältö ei muutu jokaisella kutsulla, kannattaa hyödyntää palvelinvälimuistia, jotta jokaisen kävijän kohdalla sivua ei tarvitse generoida tyhjästä. Esimerkiksi WordPress-sivustoilla välimuistilisäosat (WP Super Cache, W3 Total Cache yms.) generoivat HTML-tiedoston sivusta ja seuraavalle käyttäjälle tarjoillaan suoraan tämä tiedosto ilman raskaita PHP+MySQL -kyselyitä. Tämä vähentää merkittävästi TTFB:tä ja sivun kokonaislatausaikaa.
Proxy- tai CDN-välimuisti: Edellä mainittu CDN toimii välimuistin tavoin verkon reunalla. Myös reverse proxy -ratkaisut (kuten Varnish tai Nginx proxy_cache) palvelimen edessä tallentavat sivujen vastauksia. Nämä voivat palvella sekä anonyymit käyttäjät että hakukonebotit varsin nopeasti välimuistista. Hakukoneiden kannalta välimuistitus on läpinäkyvää – ne vain huomaavat nopean vasteen, mikä on positiivista.

Välimuististrategian suunnittelussa on tärkeää määritellä, mitkä osat sivustosta voivat olla aggressiivisesti välimuistissa ja mitkä eivät. Esimerkiksi uutissivustolla artikkelien sivut voidaan välimuistittaa minuuteiksi tai tunneiksi, mutta etusivua (joka muuttuu jatkuvasti uusista artikkeleista) ehkä vain muutamiksi sekunneiksi. Usein käytetäänkin kerrostettua välimuistia: harvoin muuttuvat aineistot (esim. kuvat, fontit, CSS) = pitkä välimuisti; dynaamiset HTML-sivut = lyhyt välimuisti mutta kuitenkin välimuisti; täysin dynaamiset sisällöt (ostoskorit, käyttäjäkohtaiset sivut) = ei välimuistia tai vain selaintason lyhyt välimuisti.

Hakukoneoptimoinnin kannalta välimuisti ei suoraan vaikuta indeksointiin, mutta se parantaa sivuston nopeutta, mikä vaikuttaa välillisesti. Google on vahvistanut, että sivun nopeus (erityisesti Core Web Vitals -mittareiden kautta) on ranking-tekijä. Lisäksi nopea sivu varmistaa, että Googlebot pystyy käyttämään crawl budgetiaan tehokkaasti: jos sivut latautuvat hitaasti tai aiheuttavat palvelimelle rasitusta, Google saattaa hidastaa indeksointia. Hyvä välimuisti takaa, että botti saa sivusta vastauksen ripeästi – jopa ruuhka-aikoina.

Muista testata välimuistiasetukset: käytä esimerkiksi Googlen PageSpeed Insightsia tai Lighthousea tarkastaaksesi, suositteleeko työkalu välimuistin pidennystä (se ilmoittaa esim. “Serve static assets with an efficient cache policy”, jos jokin tiedosto ei ole välimuistissa tarpeeksi pitkään). Säädä sitten palvelimesi tai CDN:si asetuksia vastaavasti.

8. Kuvien latauksen optimointi: lazy load, WebP ja responsiiviset kuvat

Kuvat muodostavat usein valtaosan verkkosivun tiedostokoosta, joten niiden optimoinnilla on suuri vaikutus latausnopeuteen ja siten käyttäjäkokemukseen sekä hakukonenäkyvyyteen. Tärkeimmät keinot kuvien optimointiin teknisestä näkökulmasta ovat: oikea latausajankohta (lazy loading), tehokkaat kuvaformaatit ja responsiiviset kuvat.

Lazy load (laiska lataus): Laiska lataus tarkoittaa, että kuvia (tai muita elementtejä) ei ladata ennen kuin niitä tarvitaan – tyypillisesti vasta, kun käyttäjä scrollaa sivun siihen kohtaan, jossa kuva on näkyvissä. Tämä vähentää alkuvaiheen sivulatauksen kuormaa huomattavasti, erityisesti sivuilla, joilla on paljon kuvia alhaalla. Moderni tapa toteuttaa lazy loading on HTML:n loading="lazy" -attribuutti -tageille. Selaimet tukevat tätä laajalti: ne jättävät kuvan lataamatta kunnes se on vähän ennen näkyvyyttä viewportissa. Lazy loadin ansiosta sivun yläosan sisältö tulee nopeasti näkyviin eikä käyttäjän tarvitse odottaa esim. kymmentä ”foldin” alla olevaa kuvaa latautuvaksi. Hakukoneiden kannalta lazy load on ok, kunhan se on toteutettu oikein – Googlebot renderöi sivua ja pyrkii myös lataamaan näkyviin tulevat lazy-kuvat. Varmista kuitenkin, että kriittiset yläosan kuvat (kuten sankarikuva tai logo, jos olennainen) ladataan normaalisti ilman viivettä, jotta käyttäjälle tärkein sisältö ei jää piiloon.
WebP ja muut tehokkaat formaatit: Kuvamuotojen osalta uusia tulokkaita ovat mm. WebP ja AVIF, jotka tarjoavat huomattavasti paremman pakkaustehon kuin perinteiset JPEG ja PNG. Erään Googlen tutkimuksen mukaan WebP-kuvat ovat keskimäärin 25–34 % pienempiä kuin vastaavat JPEG-kuvat laadun säilyessä yhtäläisenä. WebP tukee sekä häviöllistä että häviötöntä pakkausta, joten se sopii valokuviin ja grafiikoihin. PNG-kuville WebP:n häviötön pakkaus on niin ikään tehokkaampaa – noin 26 % pienempi tiedosto verrattuna PNG:hen. Useimmat nykyselaimet tukevat WebP:tä; on suositeltavaa palvella kuvat WebP-muodossa ainakin tukeville selaimille, ja tarvittaessa tarjota varaversio JPEG/PNG-muodossa vanhoille selaimille (tämä onnistuu -elementillä ja source-elementeillä määrittelemällä eri format-vaihtoehdot). Pienempi kuvakoko tarkoittaa nopeampaa latausta, vähemmän kaistan käyttöä ja parempaa Largest Contentful Paint -aikaa. Myös Google PageSpeed pisteyttää sivun paremmaksi, jos se havaitsee modernien kuvamuotojen käytön.
Responsiiviset kuvat: Tämä tekniikka tarkoittaa kuvien tarjoamista eri kokoisina eri laitekokoluokille, jottei mobiililaitteille ladattaisi turhan suuria kuvia. HTML:n srcset-attribuutilla voit määritellä useita versioita kuvasta eri resoluutioille, ja selain valitsee automaattisesti sopivimman. Esimerkiksi: Tällä tavalla puhelin lataa small.jpg-version (~600px leveän) eikä 1200px isoa kuvaa, mikä säästää kaistaa ja nopeuttaa latausta. Toinen tapa on käyttää -elementtiä ja media queryja, jos halutaan jopa vaihtaa kuvasuhdetta tai sisältöä eri laitetyypeille. Responsiiviset kuvat varmistavat, ettei käyttäjä lataa kaksinkertaista määrää pikseleitä näytön tarpeeseen nähden.

Muita kuvien optimointivinkkejä: pakkaa kuvien laatu sopivalle tasolle (esim. JPEG:lle useimmiten 75–85 % laatu riittää erinomaisesti), poista kuvista turhat metadata-tiedot, mitoita kuvat valmiiksi suunnilleen siihen kokoon kuin ne näytetään (vältä selaimen skaalaukseen luottamista isoista kuvista pikkukuviksi). Käytä vektorimuotoja (SVG) silloin kun kuva on graafinen ja skaalautuva (logot, ikonit) – SVG on kevyt ja terävä kaikilla resoluutioilla.

Hakukonenäkyvyyden kannalta optimoidut kuvat parantavat sivun nopeutta ja käyttökokemusta. Lisäksi kun kuvat latautuvat vikkelästi, sivu saa paremmat käyttäjäsignaalit (kuten pienempi poistumisprosentti), mikä voi vaikuttaa epäsuorasti SEO:hon. Google myös näyttää kuvahaun tuloksia, joten kuvien alt-tekstit kannattaa pitää informatiivisina – mutta se on sisällöllinen asia, tässä keskitymme tekniseen puoleen.

9. JavaScript-renderöinnin SEO-haasteet ja dynaaminen sisällöntuonti

Nykywebissä monet sivustot ovat JavaScript-vetoisia: sisältö latautuu dynaamisesti AJAX-kutsuilla tai sivut rakennetaan selaimessa esimerkiksi React- tai Vue-kehyksillä. Tämä asettaa haasteita hakukoneille, koska perinteisesti hakukoneiden botit lukivat vain HTML-lähdekoodin ilman ajettavaa JavaScriptiä. Google on tosin kehittynyt tässä – Googlebot käyttää nykyään ”evergreen” Chromium-pohjaista renderöintiä, eli se suorittaa suurimmaksi osaksi sivun JavaScriptin ja renderöi sivun samoin kuin selain tekisi. Tästä huolimatta JavaScriptin indeksointi ei ole aivan ongelmatonta:

Viivästetty indeksointi: Googlebotin indeksointi tapahtuu usein kahdessa aallossa – ensin haetaan raakaversio HTML:stä (initial crawl), ja myöhemmin erillinen renderöintiprosessi suorittaa JS:n (rendered crawl). Jos tärkeä sisältö latautuu vain JS:n kautta, sivu saattaa indeksoitua viiveellä. Pahimmillaan, jos sivulla on paljon Javaskriptiä tai ulkoisia API-kutsuja, Googlebot voi jättää osan suorittamatta resurssirajoitteiden takia. Toisin sanoen, merkittävä sisältö kannattaa tarjoilla hakukoneelle ilman monimutkaista käyttäjän vuorovaikutusta.
Renderöinnin esteet: Jos sivun dynaaminen sisältö tulee vasta käyttäjän toiminnon jälkeen (esim. käyttäjän pitää klikata ”Load more” -nappia tai täyttää hakukenttä), hakukone ei todennäköisesti näe sitä. Googlebot ei klikkaile nappuloita tai syötä lomakkeita. Siksi esimerkiksi sivujen loputon scrollaus tai laiskasti ladattavat sisällöt pitää toteuttaa niin, että ne ovat linkkien takana tai muulla tavoin botin saavutettavissa (esim. ”näytä lisää” -napin lisäksi sivutuslinkit).
URL-osoitteet ja historian hallinta: Single Page Application -tyyppiset sivustot usein manipuloivat selaimen URL-osoitetta JavaScriptillä (History API) ilman että palvelimelta haetaan uutta sivua. Tällöin on tärkeää, että jokaisella loogisella sivulla on myös indeksoitavissa oleva URL. Yleensä ratkaisu on käyttää esim. Prerendering-tekniikoita tai Server-Side Rendering (SSR), jolloin ensimmäinen lataus tarjoaa HTML:n sisältöineen, ja JS hoitaa sivun elävöittämisen päälle. Hakukoneet indeksoivat tällöin suoraan valmiin sisällön.

Dynaamisen sisällöntuonnin SEO-ystävälliset ratkaisut:

Server Side Rendering (SSR): Palvelin renderöi JavaScript-sovelluksen HTML:ksi ennen lähettämistä asiakkaalle. Näin Googlebot saa sivun sisällön heti HTML-muodossa. Tämä on suositeltavin tapa JavaScript-pohjaisille sivuille SEO:n kannalta, jos teknisesti mahdollista. Useat JS-kehykset tukevat tätä (esim. Next.js Reactille, Nuxt.js Vuelle).
Prerendering: Jos SSR:n lisääminen omaan palvelimeen on hankalaa, voi käyttää prerender-palveluja, jotka huomaavat botin User-Agentin ja lähettävät tälle valmiiksi renderöidyn sivun (välimuistista tai on-the-fly). Tämä oli aiemmin suosittu tapa Angular/React-sivustoilla. Google tosin varoittaa, ettei erilaisten sivujen tarjoaminen boteille vs. käyttäjille saa mennä cloakingin puolelle – prerendering yleisesti tunnetuilla työkaluilla on kuitenkin sallittu ratkaisu.
Isomorfinen lähestymistapa: Tämä tarkoittaa SSR:ää ja hydraatiota päälle – eli yhdistetään molempien maailmojen hyödyt. Käyttäjä ja botti saavat HTML:n, joka sisältää sisällön, ja sitten JavaScript-koodi sitoo interaktiivisuuden siihen. Lopputuloksena SEO kärsii minimaalisesti ja käyttäjäkokemus on rikas.
Tarkista indeksoitavuus: Työkalut kuten Google Search Console (URL-tarkastus -> Näytä kuin Google) tai kolmannen osapuolen renderöintitestit auttavat varmistamaan, että tärkeä sisältö näkyy indeksoijalle. Jos jokin osio puuttuu Googlen renderöimästä näkymästä, harkitse sen toteutustapaa uudelleen.

On myös hyvä huomioida, että kaikki hakukoneet eivät ole Googlen tasolla JS:n ymmärtämisessä. Bing, Yandex ja muut ovat parantaneet, mutta esimerkiksi sosiaalisen median jakonäkymät tai vanhemmat botit eivät suorita JavaScriptiä lainkaan. Siksi ainakin sivuston perusnavigaation ja kriittisten sisältöjen tulisi tulla esiin ilman scriptien apua. Esimerkiksi verkkokaupassa tuotetiedot on syytä upottaa HTML:ään, vaikka sivu käyttäisi React-komponentteja.

Lopuksi: JavaScript sinänsä ei ole vihollinen SEO:lle, mutta se tuo ylimääräisen kerroksen huomioitavaa. Testaa sivujesi toiminta ilman JS:ää – miltä sisältö näyttää? Hakukoneiden lopullisena tavoitteena on kuitenkin renderöidä sivu kuten nykyaikainen selain, joten kunhan pidät huolta, että sisältö on kohtuullisin ponnistuksin saatavilla, Google löytää sen kyllä.

10. Mobiiliystävällisyys ja responsiivinen suunnittelu

Nykyään mobiiliystävällisyys ei ole vain suositeltavaa – se on käytännössä välttämättömyys. Google on siirtynyt mobile-first indeksointiin, eli se käyttää pääasiassa sivustosi mobiiliversiota indeksoinnin ja rankingin pohjana. Käytännössä kaikilla sivustoilla indeksointi tapahtuu Googlebot Smartphone -agentilla. Tämä muutos johtuu Internetin käytön trendistä: mobiililaitteilla tehdään valtaosa hauista ja sivulatauksista. Jo vuonna 2020-2021 Google raportoi, että valtaosa sivustoista on siirretty mobile-first indeksointiin, ja loppuvuodesta 2023 mobiili-indeksoinnin kerrottiin kattavan käytännössä kaikki sivustot.

Responsiivinen suunnittelu on yleisin ja suositelluin tapa toteuttaa mobiiliystävällisyys. Responsiivinen sivusto mukautuu eri näyttöko’oille – samat URL-osoitteet ja HTML sisällöt palvelevat niin puhelinta, tablettia kuin isoa pöytäkonescreena, tyylitiedoston (CSS) media queryjen ja joustavien elementtien avulla. Google suosii responsiivisuutta, koska:

Ei tarvitse indeksoida erikseen kahta versiota sivusta (kuten erillisessä m.domain.com -ratkaisussa tapahtuu).
Kaikki linkkivoima kohdistuu yhteen URL:ään.
Käyttäjäkokemus on saumaton laitteesta toiseen siirryttäessä.

Mobiiliystävällisyydessä on useita teknisiä tarkistuskohtia: tekstin on oltava luettavaa ilman zoomia, linkkien ja nappien tarpeeksi suuria ja erillään toisistaan (ettei tap auta vahingossa väärään), sivun leveys skaalautuu oikein (meta viewport -tagi on kriittinen: tulee olla asetettuna). Myös ponnahdusikkunoiden (interstitials) käyttö mobiilissa on syytä minimoida – Google rankaisee häiritsevistä, koko näytön peittävistä pop-upeista, jotka vaikeuttavat sisällön pääsyä käsiksi.

Hakukoneoptimoinnin kannalta mobiiliystävällisyys on suoraan ranking-tekijä: Google on jo pitkään antanut mobiiliystävällisille sivuille etua mobiilihauissa. Lisäksi Google Search Console tarjoaa ”Mobiilikäytettävyys”-raportin, josta näet mahdolliset ongelmat (esim. liian pienet fontit, sisältö leveydeltään ruudun ulkopuolella, klikkauskohteet liian lähellä toisiaan). Nämä kannattaa korjata järjestelmällisesti.

Kannattaa myös testata sivut Googlen Mobile-Friendly Test -työkalulla. Se näyttää nopeasti, onko sivu mobiiliystävällinen ja jos ei, mitä ongelmia se havaitsee. Tärkeintä on ymmärtää, että mobiili on oletus: suunnittele sivu ”mobile first” eli ensin pienelle ruudulle ja skaalaa siitä ylöspäin. Tämä varmistaa, että kriittinen sisältö on ylimpänä HTML:ssä (mikä on hyvä myös SEO:lle – content first) ja että mitään ei piiloteta mobiilinäkymässä mikä olisi näkyvissä desktopissa. Jos jotain tietoa on pakko näyttää vain isolla ruudulla (vaikkapa isommat infotaulukot), varmista silti, että mobiiliversio ei täysin pudota tärkeitä avainsanoja pois.

Yhteenvetona: Mobiiliystävällisyys = käyttäjäystävällisyys = SEO-ystävällisyys. Responsiivinen design toteuttaa tämän tehokkaimmin. Ja muista, että mobiililaitteilla tapahtuu lähes 66 % verkkoliikenteestä vuonna 2025 – joten optimointi tälle enemmistölle on liiketoiminnankin edellytys.

11. AMP (Accelerated Mobile Pages) – käyttötarkoitukset ja rajoitukset

AMP on Googlen yhdessä kumppaneiden kanssa kehittämä kehys, jonka tavoitteena on tehdä mobiilisivuista erittäin nopeita ja kevyitä. AMP-sivut ovat käytännössä HTML:n alikieli, jossa on tiukat rajoitukset: vain AMP-yhteensopivaa JS-kirjastoa saa käyttää (ei omaa JavaScriptiä vapaasti), vain rajoitettuja CSS-tyylejä, kuvien ja iframejen lataus on optimoitu jne. Vastineeksi AMP-sivut voidaan ladata myös erillisestä välimuistista (Google AMP Cache) lähes välittömästi. AMP tuli alun perin suosituksi erityisesti julkaisijoiden ja uutissivustojen keskuudessa – Googlen mobiiliuutiskaruselli (Top Stories) jopa aluksi vaati AMP-formaatin päästäkseen siihen.

AMP:n käyttötarkoitukset: AMP sopii sivustoille, jotka haluavat erityisen nopeat mobiilisivut minimaalisella kehitystyöllä. AMP:lle on paljon valmiita komponentteja (amp-img, amp-video, amp-carousel jne.), joilla saa interaktiivisuutta ilman omaa koodia. Uutissivustot käyttivät AMP:ia parantaakseen käyttökokemusta ja varmistaakseen näkyvyyden Googlen uutisnäkymissä. Myös yksinkertaiset laskeutumissivut, blogiartikkelit ja sisältösivut ovat potentiaalisia AMP-kohteita. AMP-sivun voi näyttää myös suoraan esim. Twitterin tai Pinterestin sisällä nopeasti.

AMP:n hyödyt: Salamannopea lataus (yleensä alle 1 sekunnin), vakioitu ulkoasu (joka tosin voi olla myös haitta brändäyksen kannalta), Google näyttää AMP-sivuista erillisen ”⚡” merkinnän (ainakin aiemmin) mikä viestii käyttäjille nopeudesta. Lisäksi AMP välimuistitilanteessa säästää palvelimesi kaistaa – kun Google toimittaa sivun kopionaan.

AMP:n rajoitukset: Koska AMP on rajoitettua HTML:ää, sivuston ominaisuudet voivat jäädä karsituiksi. Ei voi käyttää vapaasti kolmannen osapuolen skriptejä (paitsi amp-iframe tietyin ehdoin), monimutkaiset personoinnit tai interaktiot eivät onnistu samalla tavalla. Tyypillisesti AMP-sivuista tulee hyvin riisuttuja. Tämä voi heikentää brändikokemusta tai mainosmahdollisuuksia – tosin AMP tukee mainosverkkoja, mutta niiden toteutus on myös standardisoitu. Myös analytiikka täytyy toteuttaa AMP-tyylillä (AMP Analytics -komponentilla), mikä vaatii erillistä konffausta.

Huomionarvoista on, että Google ei enää vaadi AMP:ia Top Stories -karuselliin (vuodesta 2021 alkaen, Page Experience -päivityksen myötä). Tämä vähensi joidenkin sivustojen halukkuutta ylläpitää erillistä AMP-versiota, koska hyvin optimoidut responsiiviset sivut voivat pärjätä yhtä lailla. AMP:n merkitys SEO:ssa on siis hieman vähentynyt: se on yksi tapa saavuttaa nopea mobiilikokemus, muttei ainoa. Google käsittelee AMP-sivuja normaalisti hakutuloksissa; joskus ne voidaan priorisoida mobiilikäyttäjille nopeutensa ansiosta, mutta AMP itsessään ei ole ranking-tekijä – vaikutus tulee nopeudesta.

Päällekkäinen sisältö & indeksointi: Jos toteutat AMP-sivut, ne ovat yleensä erillisiä URL-osoitteita (esim. site.com/page/ ja site.com/page/amp/). Tällöin muista asettaa canonical-tunniste AMP-sivulle osoittamaan alkuperäiseen (desktop/responsiiviseen) sivuun. Desktop-versiolle puolestaan laitetaan osoittamaan AMP-versioon. Näin Google tajuaa niiden olevan samaa sisältöä. Usein hakutuloksissa mobiililla Google saattaa suoraan ohjata käyttäjän AMP-versioon (ja näyttää URL:n AMP-välimuodin kautta).

Milloin kannattaa käyttää AMP:ia? – Jos sinulla on paljon mobiilikävijöitä hitailla yhteyksillä ja suhteellisen staattista sisältöä (esimerkiksi media, blogit) ja haluat mahdollisimman helpon tavan varmistaa huippunopeuden, AMP voi olla harkitsemisen arvoinen. Monet ovat kuitenkin siirtyneet pois AMP:sta, koska hyvä responsiivinen optimointi ja Core Web Vitals -parannukset voivat tuoda saman hyödyn ilman kahden erillisen sivuversion ylläpitoa. Myös se, ettei AMP enää anna automaattista etulyöntiasemaa Googlen uutiskaruselliin, on vähentänyt sen tarvetta.

Yhteenveto: AMP on edelleen olemassa ja käyttökelpoinen, mutta ei välttämätön. Se on eräänlainen ”mobiilisivujen turboasetukset” -kehikko, joka taklaa teknisiä hidasteita. Varmista vain, että sisältö on identtistä AMP- ja normaaliversioissa, jottei SEO kärsi (esim. AMP-versiosta puuttuisi jotain sisältöä). Ja pidä silmällä sivustosi Core Web Vitals -arvoja – jos ne saa kuntoon ilman AMP:ia, erillistä AMP-polun ylläpitoa ei välttämättä tarvita.

12. HTTP/2, HTTP/3 ja TLS-optimoinnit verkkoyhteyksissä

Verkkoprotokollien kehitys tuo suorituskykyetuja, jotka heijastuvat myös hakukoneoptimointiin nopeuden kautta. HTTP/2 ja HTTP/3 ovat uudempia versioita HTTP-protokollasta, joita selaimet ja palvelimet tukevat laajasti. Lisäksi TLS-protokollan uudempi versio (TLS 1.3) nopeuttaa salatun yhteyden muodostamista. Näiden käyttöönotto on tekninen toimenpide, mutta suositeltavaa kaikille sivustoille.

HTTP/2: Julkaistu 2015, HTTP/2 toi mukanaan yhteyden multiplexoinnin (useita pyyntöjä ja vastauksia voi kulkea yhtäaikaisesti yhden yhteyden yli), pyyntöjen priorisoinnin ja pakkausparannuksia otsaketietoihin. Käytännössä tämä tarkoittaa, että sivun latauksessa ei tarvitse avata kymmeniä erillisiä TCP-yhteyksiä rinnakkaisiin resurssilatauksiin, vaan yksi tai muutama yhteys riittää – ja resurssit latautuvat nopeammin ja tasaisemmin. HTTP/2 tukee myös server push -ominaisuutta, jolla palvelin voi ennakoivasti työntää tiettyjä resursseja asiakkaalle ilman erillistä pyyntöä (tätä tosin käytetään nykyään harvemmin, ja Chrome on poistanut tuen HTTP/2 pushille). SEO-mielessä HTTP/2:n hyöty näkyy erityisesti lyhyempinä sivun latausaikoina, kun sivulla on paljon elementtejä. Hakukoneet itsekin indeksoivat HTTP/2:n yli, jos palvelin tukee – Googlebot alkoi indeksoida HTTP/2:lla jo 2020, mikä tehostaa heidän resurssinkäyttöään. Tilastollisesti vuonna 2024 noin 70–71 % sivustoista vastaa HTTP/2:lla selaimille. Jos sivustosi on vielä vanhalla HTTP/1.1:llä, kannattaa päivitys tehdä – useimmat web-palvelimet (Apache, Nginx, IIS) tukevat HTTP/2:ta kunhan ne on päivitetty ja TLS käytössä.
HTTP/3: Tämän seuraajan merkittävin ero on siirtyminen TCP:stä QUIC-protokollaan (UDP-pohjainen). HTTP/3 (valmistui standardiksi 2020) vähentää viivettä erityisesti huonolaatuisilla verkoilla, koska QUIC välttää TCP:n head-of-line blocking -ongelman ja sisältää sisäänrakennetun salauksen (vastaava TLS 1.3). Käytännössä HTTP/3 nopeuttaa yhteyden muodostumista ja tiedonsiirtoa mobiiliverkoissa tai pitkän matkan yhteyksissä. Selaimista Chrome, Firefox, Edge tukevat HTTP/3:a, samoin monet suuret verkkopalvelut (esim. Cloudflare tarjoaa HTTP/3-yhteydet). Vuoden 2024 alussa arviolta vain 7–9 % sivustoista latasi sisältöä HTTP/3:lla keskimäärin, mutta käyttö kasvaa nopeasti (W3Techsin mukaan noin kolmannes sivustoista tukee jo HTTP/3:a serveripuolella). SEO:n kannalta HTTP/3 on vielä hienosäätöä – jos palvelininfrastruktuurisi tukee sitä (usein CDN:ien kautta), ota ihmeessä käyttöön, mutta sen puuttuminen ei suoranaisesti rankaise sinua. Se parantaa kuitenkin jälleen käyttäjäkokemusta nopeudella, ja Google on maininnut, että kaikki nopeusparannukset heijastuvat sivun laatukokemukseen.
TLS-optimoinnit (HTTPS): Tietoturvallinen protokolla HTTPS on välttämättömyys (Google rankaisee käytännössä HTTP-sivustoja merkitsemällä ne ”Ei turvalliseksi” Chrome:ssa). TLS-yhteyden muodostaminen lisää hieman viivettä, mutta TLS 1.3 -version myötä handshake on nopeutunut (vähemmän viestinvaihtoa). Kannattaa varmistaa, että palvelin tukee TLS 1.3:a – se on nopein ja myös turvallisin. Tilastojen mukaan yli 70 % sivustoista onkin jo siirtynyt TLS 1.3:een. Lisäksi käytännön optimointeja: OCSP Stapling (nopeuttaa sertifikaatin varmistusta), HTTP/2 TLS Session Reuse (uudelleenkäyttö nopeuttaa peräkkäisiä yhteyksiä), ja varmistu että salausasetukset ovat nykyaikaiset (vahva avainvaihto, ei vanhentuneita chiffereitä – SEO:hon ei vaikuta, mutta tietoturvaan kyllä).

Yhteenveto protokollista: Ne ovat pinnan alla vaikuttavia tekijöitä, jotka useimmiten saa käyttöönsä päivittämällä palvelinohjelmiston tai ottamalla käyttöön CDN:n. Hakukoneoptimoinnissa jokainen millisekunti sivun nopeudessa merkitsee, joten HTTP/2:n tuoma jopa ~20-30% nopeutus moniresurssisilla sivuilla on merkittävä. Samoin HTTP/3 voi tuoda etua mobiilikäytössä. Google ei suoraan palkitse ”käytät HTTP/3:aa” –mutta se palkitsee nopeudesta, jonka nämä protokollat mahdollistavat.

13. Crawl budgetin hallinta suurilla sivustoilla

Crawl budget eli indeksointivara viittaa siihen määrään sivuja, jonka hakukone indeksoi sivustoltasi tietyssä ajassa. Pienillä sivustoilla (muutama sata tai tuhat sivua) crawl budget ei yleensä ole pullonkaula – Googlebot vierailee riittävän usein ja indeksoi kaiken merkittävän sisällön. Kuitenkin suurilla sivustoilla (kymmenistä tuhansista miljooniin URL-osoitteisiin) indeksointivaraa on hallittava, jotta tärkeät sivut tulevat indeksoiduksi eikä hakubotti tuhlaa aikaa turhiin tai toissijaisiin sivuihin.

Google määrittelee sivustokohtaisen indeksointibudjetin useiden tekijöiden pohjalta: sivuston hostausresurssit (Google ei halua ylikuormittaa palvelintasi – jos palvelin vastaa hitaasti tai virheillä, Google hidastaa crawlia), sisällön tuoreus (usein päivittyvät sivut indeksoidaan useammin), sivun PageRank/autoriteetti (arvokkaampina pitämänsä sivut Google käy useammin) sekä kokonaissivumäärä jne.

Muutamia periaatteita crawl budgetin hallinnassa:

Poista tai estä turhat URL-variaatiot: Suurilla sivuilla usein syntyy valtava määrä teknisiä URL:eja, jotka käytännössä näyttävät samaa sisältöä – esimerkiksi loputtomat filtteri- ja hakusivujen yhdistelmät (faceted navigation), kalenterin päiväkohtaiset URL:t, session ID:t URL:issa, jne. Nämä voivat räjäyttää indeksoitavien osoitteiden määrän moninkertaiseksi ilman lisäarvoa. Ratkaisuina: estä robots.txt:llä ryömintä tietyissä turhissa hakemistopoluissa tai parametreissa; käytä rel="nofollow" sisäisissä linkeissä joihinkin generaattorilinkkeihin (jos et halua Googlebotin seuraavan niitä); tai lisää noindex-metatagi sivuille, joita hakutuloksiin ei haluta (tosin noindex-sivujen crawlaukseen voi siltikin kulua budjettia, vaikkakin Google harventaa käyntejä noindex-merkinnän havaittuaan). Google Search Console tarjosi aiemmin URL-parametrityökalun, jossa sai määritellä miten tietty parametri vaikuttaa sivun sisältöön – tämä työkalu kuitenkin poistettiin huhtikuussa 2022, koska Googlen mukaan siitä oli vähän hyötyä ja sen algoritmit osaavat nykyään päätellä asiat automaattisesti. Eli nykyään on entistä tärkeämpää suunnitella sivusto niin, ettei turhia URL-variaatioita synny tai ainakin ettei niitä päädytä seuraamaan indeksoinnissa.
Tarkenna sisäistä linkitystä: Ohjaa hakurobotin polkuja sinne, minne haluat sen menevän. Käytä sivukartan lisäksi vahvaa sisäistä linkkiverkostoa tärkeille sivuille. Varmista, että mikään indeksoitava sivu ei ole yli muutaman klikkauksen päässä etusivusta – syvä linkitys auttaa Googlea löytämään uudet ja päivittyvät sivut. Samalla älä linkitä turhanpäiten sivuja, joilla ei ole arvoa indeksoituna (esim. ”järjestä näkymä” -sivut tai loputtomat sivutuslinkit syvälle asti). Pro-tip: Harkitse ”noindex, follow” -metatagin käyttöä sivuilla, joista haluat Googlen seuraavan linkkejä eteenpäin mutta et halua itse sivua indeksoitavan (vaikkapa suodatetut tuotelistaukset).
Priorisoi tuore ja muuttunut sisältö: Googlebot käyttää crawl demand -logiikkaa – jos sivu päivittyy usein tai on ajankohtainen, indeksointitiheys kasvaa. Toisaalta vanhat staattiset sivut voidaan indeksoida harvoin. Suurilla sivustoilla on hyödyllistä pingata hakukonetta, kun uutta sisältöä tulee (esim. lähettämällä XML-sivukartta päivityksen yhteydessä Ping-rajapintaan tai käyttämällä Indexing API:a tietyissä tapauksissa, kuten työpaikkailmoituksissa tai livestream-sisällössä joita Indexing API tukee). Tämä varmistaa, että budjettia käytetään ajankohtaisiin sivuihin.
Seuraa indeksointilokeja: Ota palvelimen lokitiedostoista (tai Search Consolen Crawl Stats -raportista) dataa, kuinka paljon Googlebot kuluttaa sivuja päivässä ja minne se menee. Jos huomaat, että Google käyttää merkittävän osan ajastaan merkityksettömien sivujen indeksointiin (vaikkapa tuhansia hakuparametrisivuja), tee toimenpiteitä ohjataksesi botin pois niistä (kuten edellä mainitut robots.txt-estot tai linkitysstrategian muutos). Esimerkki: Search Console saattaa näyttää, että Googlebot tekee 500 000 pyyntöä päivässä sivustollesi, mutta vain 50 000 on ”valid index” -sivuja ja loput esim. ”Excluded” (pois suljettu) -kategorian sivuja. Tämä kertoo optimointipaikoista.
Sivulatausnopeus ja palvelimen kapasiteetti: Google säätelee indeksointia myös sen mukaan, miten nopeasti ja virheettä sivusto vastaa. Jos palvelin alkaa antamaan 5xx-virheitä tai vastausajat kasvavat, Googlebot peruuttaa ja hidastaa ryömintää. Tämä on suojamekanismi. Sinun kannalta se tarkoittaa: pidä palvelin nopeana ja toimintavarmana, niin Google uskaltaa indeksoida enemmän. Hakukonebotit nostavat rinnakkaisten pyyntöjen määrää kun edelliset pyynnöt vastaavat nopeasti. (Search Consolen indeksointitilastoista näet käyrää: ”Average response time” ja ”Crawl requests per day” – näillä on usein käänteinen korrelaatio – nopea vaste = enemmän pyyntöjä sallittu).

Crawl budget on eniten esillä jättimäisillä sivustoilla kuten verkkokaupoilla, ilmoitussivustoilla, indekseillä tms. Yleispäätelmä on: tee sivustostasi mahdollisimman crawl-ystävällinen – nopea, siisti URL-rakenne, vähän duplikaatteja, selkeät sivustokartat – niin et joudu yleensä budjettirajoista kärsimään. Jos sisältömäärä on massiivinen, priorisoi – joskus on järkevää estää indeksointi osasta vähemmän arvokkaita sivuja, jotta tärkeimmät tulevat indeksoiduksi useammin. Googlebotin kapasiteetti internetissä on valtava, mutta yksittäiselle sivustolle se on aina rajallinen resurssi, jota kannattaa ohjata tarkoituksenmukaisesti.

14. HTTPS-migraatio, SSL-/TLS-varmenteet ja turvallisuus

HTTP -> HTTPS -siirtymä on yksi merkittävimmistä teknisistä muutoksista monille sivustoille viime vuosina. HTTPS (eli SSL/TLS-suojattu HTTP) salaa tiedon ja vahvistaa sivuston aitouden käyttäjille. SEO:n kannalta Google on jo vuodesta 2014 pitänyt HTTPS:ää pienenä ranking-tekijänä – ja ennen kaikkea vuonna 2018 Chrome alkoi näyttää ”Not secure” -varoitusta kaikille HTTP-sivuille, mikä karkottaa käyttäjiä. Nykyään yli 80–85 % verkkosivustoista käyttää voimassaolevaa SSL-varmennetta, eli HTTPS on normi.

HTTPS-migraation huomioita:

301-uudelleenohjaus kaikista HTTP-URL:istä HTTPS-versioon: Tämä on kriittistä. Kun hankit SSL-varmenteen ja asetat sivuston palvelemaan HTTPS:n yli, varmista, että sekä http://domain että http://www.domain (ja muut mahdolliset variaatiot) ohjataan lopulliseen https:// yhden hyppäyksen 301-ohjauksella. Tämä takaa, että hakukoneet siirtävät ranking-signaalit HTTPS-osoitteisiin. Älä käytä 302-ohjausta tässä, koska muutos on pysyvä.
Päivitä kaikki koodissa olevat sisäiset linkit ja resurssit: Vaihda kovakoodatut ”http://” -osoitteet ”https://” muotoon. Sekasisältö (mixed content) syntyy, jos HTTPS-sivulla yritetään ladata jokin resurssi HTTP:n kautta – selain saattaa estää sen (esim. skriptit ja tyylit estetään kokonaan, kuvat voivat latautua mutta osoitepalkissa näkyy varoitus). Mixed content -ongelmia voi korjata käsin tai Content Security Policyllä (asettamalla upgrade-insecure-requests -direktiivin, joka pakottaa HTTP-resurssipyynnöt HTTPS:lle jos mahdollista). Pidä huoli, että esim. CSS-tiedostot, JS ja kuvat haetaan kaikki https:// poluilla. Usein suhteellisten polkujen käyttö tai ”protocol-relative” //domain.com -muoto auttaa.
SSL-/TLS-varmenteet: Valitse luotettu varmenteen myöntäjä (CA). Nykyään esim. Let’s Encrypt tarjoaa ilmaisia SSL-varmenteita, jotka uusitaan automaattisesti – kynnys on hyvin matala ottaa käyttöön. Varmista sertifikaatin kattavuus (yksi domain vs. wildcard vs. useamman domainin SAN-varmenne, tarpeen mukaan). Teknisiä kriteerejä hakukoneiden suuntaan: varmenteen on oltava kunnossa, muuten sivut voivat pudota indeksoinnista (Google Search Console ilmoittaa, jos sertti on vaikka umpeutunut tai epäluotettava).
HSTS (HTTP Strict Transport Security): Tämä on HTTP-otsake, jolla voit kertoa selaimille (ja epäsuorasti hakukoneillekin), että sivusto tarjoaa sisältöä vain HTTPS:n kautta. Esim. Strict-Transport-Security: max-age=31536000; includeSubDomains; preload. Kun tämä otsake on asetettu, selain ei edes yritä seuraavalla kerralla muodostaa yhteyttä HTTP:n kautta vaan menee suoraan HTTPS:ään. SEO-mielessä HSTS parantaa turvallisuutta ja suorituskykyä marginaalisesti (poistaa yhden uudelleenohjausvaiheen ensikäynnillä), ja Google Chrome lisäksi ylläpitää HSTS Preload -listaa, jonne voi ehdottaa sivustoaan – jos pääsee listalle, Chrome ja muut selaimet tietävät aina käyttää HTTPS:ää ensimmäisestä pyynnöstä lähtien. HSTS:n käyttöönoton jälkeen varmista, että todellakin HTTP-versio ohjaa toimivasti HTTPS:ään – koska kerran jaettu HSTS-käsky jää selaimeen voimaan määajaksi (max-age).
Ranking vaikutukset: HTTPS-siirto on periaatteessa sivuston URL-osoitteiden vaihtoa, joten pidä mielessä normaali sivuston muuton checklista SEO:n kannalta: indeksoi sivusto uudelleen (lähetä uusi sivukartta HTTPS-URL:illä Search Consoleen, päivitä tarvittaessa disavow-tiedosto jos semmoinen on, koska se on erillinen http/https:lle), seuraa 404- ja 500-virheiden varalta, monitoroi sijoituksia. Yleensä hyvin tehdyssä HTTPS-muutossa ei tapahdu notkahdusta liikenteessä – jos tapahtuukin, se korjaantuu pian kun Google käsittää ohjaukset. Koska nykyään valtaosa sivustoista on jo HTTPS, et saa enää ”erityistä” nostetta, mutta ilman sitä olisit heikossa asemassa.
Turvallisuus: SSL on yksi osa sivuston turvallisuutta. Hakukoneet arvostavat turvallisuutta laajemmin: hakattu sivusto tai malwarea jakava sivu poistuu nopeasti hakutuloksista ja saa varoituslätkän. Siksi tekninen turvallisuus (ajantasaiset ohjelmistot, suojaukset injektioita vastaan) on SEO:n perusedellytys – mainittakoon tässä koska turvallisuus ja HTTPS kulkevat käsi kädessä. Google Search Console ilmoittaa ”Security Issues” -osiossa, jos sivustolla havaitaan hakkeroinnin merkkejä tai haittaohjelmia, ja ne on tietenkin kriittistä korjata heti.

Yhteenveto: Tee HTTPS-migraatio jos et ole jo tehnyt – se on standardi. Kun teet, tee se huolellisesti 301-ohjauksin ja testaa joka osa-alue. Pidä sertifikaatti aina voimassa (aseta automaattiset uusinnat ja hälytys, jos uusiminen epäonnistuu). Käytännössä Googlen mukaan yli 80 % hakutulosten sivuista on HTTPS nykyään, eli et halua olla joukosta poikkeava. Käyttäjät luottavat lukkokuvakkeeseen, ja hakukoneet luottavat siihen, että sivustosi on ajan tasalla.

15. Site speed -analyysityökalut ja jatkuvat auditoinnit

Teknisen SEO:n työkalupakkiin kuuluu oleellisena osana sivuston nopeuden mittaaminen ja teknisten asioiden säännöllinen auditointi. Nopeus on siitä hankala optimointikohde, että ”et voi parantaa sitä mitä et mittaa”. Lisäksi sivusto kehittyy jatkuvasti – uudet ominaisuudet tai sisällöt saattavat vahingossa tuoda takaisin vanhoja ongelmia. Siksi jatkuva seuranta on suositeltavaa.

Site speed -analyysityökalut:

Google PageSpeed Insights & Lighthouse: Googlen PageSpeed Insights -palvelu (ja Chrome DevToolsista tai PageSpeedin kautta saatava Lighthouse) antaa erinomaisen analyysin yksittäisen sivun suorituskyvystä sekä mobiili- että desktop-näkymässä. Se antaa sivulle pisteytyksen ja listaa parannuskohteita (esim. ”Poista renderöintiä estävä JS/CSS”, “Optimoi kuvat”, ”Lyhennä palvelimen vastausaikaa”). Lisäksi PageSpeed Insights raportoi Core Web Vitals -arvot, jotka perustuvat todellisiin käyttäjädataan (CrUX). Core Web Vitals -mittarit – Largest Contentful Paint (LCP), First Input Delay (FID) (nyk. korvattu Interaction to Next Paint, INP) ja Cumulative Layout Shift (CLS) – ovat Googlen tärkeitä sivukokemusmittareita. Kesäkuusta 2021 lähtien nämä web vitals -arvot vaikuttavat myös hakutulossijoituksiin (osana Page Experience -päivitystä). Siten PageSpeed/Lighthouse on käytännössä pakollinen työkalu, koska se näyttää sekä labratestin että usein myös Field Data (käyttäjien kokea data) näistä mittareista.
WebPageTest: Kehittyneempi työkalu syväsukellukseen. Antaa videoita, vesiputouskaavioita, tarkat ajat jokaiselle latausvaiheelle, mahdollisuuden testata eri sijainneista, laitteista ja verkoista. WebPageTest on oiva debuggausväline, jos PageSpeed Insights havaitsee ongelman ja haluat tarkemmin tutkia syitä.
GTmetrix: Yhdistelmätyökalu, joka käyttää sekä Lighthousea että omia mittareitaan. Suosittu, helppokäyttöinen käyttöliittymä. Tarjoaa myös monitoring-ominaisuuksia ilmaiseksi rajatusti.
Search Console (Core Web Vitals -raportti): Google Search Console kerää Chrome User Experience -raportin pohjalta tiedot sivustosi CWV-suorituskyvystä. Raportti jakaa sivut ryhmiin (URL-ryppäisiin) ja kertoo kuinka moni niistä on hyvä/kehno kussakin mittarissa. Tämä on tärkeä seuranta, koska Google käyttää nimenomaan tätä field dataa ranking-algoritmissaan. Voit siis työkalun avulla nähdä, jos jokin sivutyyppi (esim. tuotesivut) on laajasti ongelmissa vaikkapa LCP:n osalta.
Muut analyysityökalut: Pingdom, Dareboost, Seobility, YSlow (vanha, ei enää niin ylläpidetty) jne. Antavat vastaavia huomioita. Lisäksi Chrome DevTools on korvaamaton reaaliaikaiseen tarkasteluun ja esimerkiksi Performance-profiilin ottamiseen sivun renderöinnistä. Speed Index, Time to Interactive ja monet muut mittarit voi analysoida.

Jatkuvat auditoinnit:

Teknisen SEO:n auditointi ei ole kertaluonteinen projekti vaan jatkuva prosessi. On järkevää tehdä säännöllisiä tarkistuksia vaikkapa joka kvartaali tai vähintään pari kertaa vuodessa, ja erityisesti aina isojen sivustopäivitysten jälkeen. Näihin auditointeihin kuuluu mm.:

Crawl audit: Aja sivuston läpi esimerkiksi Screaming Frogin tai Sitebulbin kaltaisella indeksointityökalulla. Ne simuloivat hakukoneen crawlauksen ja löytävät teknisiä ongelmia: rikkinäiset linkit, puuttuvat meta tagit, duplikaatti title/meta, liian syvällä hierarkiassa olevat sivut, sivut joille ei ole sisäisiä linkkejä (orvot sivut) jne. Myös XML-sivukartan ja sivuston todellisen sisällön vertailu on hyvä tehdä (löytyykö sivukartasta sivuja jotka puuttuu sivustolta tai päin vastoin).
Lokianalyysi: Kuten myöhemmin kohdassa 18 käsitellään, analysoi palvelinlogeja säännöllisesti tai käytä siihen työkaluja. Tämä paljastaa indeksointisuuntausta ja virheitä, joita muuten voi olla vaikea havaita (esim. Googlebot indeksoi jatkuvasti jotain 404-osoitteita, joita ei edes linkitetä – tämä voi vihjata vanhoista ulkoisista linkeistä tms.).
Turvallisuusauditointi: Tarkista, että kaikki tarvittavat suojausotsakkeet ovat asetettu (kuten kohdassa 19 käsitellään: CSP, HSTS, jne.), ettei sivustolla ole avoimia listauksia, testisivuja indeksoituna, ja että varmenteet on kunnossa.
Yhteensopivuusauditointi: Välillä kannattaa testata sivusto useilla eri laitteilla ja selaimilla (esim. Safari iOS, Chrome Android, Firefox jne.) – tekninen SEO kattaa myös sen, että kaikki käyttäjät ja botit pystyvät käyttämään sivustoa. Esim. jos sivusto on vahvasti riippuvainen JavaScriptistä, testaa myös vanhemmalla laite/selainyhdistelmällä ettei ole yhteensopivuusongelmia (Googlebot tosin on melko moderni, mutta muiden bottien kohdalla…).
XML-sivukarttojen ja robots.txt:n tarkistus: Varmista, että sivukartat päivittyvät ja robots.txt estot ovat ajan tasalla. Jos sivuston rakenne on muuttunut, päivitä ohjeistukset.
Räätälöidyt tarkistuslistat: Hyvä käytäntö on ylläpitää omaa teknisen SEO:n tarkistuslistaa asioista, jotka on teidän sivustolla erityisen tärkeitä. Esimerkiksi verkkokaupalla listalla voi olla: kaikki tuotteet indeksoitavissa (ei vahingossa noindex), tuotelistauksissa canonicalit, arvostelusivut noindex, skeemamerkinnät oikein tuotteissa, sivutuslinkitys rel=prev/next (huom: Google ei tätä virallisesti enää tue, mutta se on silti hyödyllinen navigoinnin kannalta), kuvien alt-tekstit ei tyhjiä jne. Käy lista läpi säännöllisesti tai automaatioiden avulla.

On havaittu, että valtaosalla verkkosivuista on teknisiä SEO-virheitä – Ahrefsin tutkimuksessa mm. 80 % sivustoista puuttui alt-tekstejä kuvista, 59 %:lla puuttui H1-otsikko tai se oli tyhjä, ja 66 %:lla sivustoista oli sivuja, joilla oli vain yksi sisäinen linkki niihin. Tällaisten lukemien valossa on selvää, että jatkuva seuranta kannattaa: kilpailuetua saa jo sillä, että huolehtii tekniset perusasiat paremmin kuntoon kuin kilpailijat.

Automatisointi: Mikäli resurssit sallivat, hyödynnä CI/CD-putkea ja testausautomaatiota – esimerkiksi Lighthouse voidaan ajaa osana julkaisuputkea ja jos pisteet putoavat alle tietyn rajan, tutkitaan ennen tuotantoon menoa. Samoin vakio-otsakkeiden tai tagien olemassaoloa voi tarkkailla ohjelmallisesti. On kehittymässä myös työkaluja, jotka valvovat sivustoa ja hälyttävät, jos jokin tekninen SEO -mittari muuttuu radikaalisti (esim. indeksoitavien sivujen määrä tippuu, robots-tiedostoon ilmestyy uusia estoja tms.).

Yhteenvetona: Ota nopeustyökalut tavaksi – lataa PageSpeed Insights -raportti tärkeimmille sivuille kuukausittain, katso ovatko Core Web Vitals -arvot ”vihreällä” (LCP < 2,5 s, FID/INP < 200 ms, CLS < 0,1 suositusten mukaan). Tee tekninen SEO -auditointi säännöllisesti tai ainakin aina isoja muutoksia tehtäessä. Tämä jatkuva huolenpito varmistaa, ettei ikäviä yllätyksiä (esim. pudonneita sivuja indeksistä tai hidastunutta suorituskykyä) pääse kertymään pitkäksi aikaa.

16. Fonttien latausstrategiat ja webfonttien optimointi

Webfontit (kuten Google Fonts tai Adobe Fonts -kirjastojen käyttämät mukautetut kirjasimet) ovat keskeinen osa modernia web-designia, mutta ne voivat myös hidastaa ensimmäisen tekstisisällön näkymistä käyttäjälle. Oikeilla latausstrategioilla voimme nauttia typografian rikkaudesta ilman merkittävää suorituskykyheikennystä.

Keskeisiä huomioita fonttien optimoinnissa:

Formaatin valinta: Käytä moderneinta laajasti tuettua formaattia, eli WOFF2-muotoa. WOFF2 hyödyntää Brotli-pakkausta ja tarjoaa noin 30 % paremman pakkaustehon kuin edeltäjänsä WOFF. Tiedostokoon pienentyminen tarkoittaa nopeampaa latausta. Nykyisin lähes kaikki selainversiot tukevat WOFF2:ta, joten voit useimmiten tarjoilla vain WOFF2-version fontista. Vanhat formaatit (TTF, EOT, SVG) voidaan unohtaa, ellei tueta todella muinaisia selaimia. WOFF2-only on suositus (ja fallbackina korkeintaan WOFF1 hyvin vanhoille laitteille).
Fonttien esilataus ja -yhteydet: Fonttitiedostot latautuvat usein ulkoisesta lähteestä (esim. Google Fonts). Selaimelle voi kertoa ennakkoon, että fontteja tarvitaan, jotta se aloittaa haun ajoissa. HTML:n luo etukäteen yhteyden fonttipalvelimeen. Lisäksi voi varmistaa, että kriittinen fontti alkaa latautua heti sivun alussa. Preloadin kanssa on kuitenkin oltava tarkkana: käytä sitä vain tärkeimmälle fontille, ettei selain rupea lataamaan kymmeniä fonttivariaatioita etukäteen turhaan (se voisi jopa haitata muun sisällön latausta).
Fontin latausnäkyvyys (FOUT/FOIT): Olet ehkä nähnyt ilmiön, jossa sivun tekstit eivät näy lainkaan hetkeen sivun latautuessa (FOIT = Flash of Invisible Text), tai toisaalta ne näkyvät ensin väärällä fontilla ja vaihtuvat sitten oikeaan (FOUT = Flash of Unstyled Text). FOIT tapahtuu, jos selain piilottaa tekstin kunnes fontti on ladattu. Tämä riippuu selaimesta ja CSS:n font-display -asetuksesta. On suositeltavaa käyttää CSS:ssä font-display: swap webfonteille: tällöin selain näyttää tekstin välittömästi varafontilla ja vaihtaa webfonttiin kun se saapuu. Tämä varmistaa, ettei käyttäjä joudu tuijottamaan tyhjää tilaa. Pieni tyylillinen ”välähtäminen” on yleensä parempi kuin tyhjä sivu sekuntikaupalla. (Core Web Vitals -mittareista CLS voi tosin hieman kasvaa, jos vaihto muuttaa tilavuutta, mutta yleensä swap on paras kompromissi.)
Fonttien alijoukko (subsetting): Monissa fonttitiedostoissa on tuhansia glyyfejä (kirjaimia, merkkejä), joista tyypillinen sivusto tarvitsee murto-osan. Voit parantaa suorituskykyä luomalla rajatumman version fontista, joka sisältää vain tarvitut merkit. Esim. jos sivusto on vain englanniksi, ei ehkä tarvita kyrillisiä, kreikkalaisia tai erikoismerkkejä. Työkaluja on (esim. fontello, glyphhanger, font-subsetter) joilla voi poistaa ylimääräiset glyyfit ja pienentää fonttitiedoston kokoa. Tämä tosin vaatii manuaalista askartelua. Unicode-range CSS:ssä voi myös määrittää selaimelle, että tietty fonttitiedosto kattaa vain tietyn merkkialueen (selaimet voivat näin ladata fontin vasta kun sen merkkejä tarvitaan).
Itse hostatut vs. kolmannen osapuolen fontit: Monet käyttävät Googlen fonttipalvelua linkkaamalla suoraan Google Fonts -CSS:ään. Helppoa, mutta siihen liittyy ylimääräisiä pyyntöjä (ensin CSS, sitten fontit), ja GDPR-keskustelun takia jotkut välttelevät ulkoisia fonttihakuja. Itse hostaamalla fontit voit vähentää DNS-hakuja ja pakata CSS:ää yhteen. Tosin Googlen palveluissa on se etu, että ne voivat tarjota esim. fonttien vaihtuvuutta tai käyttäjillä saattaa olla fontti jo välimuistissa jos käyneet toisella sivulla.

Vaikutus SEO:hon: Fonttien lataus vaikuttaa Largest Contentful Paint -aikaan (jos iso otsikko ei näy, LCP lykkääntyy) ja First Contentful Paint -aikaan. Hitaat fontit siis heikentävät web vitalseja, ja sitä kautta voivat heikentää sivun Page Experience -signaalia hakukoneelle. Varsinkin mobiilissa isot fonttipaketit voivat olla huono juttu.

Yhteenveto fonttistrategiasta: Käytä vain tarvittavia fontteja ja painovariaatioita (vähemmän on enemmän – jokainen lihavointi tai kursivointi voi olla erillinen tiedosto ellei fontti tue variaxista), valitse moderni formaatti (WOFF2) ja aseta fonttien lataus fiksusti ennakoiden ja ”swapaten”. Testaa sivu ilman fontteja ja fonttien kanssa – pyri siihen, että erotus ensimmäisen tekstin ilmestymisessä on mahdollisimman pieni.

Esimerkiksi, jos käytät Google Fontseja: lisää display=swap -parametri fonttien CSS-hakuun, esilataa tärkein fontti, ja varmista että varafontti on määritelty (CSS-font stackissa) tyylillisesti lähelle haluttua. Tällä tavoin saavutat sekä kauniin typografian että kelvollisen suorituskyvyn.

17. URL-parametrien ja fragmenttien hallinta (Google Search Console -asetukset)

URL-parametrit (kysymysmerkin ? jälkeiset osat URL-osoitteessa) ja fragmentit (risuaitamerkin # jälkeiset osat) voivat luoda haasteita sivuston indeksoinnille. Ne usein tuottavat samoista sivuista useita variaatioita, mikäli niitä ei käsitellä oikein.

Parametrien tyypilliset käyttötavat: esimerkiksi verkkokaupassa suodatukset ja järjestykset (esim. ?category=kenkat&color=mustat&sort=price_desc), sivutus (esim. ?page=2), session ID:t (?session=12345), kampanjatagin seurantaan tarkoitetut utm-parametrit (?utm_source=...), jne. Ongelmaksi nämä muodostuvat, jos hakukone indeksoi lukuisia parametriyhdistelmiä, jotka kaikki pohjimmiltaan näyttävät samaa sisältöä. Pahimmillaan parametrit luovat indeksointiloukkuja, kuten loputtomia sivutusketjuja tai hakukone seuraa linkkejä, jotka lisäävät aina uuden parametriavainarvon ikuisesti.

Fragmentit (#): Fragmentti viittaa yleensä sivun kohtaan (ankkurilinkki) tai JavaScript-sovelluksissa se on vanha tapa simuloida sivun tilaa (esim. #!-tyyliset URL:t aikanaan Ajax-sovelluksissa). Hakukoneet eivät lähetä fragmenttia palvelimelle eivätkä yleensä huomioi fragmenttia indeksoinnissa – kaikki #:n oikealla puolella jää hakukoneelta huomiotta sisällön kannalta. (Poikkeuksena Google on joskus erityistapauksissa käyttänyt fragmentteja merkkinä, mutta standardi on ettei fragmentti vaikuta indeksoituun URL:iin.)

Parametrien hallinta: – Käytä kanonisia URL:eja: Jos parametrit tuottavat sisällöltään pääosin saman sivun kuin jokin “puhdas” URL, aseta sivulle . Esim. example.com/tuote?sort=price saisi canonicalin example.com/tuote. Tämä ohjaa Googlea pitämään yhtä versiota ensisijaisena. Canonical ei kuitenkaan estä indeksointia – Google saattaa silti indeksoida parametrisivun, mutta usein se kunnioittaa canonicalia yhdistämällä signaalit.

robots.txt estot: Voit estää tiettyjä parametreja robots.txt:ssä käyttämällä tähtiä. Esim: Disallow: /*?*sort= estäisi kaikki URL:t joissa on ”?sort=” jossain kohdalla. Tämä on karkea työkalu – varo, ettet estä samalla hyödyllisiä sivuja. Huomaa, että estäminen tarkoittaa myös, ettei Google lue sivua lainkaan, joten se ei tiedä mahdollisesta canonical-tagistäkään jos sivu on estetty. Robots-estoa kannattaakin käyttää parametreihin, jotka selvästi eivät ole hyödyllisiä hakukoneille (kuten seurantaparametrit, session id:t).
Noindex-parametrisivut: Toinen lähestymistapa on antaa parametrisivuilla meta noindex. Tällöin Google saa lukea sivun (ei estetty robotsilla), mutta pudottaa sen pois hakemistosta. Tämän hyötynä canonicaliin verrattuna on varmempi siivous indeksoinnista. Haittana se, että Google kuluttaa crawl budgetia näihinkin sivuihin vaikka ne eivät indeksissä ole.
Vältä linkittämistä parametrisivuille turhaan: Pidä sivuston sisäinen linkkikehys ensisijaisesti puhtaissa URL:eissa. Jos esim. tuotteen listaus voidaan näyttää eri järjestyksillä, etsi tapa toteuttaa järjestysvaihto ilman että syntyy indeksoitavia linkkejä (esim. valikko käyttää JavaScriptiä muuttamaan järjestystä ilman uutta URL:ia, tai käyttää POST-pyyntöä GET-parametrin sijaan – tosin POST:ia hakukoneet eivät seuraa). Voit myös lisätä linkkeihin rel="nofollow" attribuutin, jos et halua Googlebotin seuraavan niitä.
Search Console URL Parameters -työkalun poisto: Kuten mainittiin, Google lopetti kyseisen työkalun tuen huhtikuussa 2022. Ennen sillä saattoi ilmoittaa ”parametri X = sort, eikä vaikuta sisältöön” tai ”parametri Y = sivutus, yhdistä sisältö” jne. Nyt Google väittää käsittelevänsä parametrit älykkäästi itse. Käytännössä tämä toimii vaihtelevasti – jos havaitset indeksointiongelmia parametreista johtuen, joudut itse teknisin keinoin ohjaamaan indeksointia yllä mainituilla tavoilla.

Fragmenttien hallinta: Koska fragmentteja (ankkureita) ei indeksoida, ne eivät yleensä aiheuta duplikaatti- tai budjettiongelmia. Niitä käytetään usein sivun sisäiseen navigointiin (esim. UKK-sivulla linkit kohtiin). Hakukone voi näyttää hakutuloksissa “Hyppää kohtaan…” linkkejä, jotka perustuvat fragmentteihin. SEO-näkökulma fragmenteissa on lähinnä: jos Single Page App -sivusto käyttää #!-URL-rakennetta vanhaan tapaan, tiedosta että Google käsittelee ne erikoistapauksena (vanha hash-bang -sääntö: Google indeksoi #! -URL:n sisällön kun palvelin tarjoaa siitä _escaped_fragment_-version – tämä on vanhaa teknologiaa ajalta ennen Googlebotin JS-renderöintiä). Nykyään suositus on välttää hakasesta riippuvaisia sisällön reitityksiä indeksoitavassa sisällössä ja käyttää historian pushStatea / oikeita URL-polkuja.

18. Lokitiedostojen analysointi ja virheiden seuranta (esim. Screaming Frog, GSC-lokit)

Palvelinlokien analysointi on teknisen SEO:n “syväkurkku” – se paljastaa suoraan, mitä hakukoneiden indeksointirobotit tekevät sivustollasi. Lokitiedostoihin tallentuu jokainen palvelimelle tuleva pyyntö, sisältäen yleensä tiedot pyytäjästä (User-Agent), pyydetystä URL:sta, aikaleimasta, vastauskoodista ja joskus viittaajasta ym. Tämän datan kaivelu antaa vastauksia mm.:

Mitkä sivut Googlebot (ja muut botit) indeksoivat eniten ja kuinka usein?
Missä hakukonebotit kohtaavat virheitä (404, 500 jne.)?
Onko sivustollasi paljon indeksointiyrityksiä sivuille, joita et halua indeksoitavan (esim. estettyjä osioita, parametreja)?
Kuinka Googlebotin crawl rate jakautuu ajan suhteen ja eri hostnamen (esim. www vs non-www, tai eri kielialueiden) kesken?
Mahdollisten haitallisten bottien ja crawlereiden aktiivisuus (kiinalaiset hakukonebotit, scrapaajat tms. – ei suoraan SEO, mutta hyödyllistä turvallisuudelle ja kuormanhallinnalle).

Miten analysoida lokeja? Pienille sivustoille lokien silmäilykin voi riittää, mutta isommilla ne ovat valtavia (giga- tai teratavuja). Työkaluja onneksi on:

Screaming Frog Log File Analyser: Screaming Frog -ohjelman erillinen komponentti (tai nykyään osana main ohjelmaa) voi ladata lokitiedot ja suodattaa sieltä Googlebotin (tai muun halutun botin) tapahtumat. Se yhdistää tietonsa myös sivuston indeksointitilaan: voit nähdä, onko joku paljon indeksoitu sivu “noindex”-tilassa, tai tuleeko sivupyyntöihin poikkeuksellisen paljon 404:ia.
Elasticsearch / Kibana / Splunk: Nämä ovat järeämpiä lokien analysointiympäristöjä. Voit syöttää lokit Elastic Stackiin ja tehdä visualisointeja (esim. graafi Googlebotin pyyntöjen määrästä päivittäin, top 10 indeksoidut polut, eniten 404-virheitä tuottavat URL:t etc.). Toki nämä vaativat asennusta ja säätöä, joten yleensä isoilla sivustoilla.
GoAccess: Kevyempi komentorivityökalu, joka reaaliajassa voi seurata lokidataa ja suodattaa.
GSC-lokitietojen hyödyntäminen: Google Search Consolessa on Index > Crawl Stats -raportti. Se tarjoaa yhteenvedon: montako sivua indeksoitu per päivä, minkä tyyppisiä tiedostoja (HTML, JS, CSS, kuvat, video), miltä user agenteilta (Googlebot Smartphone vs Desktop vs AdsBot etc.), ja vastauskoodeittain (200, 301, 404, 500…). Tämä on erittäin hyödyllinen yleiskuva sivuston indeksoinnin terveydestä. Esimerkiksi jos 404-vastausten määrä nousee piikkinä, tiedät jokin meni rikki. Tai jos indeksointipyyntöjen määrä romahtaa, se voi kieliä indeksointiongelmasta (tai toisaalta että kaikki on jo indeksoitu, riippuu kontekstista). GSC:n data ei anna yksityiskohtaisia URL-listoja, mutta suuntaviivat ja trendit kyllä.

Virheiden seuranta:

Lokianalyysillä saat listat esim. top 404-virheen tuottavista URL:ista. Näille kannattaa tehdä ohjauksia tai korjauksia sisäisiin linkkeihin. Esimerkiksi jos huomaat Googlebotin yrittävän indeksoida old-page.htm tuhansia kertoja ja aina saa 404, lienee syytä 301-ohjata se sopivalle uudelle sivulle tai palauttaa sivu takaisin jos se on vahingossa poistettu ja halutaan liikenne talteen.

500-sarjan virheet ovat vielä tärkeämpiä – ne tarkoittavat, että palvelin ei vastaa kunnolla. Hakukone, nähdessään toistuvia 5xx-virheitä, voi laskea sivuston laatua tai vähentää indeksointiyrityksiä. Jatkuvat 503 (Service Unavailable) -virheet voivat tiputtaa sivut pois hakemistosta, jos Google ajattelee niiden olevan pysyvämmin pois käytöstä. Siksi on kriittistä paikallistaa palvelinongelmat lokeista ja korjata ne. Jos esimerkiksi jokin sivupolku aiheuttaa aina sovellusvirheen (500), se on sekä käyttäjäkokemuksen että indeksoinnin kannalta huono – korjaa koodi tai piilota sivu indeksoinnilta.

Botin tunnistaminen: Huomaa, että kaikki user-agent ”Googlebot” -merkinnällä eivät välttämättä ole oikeita Googleboteja (voivat olla botteja, jotka teeskentelevät). Aidon Googlebotin erottaa käänteiskyselyllä IP-osoitteesta (sen pitäisi resolvautua *.googlebot.com domainiin). Usein lokianalyysityökalut suodattavat jo vain tunnetut Google IP:t. Bingbot, Yandex, Baiduspider ja muut samoin.

Lokianalyysin käytännön esimerkkejä SEO-kehitykseen:

Saatat löytää orpoja sivuja: Googlebot pyytää sivua X, jota ei ole sivustosi linkkiverkostossa eikä sivukartassa. Mistä se tuli? Ehkä ulkopuolinen linkki. Jos se on tärkeä sivu, lisää sisäinen linkitys, jotta se saa paremmat ranking-mahdollisuudet. Jos se on turha sivu (esim. vanha poistettu), ohjaa se tai anna sen 404/410:na olla ja toivo, että Google lopettaa ajan myötä.
Crawl-spike: Jos lokista näkyy äkillinen hyppäys indeksointipyynnöissä, selitä miksi. Oletko julkaissut paljon uutta sisältöä (hyvä)? Vai joutuiko sivusto loputtomaan indeksointisilmukkaan jonkin kalenterilistasivun takia (huono)?
Crawl kiintiön hyödyntäminen: Lokista voit päätellä indeksointinopeuden. Jos Google indeksoi vaikkapa 10 000 sivua päivässä ja sinulla on 100 000 sivua, koko sivusto käydään läpi n. 10 päivässä. Jos lisäät 5 000 uutta sivua, niiden indeksointi kestänee pari päivää. Jos indeksointitahti on paljon hitaampi kuin sivuston koko (esim. 10 000 sivua päivässä, mutta 10 miljoonaa sivua yhteensä, jolloin kierrossa menisi 1000 päivää ~ 3 vuotta), sinun täytyy priorisoida indeksoitavaa sisältöä – tai huomata, että Google ei halua indeksoida kaikkea (ehkä sisältö on liian samankaltaista tai ohutta, tai linkitys ei johda niihin).

Lokianalyysi on syvempää teknistä SEO:ta, mutta se on arvokasta erityisesti isoille verkkosivustoille. Se on kuin katsoisi hakukoneen ”jalanjälkiä” sivustollasi ja opettelisi siitä, miten botti sivustosi kokee.

19. Tietoturva ja SEO: CSP, HSTS, X-Frame-Options -käytännöt

Verkkosivuston tietoturva ja hakukoneoptimointi kietoutuvat yhteen usealla tavalla. Ensisijaisesti: hakukoneet haluavat tarjota käyttäjille turvallisia sivustoja. Jos sivustosi jakaa haittaohjelmia tai on helppo kaapata, hakukoneet voivat laskea sen näkyvyyttä tai varoittaa käyttäjiä. Jotkin tietoturvakäytännöt eivät suoraan nosta sijoitusta, mutta ne varmistavat, ettei sivusto joudu mustalle listalle tai käyttäjien epäsuosioon. Tässä käsitellään kolmea HTTP-otsaketta: Content Security Policy (CSP), Strict-Transport-Security (HSTS) ja X-Frame-Options (XFO), joilla kaikilla on turvallisuutta parantava vaikutus.

Content Security Policy (CSP): CSP on yksi vahvimmista suojauksista XSS-hyökkäyksiä (Cross-Site Scripting) vastaan. Sillä sivusto voi määritellä, mistä lähteistä sisältöä saa ladata: esimerkiksi sallia vain omasta domainista tulevat skriptit, estää inline-skriptit, sallia kuvat tietyistä CDN:istä jne. CSP:n avulla voi myös estää esim. framejen lataamisen muilta sivuilta, joka auttaa klikkijackingin torjunnassa (tosin siihen on XFO:kin, kohta alla). SEO-mielessä CSP:n hyöty on epäsuora: sivusto on suojattu haitalliselta sisällöltä. Jos hyökkääjä onnistuisi injektoimaan sivustollesi haitallisen skriptin (esim. kommenttiosion kautta), hyvä CSP asetus voi estää sen suorittamisen. Tämä voi pelastaa sinut tilanteesta, jossa Google havaitsisi sivustollasi haittakoodia ja leimaisi sen ”This site may be hacked”. CSP-otsakkeen käyttö on yleistymässä, mutta edelleen vain noin 15–19 % sivustoista on ottanut CSP:n käyttöön. Implementointi vaatii huolellisuutta (raporttitila on hyvä ensiaskel: Content-Security-Policy-Report-Only jolla näet mitä olisi estetty rikkomatta toimivuutta). Hakukoneille voit myös CSP:n upgrade-insecure-requests -direktiivillä varmistaa, ettei yksikään sekasisältövaroitus jää – se upgreidaa HTTP-linkit lennossa HTTPS:ksi. Kaiken kaikkiaan, CSP lisää sivuston luotettavuutta.
Strict-Transport-Security (HSTS): Kuten aiemmin mainittiin, HSTS pakottaa käyttäjän selaimen käyttämään HTTPS:ää sivustollasi jatkossa. SEO:n kannalta HSTS antaa signaalin, että olet sitoutunut turvallisuuteen. Jos olet HSTS preload -listalla, uudetkin kävijät menevät suoraan HTTPS:ään. Hakukoneet indeksoivat käytännössä vain HTTPS:ää nykyisin, joten HSTS tukee tätä päämäärää. Tilastoja: n. 30–35 % sivustoista käyttää HSTS:ää (tämäkin tosin enemmän top-sivustoilla kuin koko verkossa, jälkimmäisessä luku pienempi). HSTS suojaa ”stripping”-hyökkäyksiltä, jossa joku yrittää ohjata käyttäjän takaisin http:lle ja vakoilla liikennettä. SEO:lla ei suoraan pistettä HSTS:stä, mutta Chrome varoittaa puuttuvasta HSTS:stä tietyissä yhteyksissä, ja Apple vaatii HSTS:ää Apple Pay verkkointegraatioissa jne. Se on best practice, ja SEO:kin on pitkälti best practice -asioiden toteuttamista kautta linjan.
X-Frame-Options (XFO): Tämä vanhempi otsake on yksinkertainen mutta tehokas: se voi olla DENY (sivuasi ei saa ladata kehykseen ollenkaan) tai SAMEORIGIN (saa ladata kehykseen vain samasta domainista). Tavoitteena estää clickjacking, missä joku lataa sivustosi näkymättömänä iframeen päälleen oman sisältönsä, houkuttelee käyttäjän klikkaamaan jotain luullen klikkaavansa muuta, mutta klikataankin sinun sivusi nappulaa kehystä alla. Esim. ”Tykkää Facebookissa” painikkeita on yritetty clickjackata näin. Hakukoneiden kannalta XFO suojaa brändiäsi ja ehkäisee haittakäyttöä. Google Chrome näyttää varoituksen, jos kehystys on estetty – se on hyvä, käyttäjä ei näe turhaa clonea. X-Frame-Options on niin laajasti tuettu ja helppo, että sen voi ottaa aina käyttöön, ellei sinulla ole oikeaa tarvetta ladata sivuasi toisten sivustojen iframeen. (Huom. XFO ei tue domain-whitelistauksia paitsi vanhentunut ALLOW-FROM, jota ei pitäisi käyttää). CSP:ssä on modernimpi frame-ancestors -direktiivi, joka kattaa XFO:n toiminnallisuuden ja on hienojakoisempi. Aivan kaikilla sivuilla XFO ei ole käytössä, mutta suositus on lisätä. Raporttien mukaan ~35 % tunnetuista sivustoista lähettää X-Frame-Options -otsakkeen.

Muita otsakkeita ja käytäntöjä: – X-XSS-Protection (vanha IE/Chrome, nykyään Chrome ei tarvitse), – X-Content-Type-Options: nosniff (pieni, mutta estää MIME-tyyppien väärinkäytön), – Referrer-Policy (voit päättää lähetetäänkö täydet referer-tiedot – SEO:n kannalta haluat yleensä ainakin domain-level refererin että analytiikka toimii). – Permissions-Policy (ent. Feature-Policy) rajoittaa mitä API:ja sivu saa käyttää (esim. kameran, geolocation – lähinnä privacy/hyötykäyttö juttuja).

Tietoturvan vaikutus SEO:hon suoraan: Google on sanonut, että tietoturvallinen sivusto on oletusarvo. Jos sivustolla havaitaan ongelmia (haittaohjelma, phishaus, tms.), se deindeksoidaan kunnes ongelma on poissa. Eli isoin SEO-vaikutus on negatiivinen, jos et panosta tietoturvaan. Voit menettää näkyvyyden nopeasti. Lisäksi Chrome ja muut selaimet pelottelevat käyttäjiä turvattomista sivuista – korkea poistumisprosentti huonon maineen takia voi myös epäsuorasti vaikuttaa.

Yhteenveto: Ota käyttöön tärkeimmät suojausotsakkeet (HTTPS + HSTS, XFO, ja mielellään CSP kunnollisella asetuksella). Pidä sivusto päivitettynä. Käytä Search Consolea mahdollisten ”Security issues” -ilmoitusten varalta. Vaikkei Google anna suoraan ranking-boostia CSP:stä tai XFO:sta, ne ovat osa laadukasta sivustoa. Ja mikä tärkeintä: ne pitävät käyttäjäsi turvassa, mikä on liiketoimintasikin etu. Hyvä maine ja turvallisuus luovat luottamusta, ja hakukoneet haluavat nostaa esiin sivustoja joihin käyttäjät voivat huoletta luottaa.

20.Automatisoidut tekniset SEO-auditit ja tarkistuslistat

Tekninen SEO kattaa laajan kirjon yksityiskohtia – kuten tästäkin 20 kohdan listasta näkyy. Inhimillisiä erehdyksiä tapahtuu, ja usein sivustoa kehittäessä jokin SEO-näkökulma unohtuu. Automatisoidut auditointityökalut ja selkeät tarkistuslistat auttavat pitämään teknisen SEO:n jatkuvasti oikealla tolalla.

Automatisoidut auditointityökalut:

SEO Crawler -työkalut: Mainittu jo aiemmin Screaming Frog, Sitebulb, Ahrefs Site Audit, SEMrush Site Audit jne. Nämä voidaan laittaa ajastetusti indeksoimaan sivusto vaikka kerran viikossa. Ne tuottavat raportin tärkeistä teknisistä ongelmista: rikkinäiset linkit, duplicate content, otsikkotagien pituudet, meta-kuvausten puutteet, hreflang-inkonsistenssit, sivujen Response code -muutokset, jne. Säännöllinen raportti toimii hälytysjärjestelmänä – jos yhtäkkiä indeksoitavien sivujen määrä tippuu tai 404-virheiden määrä hyppää, huomaat sen.
CI/CD -integraatiot: Jos sivustoa kehitetään jatkuvasti, tekniset testit voi sisällyttää kehitysputkeen. Esimerkiksi ennen tuotantoon vientiä ajetaan Lighthouse ja jos vaikkapa Performance-score putoaa X pistettä tai jokin kynnys ylittyy (LCP > 4s tms.), pysäytä julkaisuprosessi. Samoin HTML-validointi, rikkinäisten linkkien tsekkaus, jne. voidaan automatisoida. Tähän on kehittäjille työkaluja (esim. Pa11y avoimen lähdekoodin työkalu, tai Cypressin integraatiot Lighthouseen).
Monitorointipalvelut: Jotkin verkkopalvelut (New Relic, Datadog, Pingdom) voivat monitoroida sivun vasteaikoja ja jopa sisältöä. Esimerkiksi voit asettaa Pingdomin testaamaan kerran tunnissa kotisivun ja varmistaa, että siellä on tietyt avainelementit (kuten <title> sisältää odotetun tekstin). Jos jotain oleellista puuttuu (kenties sivu returnaa virheen tai sisäänkirjautumissivu vahingossa näkyy julkisesti tms.), saat hälytyksen.

Tarkistuslistat:

Fyysinen tai digitaalinen lista teknisen SEO:n asioista on hyvä pitää käsillä jokaisen sivustouudistuksen, migrationin tai isomman julkaisun yhteydessä. Esimerkiksi: “Onhan robots.txt päivitetty ja estot oikein? Onhan sitemap.xml luotu ja lähetetty? Ovatko rel=canonical -tagit kunnossa kaikilla sivutyypeillä? Onhan 404-sivu olemassa ja hyödyllinen? Onhan kaikki sivut HTTPS:llä ja kaikki HTTP-ohjaukset testattu? Onhan metadata (title, meta description) järkevää ja duplikaatteja vältetty? Core Web Vitalsit: tippuuko mikään punaiselle? …” jne. Lista voi olla pitkä, mutta sen avulla muistat checkata kaiken oleellisen.
Eri osa-alueiden vastuulistat: Kehitystiimeillä voi olla jaoteltuna: Frontend-tiimin tarkistuslista (esim. kuvat on optimoitu, lazy load toimii, HTML on siistiä, tärkeät ARIA- ja alt-attribuutit löytyy), Sisältö-tiimin lista (URL-osoitteet ihmisläheisiä ja avainsanoja sisältäviä, 301-ohjaukset asetettu vanhoista osoitteista, sisältösivujen noindex on pois päältä kun julkaistaan, schema markup lisätty tarvittaessa), DevOps-lista (palvelin palauttaa oikeat headerit, HTTP/2/3 päällä, sivu vastaa alle X ms TTFB)…
Oppiminen menneistä virheistä: Kun huomaat joskus mokanneesi jossain (esim. sait vahingossa koko sivuston noindexille huoltokatkon ajaksi, tai unohdit että yksi kieliversio jäi indeksoitumatta väärän hreflangin vuoksi), lisää se tarkistuslistaan, jotta sama virhe ei toistu.

Ihmisen ja automaation yhdistelmä: Automatisoidut työkalut tuovat esiin potentiaaliset ongelmat, mutta SEO-asiantuntijan tulkinta on yhä kullanarvoista. Esimerkiksi työkalu voi liputtaa “meta description puuttuu 100 sivulta” – listassa saattaa olla sivuja, joiden meta descriptionin puuttuminen on tarkoituksellista tai merkityksetöntä (ehkä noindex-sivuja, tai sivuja joissa description generoi Google dynaamisesti). Asiantuntija päättää, mitkä löydöksistä ovat prioriteetteja.

Kehittyvät trendit: Hakukonealgoritmit muuttuvat, joten auditointikin elää. Viime vuosina Core Web Vitals nousi listalle uutena kohtana, samoin mobile-first-check (onhan mobiilissa kaikki sisältö mikä desktopissa). Tulevaisuudessa ehkä IndexNow-protokollan tuki tai sivuston Accessibility (saavutettavuus) voisi olla ranking-tekijä – viisainta onkin seurata alaa ja päivittää omia tarkistuslistoja ja työkaluja sen mukaisesti.

Kısacası, teknik SEO devam eden bir süreçtir. Otomasyon rutinleri kolaylaştırır ve sizi sorunlar konusunda uyarır, ancak yine de insanların tanımladığı parametre ve kriterlerin sağlam bir şekilde anlaşılmasını gerektirir. Bir kontrol listesi, bir projenin telaşında önemli hiçbir şeyin unutulmamasını sağlar. Bu iki faktör bir araya geldiğinde, sitenizin teknik temelini sağlam tutar ve güçlü bir teknik çerçevenin üzerine içerik ve değer yaratmaya odaklanmanızı sağlar.

Teknik SEO karmaşık görünebilir, ancak adım adım yönetilebilir. Web sitenizin teknik SEO’su veya kapsamlı bir denetim konusunda yardıma ihtiyacınız varsa, size yardımcı olmaktan mutluluk duyarız. Daha fazla bilgi için: burhan.fi