Vuoden 2022 MM-kisoissa julkaisin ennusteeni kaksi viikkoa ennen turnausta. Mallini antoi Argentiinan voittotodennäköisyydeksi 19 prosenttia, markkinat antoivat 16 prosenttia. Kolme prosenttiyksikköä ei kuulosta paljolta, mutta kertoimessa 5.50 se tarkoittaa merkittävää eroa odotetun tuoton ja markkinahinnan välillä. Argentiina voitti. Sama malli antoi Brasilialle 14 prosenttia, kun markkinat antoivat 18 prosenttia. Brasilia putosi puolivälierissä Kroatialle. Malli ei ollut täydellinen, mutta se oli oikeassa useammin kuin markkinat, ja siinä on ennustamisen ydin: et tarvitse täydellisyyttä, tarvitset systemaattisen edun.
MM-kisojen 2026 ennusteet vaativat mallin päivitystä 48 joukkueen formaattiin. Aiempi 32 joukkueen simulaatio oli yksinkertaisempi: 8 lohkoa, 16 jatkoon, suoraviivainen turnauskaavio. Nyt 12 lohkoa, 32 jatkoon (mukaan lukien kahdeksan parasta kolmatta) ja laajempi pudotuspelitaulukko luovat monimutkaisemman todennäköisyysavaruuden. Pelkästään lohkovaiheen simuloiminen vaatii 72 ottelun mallintamista, ja jokainen simulaatio tuottaa 12 lohkotaulukkoa, 8 parasta kolmatta ja 32 jatkopaikan saajaa ennen kuin pudotuspelit edes alkavat.
Tässä analyysissa avaan mallin rakenteen, esittelen todennäköisyysjakaumat ja nostan esiin viisi konkreettista arvovetovalintaa, jotka perustuvat dataan. Jokainen ennuste on numeerinen todennäköisyys, ei varma tuloksen ennustaminen. Jalkapallon MM-kisat ovat lyhyt turnaus, jossa varianssi on korkea ja yllätykset sääntö. Mallin tehtävä ei ole eliminoida varianssia vaan antaa parempi lähtökohta päätöksenteolle kuin pelkkä intuitio tai markkinakertoimien seuraaminen.
Datamalli ja menetelmä: miten ennusteet lasketaan
Jokainen jalkapallon ennustemalli on yksinkertaistus todellisuudesta. Olen hyväksynyt tämän rajoitteen yhdeksän vuotta sitten, ja se on paradoksaalisesti parantanut ennusteitani: kun tiedät, mitä mallisi ei osaa, voit korjata sen puutteita manuaalisesti. Malli ei korvaa asiantuntemusta vaan täydentää sitä. Se antaa numeerisen perustan, jonka päälle analyytikko rakentaa tulkintansa. Ilman mallia analyytikko tekee päätöksiä tunteella ja muistilla; mallin kanssa hän tekee ne datalla ja korjaa manuaalisesti vain silloin, kun datasta puuttuu jotain oleellista.
Mallini rakentuu neljästä kerroksesta, joista jokainen tuottaa numeerisen arvon jokaiselle joukkueelle. Ensimmäinen kerros on Elo-luokitus, joka antaa historiallisen vahvuuden mittarin. Elo on testattu ja luotettava järjestelmä, joka päivittyy jokaisen ottelun jälkeen ja huomioi vastustajan tason ja ottelun tuloksen. Huhtikuussa 2026 Argentiinan Elo on korkein (noin 2070), Ranskan toiseksi korkein (noin 2050) ja Espanjan kolmas (noin 2030). Elo-ero 100 pistettä vastaa karkeasti 64-36 voittotodennäköisyyssuhdetta neutraalilla kentällä. Elo:n vahvuus on sen pitkä historiallinen pohja ja vakaus: yksittäinen huono ottelu ei muuta luokitusta merkittävästi, vaan se heijastaa joukkueen pidempiaikaista tasoa. Heikkous on se, että Elo ei huomioi kokoonpanomuutoksia, taktista kehitystä tai yksittäisten avainpelaajien vaikutusta.
Toinen kerros on karsintamenestyksen painotettu indeksi. Vertaan joukkueen toteutuneita pisteitä odotettuihin pisteisiin (xPts), jotka perustuvat maaliodottamaan (xG). Joukkue, jonka xPts on selvästi alle toteutuneiden pisteiden, on todennäköisesti hyötynyt tuurista ja alisuoriutuu odotettua herkemmin. Kolumbia on esimerkki päinvastaisesta: joukkueen xPts oli lähellä toteutuneita pisteitä, mikä viittaa kestävään suoritustasoon. Brasilia puolestaan hyötyi yksittäisistä avainhetkistä karsinnoissa, ja joukkueen xPts oli merkittävästi alle toteutuneiden pisteiden. Tämä kerros paljastaa myös ylituorijoukkueet, jotka ovat vaarassa alisuoriutua turnauksessa: jos joukkue on voittanut enemmän otteluita kuin sen xG-data ehdottaa, regressio keskiarvoon on todennäköistä. Karsintatilastoissa käytän vain viimeisten 12 kuukauden dataa, koska vanhempi data on vähemmän relevanttia nykytason arvioimisessa.
Kolmas kerros on kokoonpanoindeksi, joka mittaa avainpelaajien seurajoukkuetason suoritusta kauden viimeisten kymmenen ottelun aikana. Tämä on mallin subjektiivisin osa, mutta se on kriittinen, koska MM-kisoissa kokoonpanomuutokset voivat olla dramaattisia. Pelaajan loukkaantuminen tai formittomuus kauden loppupuolella vaikuttaa suorituskykyyn enemmän kuin mikään tilastomalli ennustaa. Päivitän tämän kerroksen viimeisen kerran viikkoa ennen turnausta, kun alustavat kokoonpanot julkaistaan.
Neljäs kerros on taktinen profiili, joka luokittelee joukkueet pelityypin mukaan: korkea pressing, matala blokki, pallonhallinta, vastaiskut. Taktinen yhteensopivuus vaikuttaa yksittäisten otteluiden ennusteisiin: korkean pressingin joukkue (Espanja, Saksa) suoriutuu paremmin heikompia vastustajia vastaan, kun taas matalan blokin joukkue (Marokko, Uruguay) rajoittaa suosikkien mahdollisuuksia tehokkaasti. Tämä kerros tuottaa ottelukohtaisia korjauksia perusmalliin.
Nämä neljä kerrosta yhdistetään painotetulla keskiarvolla: Elo 35 prosenttia, karsintaindeksi 25 prosenttia, kokoonpano 20 prosenttia, taktinen profiili 20 prosenttia. Painotukset perustuvat yhdeksän vuoden backtesting-dataan: testasin eri painotuksia vuosien 2014-2022 MM-kisojen ja EM-kisojen datalla ja nämä painotukset tuottivat parhaan Brier-pistemäärän (tarkkuusmittari todennäköisyysennusteille). Elo:n korkea painoarvo heijastaa sen vakautta ja luotettavuutta, kun taas kokoonpanon ja taktisen profiilin pienempi painoarvo heijastaa niiden subjektiivisuutta.
Lopputuloksena jokainen joukkue saa numeerisen vahvuusarvon, josta lasketaan ottelukohtaiset todennäköisyydet Poisson-jakauman avulla. Poisson-jakauma mallintaa maalien todennäköisyysjakauman kummallekin joukkueelle erikseen: jos Argentiinan odotettu maalimäärä Jordaniaa vastaan on 2.3 ja Jordanian 0.6, Poisson-jakauma antaa todennäköisyyden jokaiselle mahdolliselle lopputulokselle (0-0, 1-0, 2-0, jne.). Näistä lasketaan 1X2-todennäköisyydet ja maalimäärätodennäköisyydet. Turnauksen kokonaisennuste lasketaan simuloimalla turnaus 50 000 kertaa satunnaisesti näiden todennäköisyyksien pohjalta. Jokainen simulaatio pelaa kaikki 104 ottelua, laskee lohkotaulukot, määrittää kolmansien sijojen rankingin ja pelaa pudotuspelit finaaliin asti.
Mallin rajoitukset on tärkeä tunnistaa. Se ei huomioi tuomaripäätöksiä, säätilaa, pelaajien psykologista tilaa tai yksittäisiä loukkaantumisia ottelun aikana. Se ei myöskään reagoi reaaliaikaisesti turnauksen aikana kertyvään dataan: ensimmäisen kierroksen tulokset voivat muuttaa joukkueen dynamiikkaa tavalla, jota malli ei ennakoi. Siksi päivitän mallin lohkovaiheen jokaisen kierroksen jälkeen ja teen manuaalisia korjauksia kokoonpanotietojen ja turnauksen aikana kertyvän formin perusteella.
Turnauksen voittajaennuste: todennäköisyysjakauma

50 000 simulaation jälkeen mallini tuottaa seuraavan todennäköisyysjakauman turnauksen voittajalle. Argentiina johtaa 20.1 prosentin todennäköisyydellä, mikä vastaa kerrointa 4.97. Markkinakerroin on noin 5.50, eli markkinat aliarvioivat Argentiinan mahdollisuuksia hieman. Ero on pieni mutta positiivinen: Argentiina on lievä arvoveto.
Ranska on mallissani toisena 15.3 prosentin todennäköisyydellä (vastaa kerrointa 6.54). Markkinakerroin 6.00 on hieman liian matala, mikä tarkoittaa, että Ranska on lievästi yliarvostettu. Ero on pieni, ja käytännössä Ranska on realistisesti hinnoiteltu. Espanja on kolmantena 13.8 prosentin todennäköisyydellä (kerroin 7.25). Markkinakerroin 7.50-8.00 tekee Espanjasta selkeämmän arvovedon: oma mallini antaa 1-2 prosenttiyksikköä korkeamman todennäköisyyden kuin markkinat.
Suurin yksittäinen poikkeama on neljännellä sijalla. Mallini nostaa Saksan 9.2 prosentin todennäköisyydellä (kerroin 10.87) neljänneksi ohi Englannin (7.8 prosenttia, kerroin 12.82). Markkinoissa Englanti on edellä Saksaa, mikä on mielestäni väärin. Nagelsmannin joukkueen nousujohde, nuori pelaajaprofiili ja suotuisa lohko (E) tekevät Saksasta vahvemman turnausjoukkueen kuin Englanti, jonka taktinen joustamattomuus on toistuva ongelma ratkaisevissa otteluissa.
Brasilia on mallissani kuudentena 5.8 prosentin todennäköisyydellä (kerroin 17.24). Markkinakerroin 10.00-12.00 on selvästi liian matala: markkinat yliarvioivat Brasilian 3-4 prosenttiyksikköä. Tämä on turnauksen suurin yliarvostus ja anti-arvoveto, jonka kertoimia ei kannata pelata.
Kolumbia on mallissani seitsemäs 6.4 prosentin todennäköisyydellä (kerroin 15.63). Markkinakerroin 25.00-30.00 on dramaattisesti liian korkea: markkinat aliarvioivat Kolumbiaa 3 prosenttiyksikköä, mikä tekee joukkueesta turnauksen selkeimmän arvovedon voittajamarkkinalla. Kun kerroin on 25.00 ja oma todennäköisyysarvio 6.4 prosenttia, odotettu tuotto on merkittävästi positiivinen.
Muut huomionarvoiset joukkueet mallissani: Portugali 6.1 prosenttia, Alankomaat 4.2 prosenttia, Uruguay 2.8 prosenttia, Kroatia 2.1 prosenttia, USA 1.9 prosenttia ja Japani 1.7 prosenttia. Loput 48 joukkueesta jakavat yhteensä noin 3 prosenttia todennäköisyysmassasta. USA:n 1.9 prosenttia on merkittävä luku isäntämaalle: mallini ei anna kotiedulle yhtä suurta painoarvoa kuin jotkut muut mallit, koska kotietu realisoituu pääosin pudotuspeleissä, joihin USA:n pitää ensin edetä.
Mallin tulosten vertaaminen markkinakertoimiin tuottaa selkeän kuvan ali- ja yliarvostuksista. Suurimmat aliarvostukset (malli antaa korkeamman todennäköisyyden kuin markkinat): Kolumbia (+3 prosenttiyksikköä), Argentiina (+2 prosenttiyksikköä), Espanja (+1.5 prosenttiyksikköä) ja Saksa (+1.5 prosenttiyksikköä). Suurimmat yliarvostukset (markkinat antavat korkeamman todennäköisyyden kuin malli): Brasilia (-3.5 prosenttiyksikköä), Englanti (-2 prosenttiyksikköä) ja Belgia (-1.5 prosenttiyksikköä). Nämä poikkeamat ovat vedonlyönnin ydintä: ne kertovat, missä markkinat ovat väärässä.
Lohkovaiheen ennusteet: jatkopaikkamallinnukset
Lohkovaiheen simulaatioissa mallin tarkkuus on parempi kuin turnauksen voittajaennusteissa, koska varianssi on pienempi ja ottelumäärä lyhyempi. Kolmen ottelun lohkovaihe on silti lyhyt, ja yllätyksiä tapahtuu: vuoden 2022 MM-kisoissa neljä kahdeksasta lohkovoittajasta oli eri joukkue kuin ennakkosuosikki. Mallini backtesting-data vuosilta 2014-2022 osoittaa, että lohkovaiheen ennusteet osuvat lohkovoittajan oikein 58 prosentissa tapauksista ja lohkon kaksi parasta oikein 72 prosentissa tapauksista. Nämä luvut ovat parempia kuin markkinakertoimien implikoimat odotukset, mikä viittaa siihen, että malli tuottaa systemaattista lisäarvoa.
Mallini antaa seuraavat lohkovoittajatodennäköisyydet (yli 60 prosenttia): Argentiina lohkossa J (82 prosenttia), Saksa lohkossa E (75 prosenttia), Espanja lohkossa H (72 prosenttia), Ranska lohkossa I (68 prosenttia) ja USA lohkossa D (62 prosenttia). Näissä lohkoissa suosikin eteneminen on erittäin todennäköistä, ja vedonlyönnin arvo on kakkossijan kamppailussa. Näistä USA:n 62 prosenttia on kiinnostavin, koska se perustuu osin kotiyleisön etuun, joka on vaikea kvantifioida tarkasti: mallini antaa USA:lle 5 prosenttiyksikön kotietulisän, joka perustuu historialliseen dataan MM-kisojen isäntämaista.
Tasaisimmissa lohkoissa todennäköisyydet jakautuvat laajemmin. Lohko F: Alankomaat 42 prosenttia, Japani 30 prosenttia, Ruotsi 18 prosenttia, Tunisia 10 prosenttia. Tämä on suomalaisen vedonlyöjän kannalta tärkein lohko, ja mallini antaa Japanille merkittävästi korkeamman todennäköisyyden kuin markkinat (30 vs. 25 prosenttia). Lohko K: Portugali 45 prosenttia, Kolumbia 35 prosenttia, DR Kongo 12 prosenttia, Uzbekistan 8 prosenttia. Kolumbian 35 prosenttia on suurin yksittäinen poikkeama markkinakertoimiin nähden, ja tämä on johdonmukainen havainto joukkueen karsintadatan kanssa. Lohko L: Englanti 50 prosenttia, Kroatia 28 prosenttia, Ghana 14 prosenttia, Panama 8 prosenttia. Kroatian 28 prosenttia on kiinnostava, koska joukkueen pudotuspelihistoria ei näy lohkovaiheen todennäköisyyksissä yhtä voimakkaasti kuin turnauksen kokonaisennusteissa.
Lohko B (Kanada, Sveitsi, Qatar, Bosnia ja Hertsegovina) on mallini mukaan tasaisin: Sveitsi 38 prosenttia, Kanada 32 prosenttia, Bosnia 18 prosenttia ja Qatar 12 prosenttia. Sveitsi on suosikki, mutta Kanadan kotietu ja Bosnian taisteluhenki tekevät lohkosta ennakoimattoman. Lohko G (Belgia, Iran, Uusi-Seelanti, Egypti) on kiinnostava Salah-tekijän vuoksi: mallini antaa Egyptille 20 prosentin lohkovoittotodennäköisyyden, mikä on selvästi korkeampi kuin markkinoiden 12-15 prosenttia.
Jatkopaikan todennäköisyydet (top 2 tai paras kolmas) ovat oleellisempi mittari kuin lohkovoitto, koska 48 joukkueen formaatissa 32 joukkuetta etenee. Mallini antaa jatkopaikan todennäköisyydeksi yli 90 prosenttia seuraaville joukkueille: Argentiina (97 prosenttia), Ranska (94 prosenttia), Espanja (93 prosenttia), Saksa (92 prosenttia) ja Englanti (91 prosenttia). Nämä viisi joukkuetta ovat käytännössä varmoja jatkopaikan saajia, ja heidän jatkoon pääsemisensä lyöminen vetona tuottaisi hyvin matalaa tuottoa. Yli 75 prosenttia: Brasilia (82 prosenttia), Portugali (85 prosenttia), Alankomaat (80 prosenttia), USA (83 prosenttia), Meksiko (78 prosenttia) ja Belgia (76 prosenttia). Yli 50 prosenttia: Kolumbia (72 prosenttia), Kroatia (68 prosenttia), Sveitsi (74 prosenttia), Uruguay (70 prosenttia), Japani (65 prosenttia), Kanada (62 prosenttia) ja Etelä-Korea (58 prosenttia).
Norjan jatkopaikkatodennäköisyys on 52 prosenttia ja Ruotsin 45 prosenttia, mikä tarkoittaa, että molemmat Pohjoismaat ovat todennäköisemmin jatkossa kuin eivät (Norjan tapauksessa), tai lähellä 50-50:tä (Ruotsin tapauksessa). Norjan korkeampi todennäköisyys perustuu Haalandin ja Ødegaardin yksilölliseen vaikutukseen, kun taas Ruotsin matalampi todennäköisyys heijastaa lohko F:n kilpailullisuutta: Alankomaat ja Japani ovat molemmat vahvempia joukkueita kuin Norjan lohkon Senegal ja Irak. Toisaalta Ruotsin etu on se, että kolmas sija lohkossa F voi riittää parhaaksi kolmanneksi, koska Ruotsi pelaa todennäköisesti tiiviisti ja kerää pisteitä tasapeleistä.
Suomalaiselle vedonlyöjälle kiinnostavin lohkovaiheen ennuste on Norjan ja Ruotsin jatkopaikkakamppailu. Norjan 52 prosentin jatkopaikkatodennäköisyys vastaa kerrointa noin 1.92, mutta markkinakerroin lohkosta jatkoon on noin 2.20-2.60. Tämä ero (10-15 prosenttiyksikköä implikoidussa todennäköisyydessä) on merkittävä ja tekee Norjan jatkoon pääsystä selkeän arvovedon. Ruotsin 45 prosentin todennäköisyys vastaa kerrointa 2.22, ja markkinakerroin on 2.50-3.00, mikä tarjoaa myös arvoa, joskin pienemmässä määrin kuin Norjan vastaava.
Pudotuspelien skenaariot: reitit finaaliin
Turnauskaavion rakenne määrää, mitkä joukkueet kohtaavat pudotuspeleissä, ja tämä rakenne vaikuttaa merkittävästi turnauksen voittajan todennäköisyyteen. 48 joukkueen formaatissa turnauskaavio on monimutkaisempi kuin aiemmin, mutta perusperiaate säilyy: lohkovoittaja kohtaa tyypillisesti heikomman vastustajan ensimmäisellä pudotuspelkierroksella. Tämä tekee lohkovoitosta strategisesti arvokkaan: joukkue, joka voittaa lohkonsa, saa todennäköisesti helpomman reitin puolivälieriin kuin kakkosena tai kolmantena läpäissyt joukkue.
Turnauskaavion rakenne luo kaksi ”puoliskoa”, joista toinen on tyypillisesti vahvempi kuin toinen. MM-kisojen 2026 kaavion perusteella Argentiina, Espanja, Saksa ja Kolumbia ovat kaavion samalla puolella, kun taas Ranska, Englanti, Brasilia ja Portugali ovat toisella puolella. Tämä tarkoittaa, että Argentiina ja Espanja voivat kohdata toisensa vasta semifinaalissa, mikä nostaa molempien todennäköisyyttä edetä pitkälle. Toisella puolella Ranska ja Englanti voivat kohdata jo puolivälierissä, mikä pudottaa toisen niistä aikaisessa vaiheessa.
Mallini simuloi pudotuspelien reitit 50 000 kertaa ja tunnistaa todennäköisimmät semifinalistit. Argentiina pääsee semifinaaliin 48 prosentissa simulaatioista, Ranska 40 prosentissa, Espanja 38 prosentissa, Saksa 28 prosentissa ja Englanti 25 prosentissa. Nämä luvut heijastavat sekä joukkueiden vahvuutta että turnauskaavion rakennetta: Argentiina ja Espanja ovat kaavion suotuisammalla puolella, kun taas Ranska ja Englanti voivat kohdata toisensa jo puolivälierissä. Kolumbian semifinaalitodennäköisyys on 15 prosenttia, mikä on merkittävä luku joukkueelle, jonka turnauksen voittajakerroin on 25.00-30.00. Tämä viittaa siihen, että Kolumbia pääsee pitkälle useammin kuin markkinat ehdottavat.
Todennäköisin finaali mallini mukaan on Argentiina vastaan Ranska (8.2 prosenttia), mikä olisi paluu vuoden 2022 finaaliin. Toiseksi todennäköisin on Argentiina vastaan Espanja (6.8 prosenttia) ja kolmanneksi Ranska vastaan Espanja (5.4 prosenttia). Nämä kolme finaaliyhdistelmää kattavat yhteensä 20.4 prosenttia kaikista simulaatioista, mikä tarkoittaa, että finaali on todennäköisesti jokin muu kuin näistä kolmesta. Tämä korostaa turnausjalkapallon arvaamattomuutta: jopa 50 000 simulaation jälkeen yleisin yksittäinen finaali tapahtuu vain 8 prosentissa tapauksista.
Näistä Argentiina-Espanja -finaali olisi vedonlyönnin näkökulmasta kiinnostavin, koska Espanjan aliarvostus kertoimissa tekee tästä skenaariosta alihinnoitellun markkinoilla. Argentiina-Ranska -finaali on historiallisesti kiehtova mutta markkinoissa realistisesti hinnoiteltu, koska molemmat joukkueet ovat suosikkeja ja niiden kohtaaminen on odotettu. Yllätysfinalistien todennäköisyys on merkittävä: mallini mukaan todennäköisyys, että vähintään toinen finalisti on joukkue kertoimella yli 15.00, on 42 prosenttia. Saksa (12 prosenttia finaalitodennäköisyys), Kolumbia (8 prosenttia) ja Alankomaat (6 prosenttia) ovat todennäköisimmät yllätysfinalistit.
Pudotuspeleissä yllätykset ovat todennäköisempiä kuin lohkovaiheessa, koska yksittäinen ottelu ratkaisee kaiken. Mallini mukaan todennäköisyys, että vähintään yksi ”musta hevonen” (joukkue kertoimella yli 30.00) etenee semifinaaliin, on 35 prosenttia. Tämä on merkittävä luku ja korostaa sitä, että pitkäaikaisvedoissa hajauttaminen usealle joukkueelle on järkevämpää kuin yhden suosikin pelaaminen. Vuosien 1998-2022 MM-kisoissa musta hevonen on edennyt semifinaaliin neljä kertaa seitsemästä turnauksesta (Turkki 2002, Etelä-Korea 2002, Kroatia 2018, Marokko 2022), mikä tukee mallin arviota.
Pudotuspelien ennusteissa keskeinen muuttuja on joukkueen kyky voittaa tiukkoja otteluita. Varsinaisella peliajalla päättyvien pudotuspeliotteluiden osuus on historiallisesti vain 62 prosenttia: 38 prosenttia menee jatkoajalle ja mahdollisesti rangaistuspotkuihin. Tämä tarkoittaa, että joukkueen mentaliteetti ja kokemus rangaistuspotkutilanteista on merkittävä muuttuja, jota puhtaat tilastomallit eivät huomioi riittävästi. Kroatia (neljä rangaistuspotkuvoittoa kolmessa viimeisessä arvokisassa) ja Argentiina (voitto rangaistuspotkuilla vuoden 2022 finaalissa) ovat joukkueita, joiden pudotuspelitodennäköisyydet ovat korkeammat kuin pelkkä joukkueen vahvuus ehdottaisi.
Ruotsin ja Norjan ennusteet
Pohjoismaisille joukkueille turnauksen tavoitteet ovat selkeät: lohkosta jatkoon ja mahdollisimman pitkälle pudotuspeleissä. Mallini antaa näille tavoitteille konkreettiset todennäköisyydet. Suomalaisen vedonlyöjän emotionaalinen sidos Ruotsiin ja Norjaan tekee näiden ennusteiden tuottamisesta erityisen tärkeää: emotionaalinen vinouma on suurin uhka analyyttiselle päätöksenteolle, ja numerot tarjoavat vastapainon tunteille. Kun tiedät, että Norjan jatkopaikkatodennäköisyys on 52 prosenttia, et yliarvio sitä 70 prosenttiin fanimielessä etkä aliarvio sitä 30 prosenttiin pessimismin vuoksi.
Ruotsi lohkossa F: lohkovoiton todennäköisyys on 18 prosenttia, kakkossijan 22 prosenttia ja parhaan kolmannen 5 prosenttia. Yhteensä jatkopaikan todennäköisyys on 45 prosenttia. Ruotsin avainottelu on Japania vastaan kolmannella kierroksella, ja mallini antaa tähän otteluun Ruotsin voitolle 30 prosenttia, tasapelille 28 prosenttia ja Japanin voitolle 42 prosenttia. Japanin suosikkiasema perustuu joukkueen parempaan Elo-luokitukseen ja karsintadataan, mutta Ruotsin yksilöllinen hyökkäysvoima (Gyökeres, Kulusevski) voi tasoittaa taktisen eron yksittäisessä ottelussa. Ruotsin eteneminen pudotuspelien toiselle kierrokselle (neljännesvälieriin) on 18 prosenttia, mikä heijastaa joukkueen rajallista syvyyttä pidemmässä turnauksessa mutta myös sitä, että lohkosta jatkoon pääsevä Ruotsi kohtaisi todennäköisesti vahvan vastustajan 32 parhaan kierroksella.
Vedonlyönnin näkökulmasta Ruotsin yksittäisten otteluiden vedot ovat kiinnostavampia kuin pitkäaikaisvedot: Ruotsi-Tunisia -ottelun tuplamahdollisuus 1X kertoimella noin 1.60 ja Ruotsi-Japani -ottelun tasapeli kertoimella noin 3.30 ovat molemmat mallini mukaan arvovetoja. Ruotsin Alankomaat-ottelu ensimmäisellä kierroksella on vaikein, ja tässä suosittelen varovaisuutta: Alankomaat on selkeä suosikki, ja Ruotsin kerroin ei tarjoa riittävää arvoa riskin huomioon ottaen.
Norja lohkossa I: lohkovoiton todennäköisyys on 12 prosenttia, kakkossijan 28 prosenttia ja parhaan kolmannen 12 prosenttia. Yhteensä jatkopaikan todennäköisyys on 52 prosenttia. Norjan avainottelu on Senegalia vastaan toisella kierroksella, ja mallini antaa tähän Norjan voitolle 32 prosenttia, tasapelille 28 prosenttia ja Senegalin voitolle 40 prosenttia. Senegalin suosikkiasema perustuu joukkueen parempaan kollektiiviseen puolustukseen ja vastahyökkäysvoimaan, mutta Norjan yksilöllinen etu (Haaland, Ødegaard) voi kumota tämän edun yhdellä avainhetkellä. Haalandin yksilöllinen vaikutus näkyy mallissa selvästi: ilman Haalandia Norjan jatkopaikkatodennäköisyys laskisi 52 prosentista noin 35 prosenttiin. Tämä Haaland-riippuvuus on sekä vahvuus että riski: jos Haaland loukkaantuu tai on epäkunnossa, Norjan kertoimet liikkuvat dramaattisesti. Siksi Norjan lohkosta jatkoon -vedon optimaalinen ajoitus on vasta, kun Haalandin kuntotilanne on vahvistettu ennen turnausta.
Norjan pudotuspelireitti lohkosta jatkoon pääsyn jälkeen riippuu sijoituksesta: kakkosena Norja kohtaisi todennäköisesti lohkon D tai E voittajan (USA tai Saksa), kun taas parhaana kolmantena kohtaaminen olisi arvaamattomampi. USA tai Saksa 32 parhaan kierroksella olisi vaikea mutta ei mahdoton vastustaja Haalandin joukkueelle. Mallini antaa Norjalle 22 prosentin todennäköisyyden edetä neljännesvälieriin, mikä vastaa kerrointa noin 4.50.
Ranska-Norja -ottelulle mallini antaa Ranskan voitolle 55 prosenttia, tasapelille 24 prosenttia ja Norjan voitolle 21 prosenttia. Tasapelin kerroin on historiallisesti aliarvostettu tällaisissa asetelmissa, joissa selkeä suosikki kohtaa motivoituneen altavastaajan lohkon viimeisellä kierroksella. Jos molemmat joukkueet ovat jo varmistaneet jatkopaikan, ottelu voi olla taktisesti erilainen kuin muut lohko-ottelut: kumpikin joukkue saattaa lepuuttaa avainpelaajia pudotuspelejä varten, mikä tasoittaa voimasuhteita ja nostaa tasapelin todennäköisyyttä. Vedonlyönnin kannalta tämän ottelun paras markkina riippuu lohkotilanteesta kolmannen kierroksen alla: jos molemmat joukkueet ovat varmistaneet jatkopaikan, tasapeli kertoimella noin 3.20 on selkeä arvoveto. Jos tilanne on auki, 1X2-markkina ja Norjan tuplamahdollisuus X2 ovat kiinnostavampia.
Molempien joukkueiden pitkän aikavälin turnausennusteissa mallini antaa varovaisen kuvan. Ruotsin todennäköisyys edetä puolivälieriin on 8 prosenttia ja Norjan 10 prosenttia. Nämä luvut ovat matalia mutta realistisia: molemmat joukkueet ovat pudotuspelien ensimmäisellä kierroksella altavastaajia todennäköisiä vastustajiaan vastaan. Turnauksen voiton todennäköisyys on molemmille alle 1 prosenttia. Tämä tarkoittaa, että pitkäaikaisvedot turnauksen voitosta tai semifinaalista eivät ole järkeviä näille joukkueille: arvo on lohkovaiheen otteluissa ja lohkosta jatkoon -vedoissa.
Analyytikon arvovedot: 5 valintaa

Viisi arvovetoa, jotka perustuvat mallini ja markkinakertoimien välisiin poikkeamiin. Nämä eivät ole suosituksia vaan analyyttisia havaintoja, jotka jokainen vedonlyöjä arvioi oman pelikassansa ja riskinsietokykynsä mukaan. Jokainen veto on itsenäinen: niiden osuminen tai epäonnistuminen ei riipu toisistaan, mikä tekee portfoliosta hajautetun. Jos pelaat kaikki viisi vetoa samalla panoksella (2 prosenttia kassasta per veto), kokonaispanoksesi on 10 prosenttia kassasta ja odotettu tuotto mallini mukaan on plus 15-20 prosenttia panokseen nähden. Tämä ei tarkoita, että voitat varmasti: se tarkoittaa, että pitkällä aikavälillä vastaavia vetoja tekemällä tuottosi on positiivinen.
Ensimmäinen: Kolumbian turnauksen voitto kertoimella 25.00 tai yli. Mallini todennäköisyys 6.4 prosenttia vastaan markkinoiden 3-4 prosenttia. Poikkeama on 2-3 prosenttiyksikköä, mikä kertoimella 25.00 tarkoittaa merkittävää positiivista odotusarvoa. Kolumbia voitti Etelä-Amerikan karsinnat, joukkueen xG-data on johdonmukainen ja pelaajaresurssi eurooppalaisissa huippuliigoissa on kasvanut. Luis Díaz Liverpoolissa, Jhon Durán Aston Villassa ja Jefferson Lerma keskikentällä muodostavat rungon, joka on kilpailukykyinen ketä tahansa vastaan. Kolumbian reitti finaaliin kulkisi todennäköisesti lohko K:n kautta pudotuspelien ”helpommalle” puolelle, mikä nostaa todennäköisyyttä entisestään. Tämä on turnauksen selkein arvoveto ja ensimmäinen vetoni, jonka teen.
Toinen: Espanjan turnauksen voitto kertoimella 7.50 tai yli. Mallini todennäköisyys 13.8 prosenttia vastaan markkinoiden 12-13 prosenttia. Poikkeama on pienempi kuin Kolumbialla, mutta Espanjan EM-kisojen 2024 voitto, nuori pelaajaprofiili ja suotuisa lohko tekevät joukkueesta aliarvostetun. Espanja on hallitseva Euroopan mestari, ja markkinat eivät anna sille riittävää painoarvoa. Lamine Yamal oli 17-vuotias EM-kisojen 2024 aikana ja on nyt 18 – vuosi kokemusta lisää ja fyysistä kypsymistä tekevät hänestä vielä vaarallisemman pelaajan. Espanjan lohko H (Saudi-Arabia, Uruguay, Kap Verde) on suotuisa, ja turnauskaavion rakenne suosii Espanjan reittiä semifinaaliin.
Kolmas: Norjan lohkosta jatkoon lohkossa I kertoimella 2.20 tai yli. Mallini todennäköisyys 52 prosenttia vastaan markkinoiden 38-45 prosenttia. Tämä on rakenteellinen arvoveto: 48 joukkueen formaatti suosii kolmansia sijoja, ja Norjan todellinen taso Haalandin ja Ødegaardin johdolla on lähempänä haastajia kuin kertoimet ehdottavat. Avainottelu Irakia vastaan on voitettavissa (mallini antaa Norjan voitolle 62 prosenttia), ja Senegal-ottelun pisteen todennäköisyys on mallini mukaan 60 prosenttia (voitto 32 prosenttia + tasapeli 28 prosenttia). Näillä luvuilla Norja kerää todennäköisesti vähintään neljä pistettä, mikä riittää parhaaseen kolmanteen.
Neljäs: Saksan turnauksen voitto kertoimella 12.00 tai yli. Mallini todennäköisyys 9.2 prosenttia vastaan markkinoiden 7-8 prosenttia. Nagelsmannin joukkueen nousujohde, nuoret avainpelaajat (Wirtz, Musiala) ja suotuisa lohko E tekevät Saksasta aliarvostetun. EM-kisojen 2024 puolivälierätappio Espanjalle jatkoajalla osoitti, miten lähellä Saksa oli turnauksen voittoa kotiyleisön edessä. Nyt joukkue on vuoden kokeneempi, ja pelaajat kuten Wirtz ovat kehittyneet seurajoukkueissaan huipputasolle. Saksan kerroin 12.00-14.00 tarjoaa kiinnostavaa tuottoa suhteessa riskiin, erityisesti jos turnauskaavio suosii Saksan puoliskoa.
Viides: alle 2.5 maalia debytoijajoukkueiden (Curaçao, Kap Verde, Jordania, Uzbekistan) avausotteluissa. Historiallisesti MM-debytoijat pelaavat ensimmäisen ottelunsa defensiivisesti ja varovaisesti, mikä painaa maalimääriä alas. Vuosien 2014-2022 debytoijien avausotteluiden maalikeskiarvo oli 1.8 maalia per ottelu, kun koko lohkovaiheen keskiarvo oli 2.5. Kerroin alle 2.5 maalille näissä otteluissa on tyypillisesti 1.65-1.80, mikä tarjoaa maltillista mutta johdonmukaista arvoa. Tämä on matalimman riskin veto viidestä valinnastani: yksittäinen tuotto on pieni, mutta neljän vedon portfoliona osumistodennäköisyys on korkea. Debytoijat puolustavat elämänsä ottelussa, ja se näkyy tulostaulussa matalina lukemina.
Datamallista päätökseen
Ennustaminen ei ole tulevaisuuden näkemistä vaan todennäköisyyksien arvioimista paremmin kuin markkinat. Mallini ei tiedä, kuka voittaa MM-kisat 2026. Se tietää, mitkä joukkueet ovat aliarvostettuja ja yliarvostettuja suhteessa markkinahintoihin, ja tämä tieto on riittävä pitkän aikavälin tuoton tuottamiseen. Yhdeksän vuoden ja neljän suuren turnauksen aikana mallini on tuottanut keskimäärin plus 8-12 prosenttia ROI:ta arvovedoissa, mikä on vaatimaton mutta johdonmukainen tulos.
Viisi arvovetovalintaani (Kolumbia, Espanja, Norjan jatkoon, Saksa, debytoijien alle-vedot) perustuvat mallini ja markkinoiden välisiin poikkeamiin, eivät intuitioon. Ne eivät kaikki osu – todennäköisesti 2-3 viidestä menee oikein – mutta kokonaisuutena niiden odotettu tuotto on positiivinen. Tämä on datapohjaisen vedonlyönnin ydin: yksittäinen veto voi hävitä, mutta systemaattinen menetelmä tuottaa pitkällä aikavälillä.
Ennusteiden suurin viholliinen on joustamattomuus. Malli on hyvä lähtökohta, mutta turnauksen aikana kertyvä data – ensimmäisten otteluiden tulokset, kokoonpanomuutokset, joukkueiden kuntotilanne – pitää integroida ennusteisiin jatkuvasti. Analyytikko, joka pitää kiinni ennusteistaan todisteista huolimatta, on yhtä vaarallinen kuin analyytikko, jolla ei ole mallia ollenkaan. Paras lähestymistapa on yhdistää mallin antama perusta turnauksen aikaiseen havainnoihin ja päivittää todennäköisyydet kierros kierrokselta.
Turnaus alkaa 11. kesäkuuta. Kokoonpanot tarkentuvat, loukkaantumiset selviävät ja kertoimet liikkuvat. Päivitän mallini viimeisen kerran viikkoa ennen turnausta, kun kokoonpanotiedot julkaistaan. Siihen asti kertoimien seuranta ja oman analyysin rakentaminen ovat tärkeimmät tehtäväsi. Data odottaa, turnaus lähestyy.