
Salon Seudun Sanomat kertoi eduskuntavaalien alla tietojärjestelmäntieteen tutkijan Tapio Vepsäläisen mallista, jossa opetettu algoritmi ennusti eduskuntavaalien tulokset.
Vaalit on käyty, ja todelliset tulokset ovat selvillä. Kuinka oikeaan algoritmi osui?
Malli ennusti oikein 150 ehdokkaan valinnan. Lopuista 50:stä ehdokkaasta 23 ylsi varasijalle.
Tulos oli parempi kuin jos lähtökohta olisi esimerkiksi ollut, että kaikki ehdolla olevat istuvat kansanedustajat jatkavat. Kansanedustajia oli ehdolla 170. Heistä valittiin 139, ja varasijalle jäi 13.
Varsinais-Suomen vaalipiirissä Vepsäläisen malli ennusti oikein muun muassa salolaisten Mikko Lundénin (ps.) ja Saku Nikkasen (sd.) läpimenon.
Itse asiassa kaikki läpimenneiksi ennustetut tulivat valituiksi tai jäivät varasijalle.
Kokoomuksen uutta kansanedustajaa Milla Lahdenperää Vepsäläinen pitää mielenkiintoisena yllättäjänä. Toinen uusi kokoomusedustaja Varsinais-Suomesta on Pauli Aalto-Setälä.
– Vähän ihmettelen, miten malli ei napannut häntä, mutta se johtunee poliittisen historian puutteesta, vaikka seuraajia somessa riittää, arvioi Vepsäläinen.
– Janika Takatalo olisi ollut mallin arpoma kokoomuksen viides ehdokas. Anne-Mari Virolaiselle veikattiin myös läpipääsyä, mutta hän jäi varasijalle.
Algoritmi ennusti tiukkaa kisaa ykköspaikasta niin kuin kannatusmittauksetkin.
– Puolueiden järjestys meni oikein. Puolueita on kuitenkin sen verran vähän, että yksien vaalien perusteella on vaikea sanoa, kuinka paljon tuloksessa oli sattumaa mukana, sanoo Turun yliopiston tutkija Tapio Vepsäläinen.
– Prosentit eivät jääneet kauaksi mielipidemittauksista, mutta kyllä mielipidemittaukset olivat selvästi tarkempia. Pitkälti samat heilahtelut toistuvat niissä ja tässä mallissa.
Mallinsa heikoimpana kohtana Vepsäläinen pitää sitä, että pienpuolueet korostuivat isompien kustannuksella.
– Lisäksi osa somessa suosituista jäi pois ”tutkasta”, koska tietoa ei kerätty Instagramissa tai TikTokista. Tämän pystyy hyvin ottamaan jatkossa huomioon, ja puute oli jo tiedossa.
Vaaleissa voittajat menestyivät ennustetta paremmin.
Vepsäläinen on väitöstutkimustaan varten kerännyt aineistoa vuosien 2015, 2019 ja 2023 eduskuntavaalien ehdokkaistaja vaalien tuloksista. Näkökulma on tutkia vaalien avulla, miten sosiaalinen media ennustaa reaalimaailman tapahtumia.
Menetelmää voi käyttää monen asian mittaamisen, mutta vaaleissa ennustetta voi verrata tarkkaan todelliseen lopputulokseen.
Sosiaalisen median vaikutus ennusteeseen tulisiitä, kuinka paljon ehdokkaalla oliseuraajia Twitterissä ja paljonko hänen Facebook-kampanjasivullaan olitykkäyksiä.
Some-aineisto oli vain osa ennustetta. Suurempi paino oli ehdokkaan poliittisen kokemuksella, aikaisemmalla menestyksellä eri vaaleissa ja vaalibudjetilla.
Väitöstutkija Vepsäläinen arvioi sähköpostiviestissään, että ”tällaiset menetelmät voivat tuottaa hyvinkin relevanttia tietoa”.
– Ottaen huomioon, miten paljon tiedettä ja työtä on mielipidemittauksien taustalla ja miten ne ovat vuosikymmenien saatossa kehittyneet nykyiseen muotoonsa, kyllä tässä on mielestäni potentiaalia, joskin kehitettävää on vielä paljon.
– Tätä ei tietysti voi verrata mielipidemittauksiin. Ehkä voisi sanoa, että malli ennustaa ehdokaslistojen laatua eli sitä, kuinka kokeneita ja menestyneitä ehdokkaita puolueilla on listoilla. Asetelma ei ota kovin tarkasti kantaa mielipideilmapiiriin, vaan antaa isomman painoarvon historialliselle menestykselle.
Eduskuntavaalit: Äänestäjät vs. algoritmi
- Kokoomus 48 (algoritmi: 42)
- Perussuomalaiset 46 (40)
- SDP 43 (39)
- Keskusta 23 (27)
- Vihreät 13 (18)
- Vasemmistoliitto 11 (15)
- RKP 9 (11)
- Kristillisdemokraatit 5 (5)
- Liike nyt 1 (2)
- Ahvenanmaa 1 (1)