Et dypdykk i Norges Scrabble-ordliste

Språk setter spor i statistikken. Ved å gå gjennom den offisielle ordlisten fra Norges Scrabbleforbund (NSF) – nær én million ord – kan vi se tydelige mønstre i hvordan norske ord bygges opp, og hvilke bokstaver som dominerer.

Ordbokens omfang

922 322

Totalt antall unike ord i listen

For å få oversikt bruker vi to visualiseringer: én som viser hvilke bokstaver ord oftest starter med, og én som viser hvor ofte hver bokstav forekommer totalt. I hvert plott kan du sortere enten alfabetisk eller etter antall.

Startbokstav
Bokstavfrekvens

Nøkkelobservasjoner

Grafen for startbokstav sier noe om “startfarten” til bokstavene. Her skiller S seg tydelig ut, med over 133 000 ord som starter på S. Samtidig viser bokstavfrekvensen at E er den vanligste bokstaven totalt.

De 5 Sjeldneste Bokstavene
BokstavAntall
Q345
X1 036
W2 456
Z2 578
C13 075
Paradokset 'E'

1 667 062

totale forekomster

... men bare

21 049

av dem er i starten av et ord.

De sjeldneste bokstavene dukker ofte opp i lånord og spesielle skrivemåter, og gir et lite innblikk i “ytterkantene” av ordforrådet. Samtidig er det interessant at E er svært vanlig i språket, men likevel sjelden som startbokstav. Det sier noe om hvordan norske ord typisk er bygget opp.

Når du kan sortere og utforske tallene selv, blir en stor ordliste mer enn bare en regelbok: den blir et datagrunnlag som faktisk sier noe om språket i praksis.