Et dypdykk i Norges Scrabble-ordliste
Språk setter spor i statistikken. Ved å gå gjennom den offisielle ordlisten fra Norges Scrabbleforbund (NSF) – nær én million ord – kan vi se tydelige mønstre i hvordan norske ord bygges opp, og hvilke bokstaver som dominerer.
922 322
Totalt antall unike ord i listen
For å få oversikt bruker vi to visualiseringer: én som viser hvilke bokstaver ord oftest starter med, og én som viser hvor ofte hver bokstav forekommer totalt. I hvert plott kan du sortere enten alfabetisk eller etter antall.
Nøkkelobservasjoner
Grafen for startbokstav sier noe om “startfarten” til bokstavene. Her skiller S seg tydelig ut, med over 133 000 ord som starter på S. Samtidig viser bokstavfrekvensen at E er den vanligste bokstaven totalt.
| Bokstav | Antall |
|---|---|
| Q | 345 |
| X | 1 036 |
| W | 2 456 |
| Z | 2 578 |
| C | 13 075 |
1 667 062
totale forekomster
... men bare
21 049
av dem er i starten av et ord.
De sjeldneste bokstavene dukker ofte opp i lånord og spesielle skrivemåter, og gir et lite innblikk i “ytterkantene” av ordforrådet. Samtidig er det interessant at E er svært vanlig i språket, men likevel sjelden som startbokstav. Det sier noe om hvordan norske ord typisk er bygget opp.
Når du kan sortere og utforske tallene selv, blir en stor ordliste mer enn bare en regelbok: den blir et datagrunnlag som faktisk sier noe om språket i praksis.