Et dypdykk i Norges Scrabble-ordliste
Språk setter spor i statistikken. Når vi går gjennom den offisielle ordlisten fra Norges Scrabbleforbund, ser vi tydelige mønstre i hvordan norske ord bygges opp og hvilke bokstaver som dominerer.
Språk setter spor i statistikken. Når vi går gjennom den offisielle ordlisten fra Norges Scrabbleforbund, ser vi tydelige mønstre i hvordan norske ord bygges opp og hvilke bokstaver som dominerer.
922 322
Totalt antall ord i listen
Først ser vi på den klassiske bokstavanalysen: hvilke bokstaver ord starter med, og hvilke bokstaver som totalt forekommer oftest. Disse to perspektivene utfyller hverandre og gir en god grunnforståelse av ordmaterialet.
Startbokstav-grafen forteller hvor ofte en bokstav setter i gang et ord. Her peker S seg tydelig ut. Samtidig viser bokstavfrekvensen at E er den vanligste bokstaven totalt sett.
| Bokstav | Antall |
|---|---|
| Q | 345 |
| X | 1 036 |
| W | 2 456 |
| Z | 2 578 |
| C | 13 075 |
1 667 062
totale forekomster
... men bare
21 049
av dem er i starten av et ord.
Dette sier noe viktig om språkstruktur: en bokstav kan være svært vanlig inne i ord, men langt mindre vanlig som startbokstav. I kryssordsammenheng kan den forskjellen være nyttig når man vurderer kandidater til et mønster.
Her kan du filtrere datasettet, veksle mellom absolutte tall og prosent, og klikke i histogrammet for å få eksempelord i valgt lengde.
18
P95 betyr at 95% av ordene er på denne lengden eller kortere.
Her: 95% av ordene er <= 18 bokstaver.
Klikk på en søyle for å se eksempelord. Aktiv lengde: ingen valgt
Velg en søyle i histogrammet.
Tallene blir mest nyttige når de omsettes til valg i rutenettet. Rådene under er hentet direkte fra datasettet du ser på nå.
Lengdeprioritering
Medianen er 11 bokstaver, mens P95 er 18. Start med ordlengder rundt medianen når du vil finne treff raskt.
Startbokstav-strategi
Vanlige startbokstaver gir flest kandidater. Toppvalg i datasettet: S (133 101), K (76 598), F (73 051).
Vanlige mellom-bokstaver
Hvis du har en ukjent bokstav i midten, er E, N, R, S, T ofte gode første gjetninger.
Når sjeldne bokstaver er nyttige
Bokstavene Q, X, W, Z er sjeldne. Når én av disse er låst i rutenettet, kan du ofte snevre inn kandidatlisten kraftig.