tisdag 11 december 2007

Tusental

Att lägga in böcker på Librarything är fortfarande roligt. Jag märkte inte av när jag hade kommit upp till tusen böcker, men när jag lade in Landet utanför av Maria Gripe märkte jag att det blev bok tvåtusen och firade det genom att läsa den. Igår kväll kom jag upp till tretusen, men det var Nusvensk frekvensordbok baserad på tidningstext, del 2, köpt för 49,50 på rea på Studentbokhandeln för länge sen. Det är en mastig volym på 1066 sidor med många ordlistor över hur vanliga ord var i svenska tidningar 1965, och det kändes inte lika lockande att läsa som Gripe, men nånting kan man ju göra.

Jag plockade ut de hundra vanligaste geografiska namnen från lista 1.1.6.11 där med egennamn i frekvensordning. De är i tur och ordning Sverige, Stockholm, England, Frankrike, Europa, Paris, London, Tyskland, Danmark, Norge, Göteborg, York, Malmö, Finland, Kina, Moskva, Sovjet, Washington, Amerika, Vietnam, Rhodesia, Italien, Uppsala, Storbritannien, Lund, Sovjetunionen, Köpenhamn, Spanien, Skåne, Västtyskland, Berlin, Österrike, Ryssland, Rom, Indien, Afrika, Wien, Sydafrika, Norden, Schweiz, Holland, Småland, Algeriet, Nordvietnam, München, Peking, Israel, Jugoslavien, Japan, Pakistan, Skandinavien, Polen, Örebro, Australien, Kuba, Asien, Kanada, Norrland, Sydvietnam, Atlanten, Bonn, Island, Kiruna, Hollywood, Östersjön, Ungern, Sydamerika, Norrköping, Oslo, Västberlin, Västeuropa, Helsingfors, Öland, Grekland, Medelhavet, Hanoi, Skövde, Sydöstasien, Belgien, Halmstad, Växjö, Chicago, Kalmar, Genève, Portugal, Madrid, Bryssel, Sydsverige, Östtyskland, Dalarna, Kongo, Marocko, Halland, Umeå, Gävle, Hälsingborg, Skansen, Bulltofta, Jönköping, Tjeckoslovakien

(Tittar man istället på personnamnen så ser man snart att bland de hundra vanligaste förnamnen i svenska tidningstexter 1965 är det 9 kvinnonamn och 91 mansnamn. Jag undrar hur det ser ut idag.)

Jag tänkte försöka få en bild av vilka delar av världen som är mer eller mindre på tapeten idag än då, så därför jämförde jag detta med antal träffar jag får om jag söker på samma namn på news.google.se och kalibrerade siffrorna för att få ungefär samma mått. En del är väl självklart. Det lär skrivas mindre om Östtyskland nu när det inte finns längre, t.ex. Annat är kanske inte lika självklart. Här är listan sorterad med namn, frekvens då, frekvens nu och kalibrerad relativ förändringen i procent, sorterade efter det sistnämnda, så först kommer det som relativt sett nämns oftare idag och sist Sydvietnam som inte fick en enda träff när jag sökte och alltså har gått ner med hundra procent.



Umeå11,161032+611
Jönköping10,34760+465
Norrköping19,051211+389
Kalmar13,60856+384
Gävle10,96659+362
Halmstad14,55779+312
Halland11,18477+228
Skåne46,951943+218
Örebro27,321024+188
Madrid12,47450+177
Växjö14,50494+162
Malmö104,903112+128
Portugal12,48347+114
Helsingfors17,26471+110
Ryssland45,141223+108
Uppsala72,511866+98
Dalarna11,49291+95
Bryssel12,44302+87
Spanien48,441156+83
Göteborg129,002921+74
Asien22,33502+73
Stockholm412,608509+59
Skövde15,55311+54
Finland93,451867+54
Japan28,89543+44
Sverige649,0011911+41
Lund70,821269+38
Kanada21,85369+30
Oslo18,33307+29
Polen27,42437+23
Norden39,30631+23
Australien26,92425+21
Norrland21,41317+14
Europa185,802760+14
Grekland16,56242+12
Kina90,931308+11
Östersjön19,41258+2
York110,201407-2
Belgien14,55185-2
Danmark137,101688-5
Indien40,87501-6
Schweiz36,34440-7
Tyskland142,101697-8
Öland16,63195-10
Afrika40,14457-12
Köpenhamn56,40636-13
Israel29,33326-15
Island20,59221-17
Chicago13,68139-22
Italien77,44771-23
Österrike45,19455-23
Kiruna20,02193-26
Storbritannien71,27680-27
Holland34,80332-27
Sydafrika39,76357-31
Norge135,101183-33
Peking29,90259-33
Berlin45,79376-37
Hollywood19,62156-39
Skansen10,5682-40
Småland32,09231-45
Sydamerika19,06129-48
London169,201115-49
Ungern19,16128-49
Skandinavien27,78171-53
Kongo11,4862-58
Genève12,7666-60
Marocko11,2957-61
Rom41,09201-62
Pakistan28,18130-65
England220,10963-66
Wien40,07178-66
Västeuropa17,3377-66
Atlanten20,9390-67
Medelhavet16,0969-67
Frankrike213,70861-69
Moskva90,07347-70
Sydsverige12,3949-70
Washington84,78325-71
Paris184,30634-74
München30,6693-77
Tjeckoslovakien10,3025-81
Kuba26,4462-82
Jugoslavien29,0366-83
Sovjetunionen59,8794-88
Amerika84,15108-90
Vietnam79,04102-90
Hanoi15,8719-91
Östtyskland12,1914-91
Algeriet31,9128-93
Sovjet89,6871-94
Västtyskland45,9415-97
Bonn20,787-97
Västberlin17,805-98
Bulltofta10,423-98
Rhodesia79,039-99
Nordvietnam31,663-99
Sydöstasien15,162-99
Hälsingborg10,881-99
Sydvietnam21,300-100



Att så många svenska ställen har högre siffror nu kanske bara beror på att det inte är riktigt samma slags källor som har använts, men att en del ställen ändå har markant lägre siffror nu tycker jag är intresseväckande. Varför har Småland gått ner 45% medan Halland och Skåne går upp? Varför har Kiruna gått ner medan andra svenska städer gått upp, i synnerhet Umeå? Frågor frågor.

2 kommentarer:

Björn Lindström sa...

York verkar lite malplacerat i den första listan. Jag gissar på en inte så smart tokeniserare.

Per Starbäck sa...

Det är nog helt meningen som dom har gjort en enkel orduppdelning. "York" är ett egennamn, medan det lite mer frekventa "New" är en "utländsk enhet".