※このブログに書いていることは、私の関わりある法人の意見ではなく、
 あくまでも、私個人の意見です。

2024年02月27日

2010年と2020年の都道府県別人口



 統計の練習用に、2010年と2020年の都道府県別の人口と、2010年を100とした時の2020年の割合(%)を入れたデータを作ってみました。必要な方は、CSV は大丈夫だと思いますが、Excel ファイルの方は自己責任でダウンロードしてください。

    ↑
自動ダウンロードできますが、やってみたら名前が変わり、拡張子も変わってて、拡張子を.xlsx に変えてやれば、ちゃんと使えます。
また拡張子の前の名前も英字で書いてやらないと、R で読み込んだ時に不具合が起こると思います。

    ↑
今、クリックしてみたら、csv ファイルは、クリックすると、ブラウザにテキストが出てきて、それをコピペするようになるんですね。自動ダウンロードでは無い。


1.最新版 SSDSE から 「 SSDSE-県別推移 SSDSE-B-2023」をダウンロード

2.各都道府県のうち2020と2010以外の行を削除

3.「都道府県名」「総人口」の列をコピーして、新しいエクセルシートに貼り付け

4.新規の列を挿入し同じ都道府県の2010年と2020年の総人口が横に並ぶようにする。(式で1個だけ作り、あとはハンドルを引っ張って一気に47都道府県やった。今考えると単純に1行ずらしたコピペでも良かった)

5.全部コピーして、新しいシートに「値」のみコピー

6.不必要な行を削除(1個とばし)

7.以前作っていた英字の都道府県名で上書き

と、たいへん面倒なことをやってます。

本当はプログラミングしてやればしゅしゅしゅーっとできるのかな?



R でとりあえず2010年の人口と、人口増減の割合の散布図を書こうと思って

> wd <- getwd()
> library(psych)
> x <- read.csv(paste0(wd,"/2010_2020_todoufukensoujinkou.csv"))

としてから

> with(x,plot(2010 , wariai))

とやってみたら

xy.coords(x, y, xlabel, ylabel, log) でエラー:
'x' and 'y' lengths differ

そこで length というのをやってみたら

> with(data = x, length(wariai))
[1] 47
> with(data = x, length(2010))
[1] 1
> with(data = x, length(2020))
[1] 1

なぜだ?

でこうやってみると、なぜかできました。

> with(data = x,plot(x[ ,2],x[ ,4]))

※図はクリックすると大きくなります。

スクリーンショット 2024-02-27 11.09.32.png

こっちはいけたんだけどな。

> pairs.panels(x[,2:4])

スクリーンショット 2024-02-27 10.51.39.png
posted by kingstone at 11:44| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック