統計の練習用に、2010年と2020年の都道府県別の人口と、2010年を100とした時の2020年の割合(%)を入れたデータを作ってみました。必要な方は、CSV は大丈夫だと思いますが、Excel ファイルの方は自己責任でダウンロードしてください。
↑
自動ダウンロードできますが、やってみたら名前が変わり、拡張子も変わってて、拡張子を.xlsx に変えてやれば、ちゃんと使えます。
また拡張子の前の名前も英字で書いてやらないと、R で読み込んだ時に不具合が起こると思います。
↑
今、クリックしてみたら、csv ファイルは、クリックすると、ブラウザにテキストが出てきて、それをコピペするようになるんですね。自動ダウンロードでは無い。
1.最新版 SSDSE から 「 SSDSE-県別推移 SSDSE-B-2023」をダウンロード
2.各都道府県のうち2020と2010以外の行を削除
3.「都道府県名」「総人口」の列をコピーして、新しいエクセルシートに貼り付け
4.新規の列を挿入し同じ都道府県の2010年と2020年の総人口が横に並ぶようにする。(式で1個だけ作り、あとはハンドルを引っ張って一気に47都道府県やった。今考えると単純に1行ずらしたコピペでも良かった)
5.全部コピーして、新しいシートに「値」のみコピー
6.不必要な行を削除(1個とばし)
7.以前作っていた英字の都道府県名で上書き
と、たいへん面倒なことをやってます。
本当はプログラミングしてやればしゅしゅしゅーっとできるのかな?
R でとりあえず2010年の人口と、人口増減の割合の散布図を書こうと思って
> wd <- getwd()
> library(psych)
> x <- read.csv(paste0(wd,"/2010_2020_todoufukensoujinkou.csv"))
> library(psych)
> x <- read.csv(paste0(wd,"/2010_2020_todoufukensoujinkou.csv"))
としてから
> with(x,plot(2010 , wariai))
とやってみたら
xy.coords(x, y, xlabel, ylabel, log) でエラー:
'x' and 'y' lengths differ
そこで length というのをやってみたら
> with(data = x, length(wariai))
[1] 47
> with(data = x, length(2010))
[1] 1
> with(data = x, length(2020))
[1] 1
[1] 47
> with(data = x, length(2010))
[1] 1
> with(data = x, length(2020))
[1] 1
なぜだ?
でこうやってみると、なぜかできました。
> with(data = x,plot(x[ ,2],x[ ,4]))
※図はクリックすると大きくなります。
こっちはいけたんだけどな。
> pairs.panels(x[,2:4])