私の関わりのある法人
ksbutton.png omemebuttan.png sowerbuttan.png
※このブログに書いていることは、私の関わりある法人の意見ではなく、
 あくまでも、私個人の意見です。

2024年05月24日

R でデータの数値に「,」が入っている時に取り除く(gsub 関数 と as.numeric)



 先日、購入した


ですが、ダウンロードできるデータをいじってみようと思い、income.csv というのをダウンロードしてみました。

しかし、私のやり方が悪いのか、

> x <- read.csv("income.csv") # x という変数に income.csv を入れる
> str(x)  #データの構造を見る
'data.frame': 100 obs. of 7 variables:
$ id : chr "AU" "AY" "AB" "AM" ...
$ sex : chr "male" "female" "male" "male" ...
$ age : int 70 70 69 67 66 66 65 65 65 64 ...
$ height : num 160 156 173 166 171 ...
$ weight : num 58.3 44 75.7 69.3 76.5 67.3 41.5 53.5 46.8 52.7 ...
$ income : chr "201" "487" "424" "1,735" ...
$ generation: chr "elder" "elder" "elder" "elder" ...

となってしまい、肝心の income(収入)が chr(キャラクタ。文字列)になってしまい計算とかができません。

これは「,」が入っているせいだと考え、いろいろ調べたけれどよくわからず、ChatGPT 3.5 に尋ねてみたら

gsub 関数を教えてくれました。

あと、文字列を数値に変えるのは

as.numeric


> x$income <- as.numeric(gsub(",","",x$income)) #income の列データ内の「,」を取り除き、数値にしろ

とすると

> str(x) 'data.frame': 100 obs. of 7 variables:
$ id : chr "AU" "AY" "AB" "AM" ...
$ sex : chr "male" "female" "male" "male" ...
$ age : int 70 70 69 67 66 66 65 65 65 64 ...
$ height : num 160 156 173 166 171 ...
$ weight : num 58.3 44 75.7 69.3 76.5 67.3 41.5 53.5 46.8 52.7 ...
$ income : num 201 487 424 1735 929 ...
$ generation: chr "elder" "elder" "elder" "elder" ...

と、ちゃんと income 列のデータが数値になりました。

しかし・・・元データを自作して、それをお見せしつつやったほうがいいだろうと思い、自分で テキストエディタ、Excel, Numbers などで 数値の部分に「,」の入ったデータを作って読み込んでみたらどれもこれも

Column specification
Delimiter: ","chr (1): idnum (1): incomeℹ Use `spec()` to retrieve the full column specification for this data.ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

列の指定
デリミタ ", "chr (1): idnum (1): income_2139 `spec()` を使用して、このデータの完全な列の仕様を取得します。

と警告が出てしまうのはなぜなんだろう・・・

でもって、警告は出るけれど、最初から numeric (数値)と認識してくれている。

まあ、数値内に「,」が入っているデータは作らないのが吉ですね。


posted by kingstone at 18:22| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする

2024年05月20日

『はじめての RStudio』浅野正彦・中村公亮共著




 RMarkdown という、R でコマンドを入れていった記録が自動的に取れる方法の説明・・・のはずなんだけど、私ロードの時点で失敗し、うまくいきません。

 Mac なんだけど・・・

 今まで、コマンドは Console に入れたものを、テキストエディタ(私の場合は mi )にコピペしたり、history から再起動時に再入力してたりしたから、うまくいけばすごく省力化できるはずなんだけど・・・

 いつも jobs のところで「停止しました」で終わってしまう・・・

一応調べたことなど記録しておく。

ーーーーー
knit とは
knit は、英語で「編む」「編んで作る」「束ねる」「つなぎ合わせる」「寄せ集めてシワまたは折りたたみにする」という意味の動詞です。また、名詞として「ニット・ニット製品」という意味もあります。

R での「knit」とは、マークダウンファイルを処理して出力ファイルを作成することを意味します。編み物をするという意味の英語「knit」と同じ読み方です。
ーーーーーー
Rmdファイルとは

RMDファイル(R Markdownファイル)は、マークダウンテキストとRコードチャンクを組み合わせた拡張子「.rmd」を持つテキストファイルです。Rプログラミング言語IDEであるRStudioによって生成され、ドキュメントの出力を修正したメタデータを持っています。
R マークダウン (RMD) ファイルは、マークダウン テキストと埋め込まれた R コード チャンクを組み合わせた拡張子「.rmd」を持つテキスト ファイルです。 これは、コードを含む説明テキストを記述し、動的なレポートやドキュメントを生成できるため、再現可能な調査とデータ分析のための強力なツールです。
ーーーーーーー
えっと、テキストに従ってinstallしようとした時だったかな?
こんなアラートが出た。

updating loaded packages
one oro more of the packages to be updatede are currently loaded.
Restarting R prior to install is highly recommended.
rstudio canrestart R before installing the requested packages. all work and data will be preserved during restart. Do you want to restart R prioro to install?

ロードされたパッケージの更新
更新されるパッケージの1つ以上が現在ロードされています。
インストールの前にRを再起動することを強く推奨する。
rstudioは、要求されたパッケージをインストールする前にRを再起動することができます。インストールの前にRを再起動しますか?

ところがYes にしたらまた同じアラートが出たので no にしたら、コンソールに「コンパイルする必要あり。するか?」(yes/no/cancel)みたいなのが出たのでエンターしたら始まったみたい。時間かかる。

ーーーーーー
で、なんかしたら

エラー: オブジェクト 'default_output_format' がありません

で、そのあとうまくいかない。

まあ、Console でちまちまやっていくか・・・


posted by kingstone at 23:25| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする

2024年04月02日

厚生労働省の統計情報や神戸市の相談支援事業の現状



 あくまでも、「今日、現在」でですが、

厚生労働省


で、ここに

障害者相談支援事業の実施状況等について(令和5年調査)

があります。
この「実施状況」の調査はずっと継続的にやっておられますね。
先日、Twitter (X) で話題になった、各地域の計画相談実施率のグラフもこちらの資料に出てきます。

※図はクリックすると大きくなります。
※大きくなった図をさらにクリックするとでブログ外に飛びますが、もっと大きくなります。
セルフプラン率.jpg

 しかし・・・Excel の元データが欲しいなあ・・・

 これは令和5年(2023年)のセルフプラン率で、兵庫県の障害児相談支援率は 30.8% となっています。これが兵庫県全体の数値ですが、これを神戸に限ってみると


の中の

神戸市障がい者保健福祉計画 第6期神戸市障がい福祉計画・第2期神戸市障がい児福祉計画(2021年3月策定)

というものがあります。

なお、神戸も手をこまねいているわけではなく、「神戸市相談支援専門員人材確保事業」というのをやっているのですが、


を見るとやはり令和3年度末(2022年3月)の段階で、障害児のセルフプラン率は88.8% となっており、逆にセルフプラン率が上がってしまっています。

Google Chrome での検索まとめだと

「現状では、計画相談支援を利用している人が少なく(令和元年度セルフプラン 率:障がい者 54.8%、障がい児 88.6%)、実態調査では利用希望者の約6割が制度を知らないと回 答しています。」

というのが出てきます。






posted by kingstone at 10:31| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする

Excel でデータを地図に反映させる




2024年4月18日 追記
 どうも何らかのバグがあるようです。
 数値が入っているのに、地図に反映されないことがありました。


オクシンさん( @OKU_MAYA )の以下の発言を見て、へええと思い、先日手に入れた「2023SSDSE-県別推移」の都道府県別総人口の Excel データ(2020年のみを抽出)から地図を作ってみました。


上記のツイートでは

@対象エリアを選択し「挿入」タブを押してマップをクリック
A日本地図が表示されるのでダブルクリック
Bグラフマークを押して「マップの領域」で「データが含まれる地域のみ」を選択
C「マップラベル」で「自動調整されたラベルのみ」を選択して完成

とのことでしたが、私の場合、

@対象エリアを選択し「挿入」タブを押してマップをクリック

したら世界地図しか現れない・・・しかし、Excel の表上に「データを being に送ることを許可するか」という文が世界地図とともに出ていたので、OK すると日本地図ができあがっていました。

ABCが無く、別のルートをたどったようですが、できました。

※図はクリックすると大きくなります。
※大きくなった図をさらにクリックするとでブログ外に飛びますが、もっと大きくなります。

スクリーンショット 2024-04-02 8.50.39.png


posted by kingstone at 09:04| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする

2024年03月07日

2023ベネッセ模試都道府県別平均点の表



 2023年のベネッセの模試(?)の結果について、5教科平均のランキングがこちらにありました。


 いろいろと調べるのに、ここからテキストエディターにコピペし、エクセルの北海道から順番に並んだ表に書きこんでみました。

 まあ「各都道府県でベネッセの(駿台模試の?)テストを受けた人だけのデータですが。

 PISA のデータがあればいいのにな・・・

 エクセルの表をダウンロードできるようにしましたが、ダウンロードすると「.crdownload」という拡張子がついてきます。その部分を削除して「.xlsx」に書き換えてやると、エクセルのデータとして使えます。

 なお、ウィルスチェックとかはようしませんので、ダウンロードは自己責任で。


で、2列目に人口、3列目に得点を入れ R で

> (wd <- getwd())
> library(psych)
> x <- read.csv(paste0(wd,"/jinkou&seiseki.csv"))
> names(x)
[1] "todoufuken" "jinkou" "seiseki"

> with(data = x,plot(x[ ,2],x[ ,3]))

とやると

スクリーンショット 2024-03-07 17.54.47.png

となって相関係数は

> corr.test(x$jinkou, x$seiseki)
Call:corr.test(x = x$jinkou, y = x$seiseki)
Correlation matrix
[1] 0.71
Sample Size
[1] 47
These are the unadjusted probability values.
The probability values adjusted for multiple tests are in the p.adj object.
[1] 0


ってことでした。


posted by kingstone at 17:36| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする