データサイエンティスト上がりのDX参謀・起業家

データサイエンティスト上がりのDX参謀・起業家のブログ。データ分析や事業について。自身はアーティスト、経営者、事業家。

勉強

感度・特異度と陽性的中率・陰性的中率

医学臨床の検査キットなどの性能を評価する指標に、感度(sensitivity)と特異度(specificity)というものがあります。例えばある病気の検査を調べるとき、実際に病気に罹っている人のうち陽性と出る割合を感度、病気に罹っていない人のうち陰性と出る割合…

メモ(SQL)

仕事でSQL操作をすることになりそうなのでメモ。 library(sqldf) #SQLデータベースのように使う library(RMySQL) RでSQLを扱うことができるのはとりあえずこの2つが見つかった。使い方はSQL自体をちょっと触ってから調べようと思う。

IBSML2010で発表してきました

学生が多かったような気がします(彼らは工学部とかなのかな?)。発表内容も統計連合大会と似たような感じでしたね(私見ですが)。もうちょっと理論だけじゃなくて実用性のある発表を聞きたい気もするけど、そういう発表はまた違う学会になるのかな。やは…

統計はデータ、データは数、数は力

昨日テレビで田中角栄先生の「政治は数、数は力、力はカネ」という言葉を聞き、統計学では何だろうと考えた。最近自分の研究で遺伝子分野などの超高次元小標本データでも、サンプル数が多ければ予測アルゴリズムを検出できそうなことが分かってきた(今のと…

レセプトのデータ構造

レセプトの生データはとても複雑に記録されています。データの容量を節約するためなんだろうけど、単純に観測値×変数の形になっていません。久しぶりに構造の復習をしたので、記録しておきます。 MED(外来) HOに合計点数 REにレセプト種別コード(続柄) K…

経済時系列の解析

主な関数 :decompose() 何ヶ月か前にこの本の勉強をちょっとやった。Rによる時系列分析入門作者: 田中孝文出版社/メーカー: シーエーピー出版発売日: 2008/06/01メディア: 単行本購入: 12人 クリック: 113回この商品を含むブログ (19件) を見るGDPデータの…