SQUIRREL
H先生に厚生労働省からレセプト情報・特定健診等情報データベースが一般公開されたことを教えて頂きました。先日ヴァージョンアップした" Exploratory "などを使えば、時間とちょっとしたスキルがあれば、ほぼノーコストで医療政策への提言ができる環境が揃…
函館市のオープンデータ化の記事があったので、関連リンクを2,3挙げておきます。 オープンデータがあってこそ、以前ここで紹介した "Exploratory" のようなソフトが活かせます。 函館市オープンデータポータル Code for Hakodate 株式会社まちづくり五稜郭
NEJMでは "Audio Summary" と題して、2005年11月3日から毎週音声による要約を配信しています。さすが、NEJMというべきか、いち早くWeb 2.0の波に乗ったのですが、正直、内容は本誌の要約というよりは、ティーザー広告のようです。 逆にそれを活かして、課題…
データのやりとりはエクセルで保存したファイルを添付してをメールすることが多いが、開けないことがある。開くことができても、データが正規化されておらず、前処理が必要になることが多い。データの前処理は、プロのデータ解析者の場合は仕事の80%を占め…
統計環境R言語のフロントエンドとして脚光を浴びている "Exploratory Desktop" 、少し触った限りでは便利そう。関係者のブログに コマンドラインインターフェイスで、データ解析とビジュアライズが同時に、柔軟にできるソフトウェアです。技術的に書くと、R…
前回、掲げたCSVファイルを使って経時的読解速度の推移を見える化してみる。R単体では、魔法の呪文のようなコマンドが必要な割に、グラフが綺麗ではないので、フロントエンドとして、"Exploratory Desktop" を利用した。課題の語数、分数、秒数から読解速度…
下記の例のように、一行目を項目名として、データの値をコンマで区切って並べたテキストファイルの様式を Comma-Separated Values (CSV) と称している。OSやソフトの枠を超え、可搬性に優れたデータの書式であり、エクセルでもCSVを入出力できるので、SQUIRR…
前回の抄読会で、Clinical Problem-Solvingのシリーズ244回のうち20回分(8.2%)を読んだことになります。それを記念して100個の例文からなる例文集とその音声を作りました。224回分すべての診断家の発言をコーパスとして、その中で出現する 4-gram を頻度順に…