Press release
厚生労働省NDB集計システムの独自開発とデータ提供について
平素より弊社事業につきまして、ご理解とご高配を賜り厚く御礼申し上げます。
医療DXを推進する弊社では厚生労働省や医薬品医療機器総合機構(PMDA)などが公開するデータを独自にデータベース化して参りました。このたび、厚生労働省が提供する匿名医療保険等関連情報データベース(NDB)を独自のデータベースに変換するシステムを開発し、独自の集計ができるようになりましたので報告します。
平成26年度のレセプト情報を収載した第1回NDBオープンデータのエクセルファイル数は83個でした。最新の第9回は402個、エクセルシートで数えると1,000枚を超え、中には4,000行を超えるシートもあります。外来と入院は別々に集計されているため、1つのマスターコードのデータを複数のシートから集める必要があります。さらに性年齢別、診療月別、都道府県別、二次医療圏別などのエクセルファイルが提供されています。弊社ではこれまで複数年分のエクセルファイルを手作業で集計して参りましたが、特に医薬品は後発品も含めると種類が多く、その集計や見落とし確認に大きな手間がかかっておりました。
そこで、集計や出力を容易にし、集計漏れの可能性を低減するシステムを独自に開発しました。システムは厚生労働省が公開したすべてのNDBエクセルファイルを取込み、独自のデータベースを構築します。
社内でのデータ分析には既に利用を開始していますが、従前と比較にならないほどの速さで目的とするデータが手に入るため、多角的な分析にかかる時間を大幅に短縮できるようになりました。
本日より、医療データの販売サービスにレセプトデータをラインアップしました。
『データは二次活用されて価値が高まる』と考える弊社は、データが広く活用される事を願い基盤となるデータベースの強化を図っております。今後も新たなデータベースの構築に努めて参ります。
プレスリリース: 厚生労働省NDB集計システムの独自開発とデータ提供について(NES株式会社)
2024年11月11日
NES株式会社
本件に関するお問い合わせはこちらからお願い致します。
厚生労働省NDBオープンデータ
国民皆保険制度をとっている日本では、『保険診療』を行った(受けた)場合の費用は全国統一、年齢性差なく同じになるよう定められています。
医療機関が保険者に対して請求する診療報酬はコード化されており、そのコードに紐づいた情報がNDB(匿名医療保険等関連情報データベース)として公開されています。
複雑
診療報酬とひとくくりになっているものを紐解くと、いくつもの分類や階層があります。
大別すると保険医療機関は医科、歯科、調剤(薬局)の3つに分けられます。保険点数がついた物品は医薬品と診療材料があります。
医科の診療行為には外来での初診や再診に始まり検査、処置、入院、手術など必要な医療が追加されるごとに、診療報酬も発生していきます。
- 第1回NDBオープンデータ Excel Sheet 一覧表
- 第2回NDBオープンデータ Excel Sheet 一覧表
- 第3回NDBオープンデータ Excel Sheet 一覧表
- 第4回NDBオープンデータ Excel Sheet 一覧表
- 第5回NDBオープンデータ Excel Sheet 一覧表
- 第6回NDBオープンデータ Excel Sheet 一覧表
- 第7回NDBオープンデータ Excel Sheet 一覧表
- 第8回NDBオープンデータ Excel Sheet 一覧表
- 第9回NDBオープンデータ Excel Sheet 一覧表
拡大
診療報酬のデータは年々増加しています。
厚生労働省が発表した資料によれば、今後もNDBのデータは拡充されていくとのことです。
縦横分析
レセプトデータは性別、年齢別、診療月別、都道府県別、二次医療圏別など様々な要素で算定回数や患者数が報告されています。
医薬品では、同じ効果効能であっても商品が違えば別々のレセプトコードを持っているため『喘息薬の使用量を調べて』と依頼された場合、まずは喘息薬をリストし、それぞれをExcelファイルから探し出し、それが外来と入院で別々に算定されていないかなども調べます。
医薬品は複雑です。同じ名前の薬でも濃度や容量が違えばコードも違います。例えばパルミコートの吸入薬を調べるならば3種類をリストし、それぞれの性別、年齢別、診療月別、都道府県別、二次医療圏別などのデータを集める必要があります。
- パルミコート 100㎍ タービュヘイラー112吸入
- パルミコート 200㎍ タービュヘイラー56吸入
- パルミコート 200㎍ タービュヘイラー112吸入
性年齢別のExcelは5歳階級別に列が分かれているので男性19列、女性19列で構成されます。
診療月別なら12列です。
都道府県別なら47列です。
すなわち、これらは列数が不一致なので縦に並べることができません。横に並べると上記3項目だけで97列、二次医療圏は300を超えるのでExcelシートで500列くらい使うことになります。
非常に複雑になります。
しかし、これらのデータを集計しなければ分析できません。
インポート処理
厚生労働省が提供するNDBファイル群は科目や章に分かれているため、まずはそれらを分類してインポートします。
医科、歯科、調剤の区別の中にも算定回数と患者数という2種類があるため、それらも分けてデータベースを構築します。
下図の通り、インポートに際してはドロップダウンリストからファイル種を選択するようになっていますが、基本的には自動化されています。
ファイルを選択した時点でこれらのドロップダウンリストは自動選定されており、さらにインポートする際にはエクセルシートを覗いて列数などから対象カテゴリのファイルと一致しているかチェックを入れています。
誤ってデータベースに収載されないためのフールプルーフ機能を備えています。
複数年度一括集計
Excelファイルを個々に開く必要があったものが、弊社独自のシステムでは1画面ですべてを取り扱うことができます。
検索ワードに『パルミコート』と入力して検索すれば、過去の全処方数を見ることができます。
最新の第9回だけに絞ることもできますし、第5回以降のすべてと絞り込むこともできます。
エクセルファイル提供
独自システムは弊社内で使用しますが、エクセルファイルを出力してお客様に提供しております。
エクセルファイルを利用すればグラフ化することも容易ですので、例えば下図のような分析結果を得る事ができます。
例年60億円規模で診療報酬算定されていた処方薬が、コロナ禍では20億円規模にまで縮小、40億円の市場蒸発が発生していたことがわかります。
独自システム『MHLW-NDB』
厚生労働省のNDBオープンデータを集計するシステムは弊社の内部使用のためのシステムです。
システムの名称は『MHLW-NDB』となっています。良いネーミングが思いついたら変更する予定です。
アイコンは下図のとおりです。何となくデータベースっぽい形、赤と青は厚生労働省のロゴマークを参考にしています。素案はチャットGPTに考えてもらいました。
システム概要
本システムは弊社とAmpiTa Projectが共同して Microsoft Visual Studio 2022 を使い、C#言語で開発しました。
社内使用の閉鎖的なシステムであるため、画面はチープなものですが、必要な機能を揃っています。
コントロール画面ではインポートやエクスポート処理、絞込や指示を実行します。
データベースは個々にグリッド表示できます。
グリッド表示した内容はCSVファイルとしてエキスポートでき、そのCSVファイルをMicrosoft Excelなどの表計算ソフトで開くことでExcelファイルに変換、あるいはPDF出力や印刷出力に対応しています。
マニュアル
社内用のマニュアルの一部を掲載します。ここに表示したものは MHLW-NDB.exe の version 1.0.0 の物です。システムは随時更新しています。
関連ページ(サイト内リンク)
本件に関するお問い合わせはこちらからお願い致します。