データベースシステム内での導出(算出)値の使用は、EDCの普及により日常的なこととなっています。この記事では、EDC(入力画面)上での導出値の利点と潜在的なリスク、それに関連する問題について考えてみたいと思います。
メリット
効率性の向上
EDC上での導出値は、必要な情報をリアルタイムで計算し提供することにより、データ入力の効率性を高めます。例えば、あるスコアの集計において、合計を手動で計算するのではなく、導出値を用いることで自動的に合計値を取得できます。
データ整合性の保持
正しく設計された導出値は、異なるデータソース間の整合性をチェックするのに役立ちます。例えば、拡張期血圧が収縮期血圧を超えているかが入力時にチェックできます。これにより、入力エラーやデータの矛盾が最小限に抑えられます。
デメリット
パフォーマンスの問題
複雑な導出値は、システムのパフォーマンスに悪影響を及ぼすことがあります。端的に言えば処理時間が少しかかるようになったり、通信速度への負荷が多くなる、すなわち”重くなる”可能性があります。
メンテナンスの複雑さ
導出ロジックの変更が必要になった場合、または導出値の計算元となる変数(元データ)に変更が必要になった場合、それを追跡し矛盾なく更新することは、時間とリソースを要する作業になりがちです。また、導出値が含まれる画面が保存された後に元データを変更しても、導出値には反映されないという場合があります。
オリジナルデータの問題
導出値を利用する際、元のデータと導出されたデータとの間で、どのデータが「原本(真値)」を表しているのかの定義が曖昧になることがあります。例えば、複数のソースから集められたデータを元に算出された平均値は、平均値自体の元データは無いことになります。(SDVの相手がいない?)また、手動で計算された平均値が医療記録に記載されていたが、その値が計算ミスにより違っていたため、導出値と一致しないことも起こりえます。このような場合、データの出所とその信頼性が問題になることがあります。
浮動小数点の問題
浮動小数点数とは、コンピューター内で小数を表現するための一般的な方法です。この方式では、非常に大きい数や小さい数を効率的に扱うことが可能ですが、完全な精度は保証されません。例えば、「1÷3×3」の計算結果は、システムやデバイスによって「0.9」「0.999999」「1」と異なることがあります。このため、データが複数のシステムやデバイスの間を移動する場合は注意が必要です。EDC上での導出値と、出力されたデータを元に解析システムで導出した結果が一致しない場合なども想定されますので、浮動小数点の問題には十分に留意・理解したうえで導出値の利用を検討してください。
責任の所在
導出値が誤っていた場合、その責任を誰が負うかはしばしば複雑な問題です。例えば、導出された体表面積から投与量を決定したが、計算が間違っておりオーバードーズによる副作用が発生した場合、その結果に対して責任を負うべきはシステムを提供した者か、導出ロジックを設計したものか、それとも導出データを確認し投与量を決定したものか、その判断は曖昧となります。
まとめ
導出値はデータベースシステムにおいて非常に有用ですが、それを使用する際には慎重な設計と管理が必要です。これらのベネフィットとリスクをバランスさせることが、効果的なデータマネジメントの鍵ともなります。データベースの導出値に関連する問題を理解し、そもそもの要否と、利用する場合には適切に管理することで、導出値の真価を最大限に引き出すことができます。