オススメ「三種の神器」#3.DRS

DRSとは

Data Review Specificationsすなわちデータレビュー仕様書のことを指すスーザックで使用している略語です。
通常はデータクリーニングと言われることが多いと思いますが、スーザックではなぜデータレビューという表現を使っているのか。
「クリーニング」という言葉には(明らかな)間違いを直すというイメージがあります。一方、「レビュー」という言葉には全体を俯瞰して、不適切な部分はないかを探索するというイメージがあると考えるからです。

DRSで宣言したいこと

DRSで明文化したいことは大きく3つあります。

1.プライオリティ(優先順位)
データレビューにおけるプライオリティは、一般的なリスクマネジメントと同じ考え方です。すなわち次の3点、
・研究結果に与えるダメージの大きさ:プロトコールの目的、評価項目などの理解が必要となります
・予想される発生頻度
・検出のしやすさ:つまり見つけやすいかどうかということ
これらを勘案しつつ優先順位を決めます。

2.タイミング
データレビューを実施するタイミングを設定します。上記のプライオリティを踏まえながら、データレビューするタイミングや頻度を考えます。また、対象となるデータにはオリジナル(原データ)が有るか無いかということがタイミングを検討する際に鍵となります。なぜならば、原データが有れば確認したいときには真値に戻れるますが、原データが無い場合は、、、今更言われても、、、それ最初に言ってよ、、、ということになります。

3.アクション
データレビューをした結果、何らかの問題が検出された場合の対応を予め計画しておきます。一般的には次のような対応が計画されます。
・データ入力者に問い合わせる(原データと照合する、いわゆるクエリ発行)
・データを読み替える(有効桁数未満を四捨五入する、SEDC:Self Evident Data Correctionなど)
・解析担当者などに取り扱いを申し送る
なお、読み替えや、取り扱いのルールが後工程(解析担当者など)に伝わっていないと、誤解釈など惨事を招くので十分な注意が必要です。
また、問い合わせる場合には、「質問の意図と違う答えが返ってきて、再度問い合わせることになる」といったリスクや、無意識のうちに”誘導”となってしまう危険性など、注意すべきことが多いので、「問い合わせ文」のパターンを予め検討し考えておくことが推奨されます。

DRSを作成するにあたり

先にご紹介した三種の神器すなわち「TLF」と「DDT」があると、効率的にDRSを作ることができると思います。研究開始前には何かとバタバタ・・・ということはわかりますが、この三種の神器はかなりオススメなので、ぜひ頭の片隅にでも留めておいていただければと思います。

PAGE TOP