オススメ「三種の神器」#2.DDT

DDTとは

Data Definition Tables の略(スーザックでの略語です)、データ構造定義書のことです。
データマネジメントに関連するドキュメントの中でもっとも重要なものと考えています。なぜならば、DDTは、新しくデザインするデータベースの設計図であり、収集されるデータの定義を明文化するものであることから、データベースの構造に関する備忘録、すなわち当該研究において定義されている暗黙知を形式知として共有するための文書だからです。別の見方をすれば、DDTを作成するデータマネジャーが未来の自分自身にわたす申し送り事項とも言えます。

DDTのメリット

DDTを作成することのメリットは数え切れないほどあります。
・データベースの構造が立体的に整理されます。どの項目が、どのタイミングで、何度繰り返されるか、といったイメージを整理することがです。
・プロトコールにおいて定義が明確になっていない項目を確認することができます。
・解析担当者にデータを渡す際の申し送りが簡単かつ確実なものになります。
つまり、なんとなくあやふやなまま研究が進められてしまうことを防げることが最大のメリットだと考えます。また、これから構築するデータベースのイメージが具体化されることも大きなメリットだと思います。

DDTを作る具体的な手順

(1)プロトコールから観察・測定されるデータ項目(変数)をすべて抽出します。
「観察項目」「実施手順」「試験スケジュール」といったセクションに記載されている内容から、発生しうるすべてのデータ項目を拾い上げます。あわせて「背景(経緯)」「研究目的」「評価項目」といったセクションにて、各データ項目の意味や使用目的などを把握しておくと、データ構造をデザインする際に大変参考となります。
ここで注意したいのは、それぞれのデータに付随するべき情報(メタデータ)の要否を検討することです。例えば臨床検査において「血糖値」が収集される場合、「実施の有無」「採血日」「採血時間」「単位」「採血前8時間以内の食事の有無」といった付随情報も同時に収集するか?といったことを忘れず検討しましょう。

(2)データ項目をフォームにまとめます。
同一の測定方法のもの、意味が共通するもの等を考慮し、適度にデータ項目をまとめます。ここでまとめられた1つの塊(フォーム)がEDCの1画面になると考えてください。例えば、「被験者背景」という画面に「性別」「生年月日」「同意取得日」といったデータ項目がまとめられます。ちなみに利用するシステムにより「フォーム」とか「テーブル」と呼ばれますが、ここでは「フォーム」という言葉を使用します。
ここで注意したいのは、1つのフォームにあまりにも多くのデータ項目があると、使いづらくなるということです。長編小説なのに、章や節といった区切りがなく1つの文書で書かれているものを想像してみてください。ちょっと読みづらいと思います。正解はないのですが、スーザックでは1つのフォームに15項目以内でおさまることを意識しながらデザインするようにしています。

(3)各データ項目の特性や定義を明記します。
収集されるデータのタイプが数値(量的)かカテゴリ(質的)か?
数値項目については、単位や桁数などの定義。カテゴリ項目については、選択肢(例えば、性別=男/女)の定義。
自動計算などによって導出されるデータ項目の場合は、導出する式(例えば、BMI=体重(kg)÷身長(m)÷身長(m))の定義。
その他、(1)の手順で抽出したすべてのデータ項目について、それぞれの特性や定義、さらには必須項目であるか否か等を明確にします。
ここで注意したいのは、それぞれのデータ項目に親子関係(例えば、性別が女性だったら妊娠経験の有無を聞く。逆に男性だったら聞かない)がある場合は、そのことを明記しておいたほうが良いと思います。

ぜひDDTを作りましょう

ざっくりとDDTについてご紹介してみました。DDTの形式は自由ですので、自分にとって一番使いやすいかたちで作れば良いと思います。例えば、現在進行中の研究において「あれ、このデータ項目にはどんな設定をしてあったかな?」と思って調べた、、、なんて経験はありませんか?そんな事がすぐに確認できるようDDTをアップデートしていけばきっと使いやすいDDTになっていくと思います。
作る前は「なんか面倒そうだな」「難しそうだな」なんて思われるかもしれませんが、実際に一緒にDDTを作ってみた研究者やデータマネジャーの方からは「逆にDDT無しでどうやってデータマネジメントをやるの」といった感想も出ています。
ぜひぜひオススメです。一緒に作りましょう!

PAGE TOP