Web調査―コラム

「不正な値が入った」と慌てる前に 入力値のコントロールに役立つアイデア3つ

調査研究コンサルティングチームの根岸です。この記事では、Web調査の不正回答を防ぐための入力値コントロールについてお話しします。

Web調査の自由記載欄には、時に、驚くような意外な数値や、対処に困る記載が入ることがあります。中には、不正回答として集計に含められないデータもあるでしょう。せっかく集まったデータを集計対象として含められないことは、惜しい損失です。

幸いなことにWeb調査では、質問紙調査よりも強力に回答内容を制限することができます。今回は、数値データの回答について、入力値を制限する際のポイントについて記載していきます。

【ポイント】

  1. 設問に対してありうる回答を、事前に検討しておく
  2. 回答データの集計方法について、事前にシミュレーションしておく
  3. 対応として、上限値・下限値などを設定しておく / エラーメッセージを表示させる / カテゴリ値の選択肢として択一回答とする などが考えられる

以下に詳細を述べます。

ありうる回答の検討

調査項目「睡眠時間」を例に取って説明していきます。「睡眠時間」は、ある一日に何時間眠ったかを尋ねる設問としましょう。整数値を自由に入力できる回答フォームを使い、単位は「時間」とします。

一日あたりの睡眠時間ですから、入力範囲を「0~24」としてみます。

回答に「24」があった時、どのように対応しましょうか? これを不正回答とみなして、入力値として受け付けたくない場合、入力の上限値を決めることもできます。たとえば、15よりも大きい値は入力できないように設定することができます(「1日15時間も寝ている人はいないだろう」という考えです)。

ただ、入力制限の設定は、データを歪めることにも繋がります。中には、本当に一日中寝て過ごした、という人もいるかもしれません。正しい回答を集めるためにも、入力値の制限には慎重になるべきと考えています。

集計方法のシミュレーション

調査項目の取得方法を検討するにあたり、他に重要な点として、集計方法を事前にシミュレーションしておくことが挙げられます。睡眠時間を分析に用いる際に、数値そのままを連続尺度として用いることもあるでしょうし、カテゴリ値に再集計して順序尺度とすることもあるでしょう。集計の後の分析方針にも関わる部分ですから、調査開始前にしっかり計画を立てておくことが重要です。

もしも集計時に10時間以上はまとめて扱うのならば、回答をカテゴリ値で収集することもできます。「0~3時間」「4~6時間」「7~9時間」「10時間以上」といった具合です。そうすれば、得られた回答をすべて活かすことができます。

具体的な対応方法の例

上記の検討を行ったうえで行う具体的な対応として、3つの方法を挙げます。

①上限値・下限値などを設定しておく

     想定できない回答を入力できないようにするために、上限値や下限値を設定しておく方法です。集計にあたり迷うことのないデータが収集できますが、研究者が事前に想定していなかった事実を収集できなくなるリスクがあります。

②回答にエラーメッセージを表示させる

     想定できない回答に対して注意喚起はするが、入力を妨げはしない方法です。設定範囲外の数値を入力して次のページに進もうとすると、「数値を再度確認してください」などのエラーメッセージが表示されます。ただし、エラーメッセージを無視して次のページに進むこともできます。解釈に困る数値が入力された際にも、それでもこの数値は真実であろうと、より強く推測することができます(もちろん、最終的な判断は研究者側で行わなければなりませんが)。

③カテゴリ値の選択肢として択一回答とする

     数字での入力ではなく、「0~3時間」「4~6時間」「7~9時間」「10時間以上」などの選択肢を作成して、択一選択とする方法です。疑わしい入力値が得られることはありませんが、回答を連続尺度として利用したい場合には適用できません。

よりよい回答データを、より多く集めるために

回答者が迷わず事実を回答することができ、データをできる限り分析に活かしていくことが肝要です。Web調査を実施する前によく検討し、できればプレテストを行って、設問をブラッシュアップしておくことをお勧めします。

弊社では、これまでの調査研究サポート経験を活かして、調査票設計に関してコンサルテーションを行わせていただきます。お気軽にお問い合わせください。