ダークパターンとは？ - 日本人を対象とした研究で見えてきたこと - 後編

「ダークパターン」をご存知だろうか？ダークパターンと欺瞞的デザイン(DP: Dark pattern or deceptive design)は、スマートフォンのアプリやECサイトなどのUI(ユーザーインタフェース)で消費者を騙したり、勘違いさせたりするものだ。このようなデザインは広く展開されており、日本では特別なバリエーションが見られるという。

本稿では、東京科学大学(東京工業大学と東京医科歯科大学の統合で設立) 工学院シーボーン・ケイティー(SEABORN Katie)准教授が行った研究をもとに、昨年に公開した論文『Deceptive, Disruptive, No Big Deal: Japanese People React to Simulated Dark Commercial Patterns』からダークパターン(以下、DP)を紹介する。前編では研究の内容を説明したが、後編となる今回は研究結果を見ていく。

研究内容のおさらい

まずは、簡単に研究の内容をおさらいしよう。研究は2つのテーマを設定し、1つは「DPは平均的な日本人にとってどの程度欺瞞的か？」、もう1つは「平均的な日本人は各形式のDPについてどう感じるか？」。シミュレーション環境の使用中に考えを声に出してもらい、アンケート、半構造化インタビューを行った。

参加者はNHKの協力を得て30人の日本人を募集し、女性14人、男性16人、年齢は18歳～75歳以上。大半の参加者はダークパターンについて把握していない。

参加者には、ECサイトをモデルにダークパターンを組み込んだ架空の電子機器小売業者「CyberStore」の「ホームページを閲覧する」「商品を探す」「チェックアウトしてサインアップする」「会員登録をキャンセルする」の順序でタスクを実行するよう依頼し、DPに関する目的は伏せられた。さらなる詳細については、前編を参考にしていただきたい。

研究結果の内容

研究結果として、以下の2つのDPケースがWebサイトの経路(メニューやボタンの操作は含まないナビゲーション)に影響を与えたことが判明した。

(1)チェックアウト時のトリックワーディングと事前「非」選択のチェックボックスを通じた「CyberSelect」プレミアムメンバーシップへの隠れたサブスクリプション

(2)アカウントキャンセルページの未翻訳(キャンセルが難しい)

(1)では半数が意図せず「CyberStore」にサインアップし、42%が気づき、うち20%が受け入れ、6%が欺瞞と感じ、75%が邪魔と感じました。大半の人(n=27、90%)は(2)を完了できず、35%が気づき、うち72%が欺瞞的、15%が邪魔と感じたが13%は受け入れた。

すべての25のDPケースのうち大半のDPケース(58%)は目立たない(M=17.3, SD=7, MD=19.3, IQR=12)ものとなり、気づかれた場合、47%のケースは「たいしたことない」と見なされ(M=6.4, SD=6, MD=5, IQR=3.5)、29%は欺瞞的(平均値(M)=3.7、標準偏差(SD)=4.9、中央値(MD)=2、四分位範囲(IQR)=2)、24%は邪魔と見なされた(M=2.6、SD=2.9、MD=2、IQR=2)。

最も目立ったのは、ホームページのコールアウト(n=25,83%)、在庫少量のインジケーター(n=24、80%)、商品ページの推薦文(n=23、77%)、アイテムの追加(n=23、77%)となった。最も目立たなかったのは、アルファベットスープを特徴とするCyberStoreメンバーシップ料金と検索ドロップダウンのソーシャルプルーフ(それぞれ3つのみ)だった。

最も目立つカテゴリーは障害(80%)で、最も目立たないのは強制行動(73%)となった。障害は最も欺瞞的(53%)、インタフェース干渉は最も邪魔(68%)、緊急性は最も受け入れられやすい(41%)カテゴリーとなっている。

ダークパターンのサブタイプ(DPクラス)では、アイテムの追加(Sneaking)と推薦文(Social Proof)が最も目立ち(23%)、アルファベットスープ(Linguistic Dead-End)と誤解を招く参考価格(Interface Interference)が最も目立たない(90%)クラスとなった。

アイテムの追加(58%)、キャンセルが難しい(障害、53%)、未翻訳(Linguistic Dead-End、48%)が最も欺瞞的であり、トリック質問(インタフェース干渉)が最も邪魔(53%)でした。在庫少量、高需要(67%)と推薦文(Social Proof、63%)が最も受け入れられやすいクラスだった。

誰もがDPに欺かれやすい

また、参加者とDPの欺かれやすさの指標を計算した。参加者の欺かれやすさは多岐にわたり、Shapiro-Wilk検定では正規分布からの統計的に有意な逸脱は見られず、最高スコアは0.92、最低スコアは0.40(M=0.7、SD=0.1、MD=0.7、IQR=0.1)となった。年齢、性別、教育との統計的に有意な相関はなく、これは誰もがDPに対して欺かれやすい傾向があることを示しているという。

DPクラス(左)とケースの欺瞞性メトリックスコア

DPケースの欺かれやすさは、さまざま(M=0.7、SD=0.2、MD=0.7、IQR=0.3)であり、歪んでいた(－0.6)という。Shapiro-Wilk検定では、正規分布からの統計的に有意な逸脱が示され、最も欺瞞的だったのはアルファベットスープ(混乱を招く、型破りまたは一見ランダムな文字の使用)を伴うCyberStoreの料金(0.96)、ソーシャルプルーフと偽の階層を含む検索ドロップダウン(0.93)、メンバーシップ価格比較チャート(0.92)となった。

最も欺瞞的でなかったのはアイテムの追加(0.25)、商品ページの推薦文(0.26)、および在庫少量のインジケーター(0.28)となり、より高いレベルではDPカテゴリー・クラスの欺かれやすさもさまざま(M=0.6、SD=0.2、MD=0.7、IQR=0.2)なものになった。Shapiro-Wilk検定では、正規分布からの統計的に有意な逸脱が示され、歪んでいた(－0.7)とのこと。

最も欺瞞的なカテゴリーは強制行動(0.76)、インタフェース干渉(0.75)、言語的行き止まり(0.75)、最も欺瞞的でなかったのは障害(0.40)となった。最も欺瞞的なクラスはアルファベットスープ(0.96)、誤解を招く参考価格(0.90)、隠れた情報(0.86)、ConfirmShaming(羞恥心の植え付け、0.86)となり、最も欺瞞的でなかったのはアイテムの追加(0.25)、推薦文(0.26)、トリック質問(0.35)、キャンセルが難しい(0.40)となった。

DPケース

Webサイト体験後に参加者は大きく動揺

SUS(System Usability Scale：使用性尺度)スコアは、ほとんどの参加者がWebサイトを受け入れなかったことを示した(M=35.5、SD=32.5、MD=32.5、IQR=32.5、hi=85、lo=0)。69%(n=20)がWebサイトを受け入れられないと判断し、3人が受け入れ、6人が境界線上のスコアを示したという。

同じ対象から得られた2つのデータセットを比較する「対応のあるt検定」では、前(M=6.9、SD=1.4)と後(M=4.6、SD=2.5)の間に統計的に有意な大きな差があることが示された(t(28) = 5、p < .001)。データが正規分布していなかったため、Wilcoxonの符号付き順位検定でこの結果を確認した。

前(M=7、n=29)と後(MD=5、n=29)でも同様の結果が示され(Z = -3.7、p < .001、r = -0.8)、Webサイトを体験した直後にほとんどの人の感情が大幅に低下した。覚醒度に関する対応のあるt検定の結果も、前(M=2.9、SD=2)と後(M=5.5、SD=2.4)の間に統計的に有意な大きな差があることを示した(t(28) = 5.5、p < .001)。

体験後、ほとんどの人の覚醒度が大幅に上昇し、これらを総合すると体験後に人々がきくに動揺したことが示唆されるとのことだ。

参加者のうちの1人は「情報を求められることが心配でした。今考えると、位置情報のリクエストポップアップが心配でした。何も注意せずに押してしまったからです」と説明している。

特に問題のある未翻訳のDPについて、別の参加者は「アカウントを削除できませんでした。ページが英語で書かれていました」と述べ、また異なる参加者は「英語のテキストの内容が重要かもしれない、または騙されているのではないかと感じました」と説明していた。

さらに別の参加者は「口コミはほとんど良いものでした」と述べ、なぜソーシャルプルーフ(偽のレビューや偽の人々による推薦)が一般的に目立ちやすく、また欺瞞的と見なされなかったのかを理解するのに役立ったという。

アイテムの追加は、欺かれやすさの指標によると最も目立ちやすく、最も欺瞞的でないものだったが、騙されなかった人のうち58%がそれを欺瞞的と見なした。また「その布はクリーナーと一緒に付いてきます。彼らはそれを買わせようとします。説明にはそれが記載されていません」と説明している。

さまざまな側面から考えるダークパターン

ダークパターンと欺瞞的なデザイン(Dark pattern and Deceptive design)は多様なUI(ユーザーインタフェース)現象であり、オンラインショッピングシミュレーションの場合、約3分の2が気づかれなかった(Research Question(RQ)1)。残りについては、目立ちやすさと欺かれやすさが異なり(RQ1)、各パターンに対する人々の反応や感情も異なった(RQ2)という。

誰もアカウントを削除することができず、これは新たに発見された未翻訳のDPが障害の一形態としての力を示しているとのこと。未翻訳は、現地の言語的文脈の知識に結びついており、言語能力の仮定に依存している。

研究では英語の世界的な普及と影響力、および日本の低い英語能力に関する統計に基づいて、シミュレーションで英語を使用した。英語能力が低い他の国々も未翻訳のリスクにさらされる可能性があるが、現状では調査されていない。

一連のDPが、参加者の半数をプレミアムメンバーサービスにサインアップさせたが、気づいた人々はそれを欺瞞的ではなく、邪魔と感じた。これは「自己奉仕的な帰属バイアス」(成功を当人の内面的または個人的要因に帰属させ、失敗を制御不能な状況的要因に帰属させる)を示している可能性があると指摘。

言い換えれば、自己評価を維持するために、参加者は欺かれたことを認めるよりも、DPを「邪魔だ」とラベル付けする傾向が強かった。

人々が自分自身を責めたのか、システムに問題を帰属させたのかは、今後の研究が必要ではあるが、少なくとも参加者は善意を前提としており、これがユーザーの脆弱性を浮き彫りにしているという。

ソーシャルプルーフに対する反応は、潜在的な影響の問題を提起している。メディアに繰り返し触れることで無意識のうちに好みが変わることがあり、ソーシャルプルーフは目立ちやすいものと目立ちにくいものがあるが、ソーシャルメディア時代では重要とのこと。

大半の参加者はこれらのDPを受け入れ可能と見なし、社会的動員効果(小さなプロフィール写真でも「友人」やインフルエンサーを表すと行動に大きな影響を与えること)によって説明できるかもしれないという。

インタビューでも「口コミ」情報の利点が認識されており、日本は集団主義的な市場文化であり、社会的絆が優先され、グループの受け入れが市場価値を決定するとしている。

社会的指標に対する人々の信頼を利用することには注意が必要であると同様に、緊急性のDPも目立ちやすく、受け入れ可能と見なされた。これは、店舗の文脈やこれらのDPへの繰り返しの露出によるものかもしれないとのことだ。

おそらく最も潜在的なDPは、2つのメンバーシップ料金表示に見られるアルファベットスープだったという。このDPは、一握りの参加者にしか気づかれず、欺かれやすさの指標でトップスコアを獲得し、これは重要な発見の1つとなる。

最近、日本の国民生活センターは、これらのDPに注意喚起している。中国と日本の通貨両方に使用される「\」記号の形で現れており、消費者と企業はこれらの記号を混同しないように注意する必要がある。

誤解を招く参考価格は、インタフェース干渉の一形態であり、研究者の指標によると非常に目立ちにくく、欺瞞的だったという。実際、ユーザーフローを示され、DPについて説明されても誰も気づかなかった。これは2つ目に重要な発見だという。

これはショッピングWebサイトで一般的なDPであり、平均的な消費者の注意を逃れる可能性があり、法律が変わっても存続する可能性があるとの見解をしめしている。このDPに注意を喚起し、デザイナー、販売者、および利害関係者と批判的に関わる必要があるとのことだ。

また、こっそりアイテムの追加は最も欺瞞的でなく、簡単に気づかれ、障害も同様となる。これらは、より「鈍い」形態のDPであり、これらのDPを使用した場合と使用しない場合の制御実験は、消費者の視点からこれらの結果にさらなる気づきを提供するかもしれないとのこと。

研究で見えてきたこと

研究者たちは、実際のWebサイトのケースにもとづいたDPを含む、商業的に実現可能なレベルまで開発されたシミュレーションを使用したが、結果の生態学的妥当性を制限することを認識している。

シミュレーションには、日本のGoogle Playストアのアプリで以前に見つかった平均3.9よりもはるかに多くのDPが含まれており、体験の現実感が損なわれた可能性があると同時に、研究結果は大半のDPが気づかれなかったことを確認。

ただ、将来的には現実的なレベルのDPを持つUIを研究する必要があり、特にスマートフォンアプリやビデオゲーム、衣料品店や食料品市場などの他の種類のオンラインストアなど、プラットフォームによってDPのレベルと範囲が異なる可能性があることから、これらも探求する必要があるとのこと。

研究の参加者募集に関連する制限事項も認識しており、公に知られている第三者のリクルーター(NHK)により、多様かつランダムな参加者を募集することができたが、参加者はリクルーターを知っているため、研究に参加する可否を自分で決めた可能性があるという。。

また、比較的小規模なサンプル(N=30)を募集し、対照設定のない実験デザインを採用したため、結果の一般化可能性が制限されたことに加え、日常のインターネット使用量、学位や職業の種類、英語の知識(未翻訳のDPに関して)などの関連指標を制御・取得しなかった点も挙げている。

今回の研究はパイロットであり、研究者たちの研究手順(プロトコル)は公式に事前登録されておらず、パイロットテストに基づいて手順と方法を適応させた。特に、タイミングの問題から思考発話法(Think Aloud Protocol)に関連する手法である「回顧的プロトコル」から「同時プロトコル」に切り替え、観察者チェックリストにオプションを追加した。

同時プロトコルはタスクの最中に行われ、認知的に負担が大きかった可能性がある一方で、回顧的プロトコルはタスクの後に行われるが、参加者は詳細を忘れる可能性がある。

次回は事前登録された研究を実施するほか、研究者たちは個人およびDPに適用できる新しい欺かれやすさの指標を作成した。この重み付けされた測定は、特にDP刺激へのプライミング(事前の影響)と露出を考慮に入れることで、相対的な欺かれやすさを判断するのに役立ったという。

しかし、これらの指標は研究者たちのパフォーマンスの操作化と任意の重み付けに基づいており、デザインとDPの専門家と検証・議論され、必要に応じて修正し、その後は実証的にテストされるべきとのことだ。また、特定のDPに対する感情的反応を測定しておらず、将来的にはターゲットを絞った測定を行うという。

研究者たちは、日本のオンラインストアで一般的に展開されているDPの欺かれやすさとUXをよりよく理解するための第一歩を踏み出したと自負している。

日本の参加者とDPに対する全体的な欺かれやすさの傾向を強調しながら、認識と欺瞞の変動性を示したという。次のステップは、より大規模なサンプルサイズと実際の商業UIを用いた実験的研究を想定している。