デマ情報の時代に真実を守るには(14:55)
講演内容の日本語対訳テキストです。
自動スクロールはしませんので、映像に合わせてスクロールさせてご覧下さい。
2013年 4月23日 AP通信は次のようなツイートを 投稿しました 「速報 ホワイトハウスで2度の爆発 バラク・オバマ大統領が負傷」 このツイートは5分足らずで 4000回以上リツイートされ その後 バズりました
しかし これはAP通信によって出された 本物のニュースではなく 虚偽のニュース フェイクニュースだったのです これはAP通信のツイッターを乗っ取った シリアのハッカーたちによって 流布されたものでした 社会を混乱させるのが彼らの目的でしたが 混乱は予想を超えました 自動化された市場取引のアルゴリズムが このツイートによる市場心理の変化を 瞬時に察知し アメリカ大統領がこの爆発で負傷― もしくは殺されたという見込みで 取引を始めたからです ツイートが投稿されると 株式市場はすぐに大混乱に陥りました たった1日で 1400億ドルに相当する 株式価値が消し飛びました
アメリカ合衆国特別検察官 ロバート・モラーは ロシアの会社3社と13人のロシア人を 2016年のアメリカ大統領選に干渉して アメリカに対し詐欺を働こうとした罪で 起訴しています 起訴された会社の1つは 「インターネット・リサーチ・ エージェンシー」 ソーシャルメディアに携わる クレムリンの影の機関です 大統領選期間中だけでも インターネット・エージェンシーは フェイスブック上で 1億2600万人のアメリカ人にリーチし 300万もの個人名義のツイートをし 43時間分のYoutubeの動画を 作成しました そのすべてがフェイク つまり― アメリカ大統領選で不和の種を 蒔くために作られたデマ情報でした
オックスフォード大による 近年の研究によると 最近のスウェーデンの選挙では ソーシャルメディアで拡散された 選挙に関する全情報のうち 3分の1が フェイクかデマ情報でした
さらに こうしたソーシャルメディア上の デマ情報活動というのは 「集団虐殺プロパガンダ」と呼ばれてきた ものを拡散させかねません たとえばミャンマーでの ロヒンギャを対象にしたものや インドでのリンチ殺人の 引き金になったものです
私たちはこの言葉が一般的なものになる前から フェイクニュースを研究してきました そして最近 ネットでの フェイクニュースの広がりについて 史上最大規模の長期研究の成果を 発表し それが今年の3月の「サイエンス」誌の 表紙を飾りました 研究対象にしたのは ツイッターが サービスを開始した2006年から 2017年までの間に拡散された 裏の取れている真実のニュースと 虚偽のニュース全部です これらの情報を調べるにあたり 6つの独立した ファクトチェック機関によって 確認されたニュースを扱いました ですからどのニュースが真実で どれが虚偽なのか 分かっていました 調べたのはニュースの拡散の度合いや 拡散するスピード 拡散の深さと広がり どれくらい多くの人が その情報の 流れに巻き込まれたか などです さらに この論文では 真実のニュースと虚偽のニュースの 拡散スピードを比較しました その結果分かったのは
虚偽のニュースは 真実よりも 遠くまで 速く 深く そして大勢の人に広まるということです それも 研究対象にしたどのカテゴリの 情報においてもです その差が桁違いというケースもありました とりわけ 虚偽の政治ニュースは もっともバズりやすいものでした ほかのどの種類のニュースよりも 遠くまで 速く 深く 大勢の人に広まったのです このことを発見したとき 私たちは心配になると同時に 好奇心も覚えました なぜ? なぜ虚偽のニュースは真実よりも ずっと遠くまで 速く 深く 大勢の人に届くのか?
私たちが思いついた第一の仮説は こういうものでした 「虚偽のニュースを広めている人たちは フォロー・フォロワー数が多いとか ツイートの頻度が高いとか ツイッターの認証を受けていて より信頼性が高いとか ツイッターの利用時間が多いとか だろう」 そこでこれらの仮説を 1つずつ検証してみました ところが まったく逆でした 虚偽のニュースを広めている人は フォロー数が少なく フォロワー数も少なく アクティブでもなく 認証を受けていないことが多く ツイッターの利用時間も短かったのです さらに これら全てと 他の多くの要素を 調整すると 虚偽のニュースは 真実よりも 70%も リツイート されやすいことがわかりました
ですから 他の説明を 探す必要がありました それで考えついたのが 「新奇性仮説」と呼んでいるものです 記事を読む人の注目というのは 新奇性へと吸い寄せられることが よく知られています 新奇性とは その環境において 新しいものです 社会学の文献を読んだことがあれば 人は新奇性の高い情報を共有したく なるものだとご存知でしょう そうすることで 内部情報へのアクセスを 持っているように見えますし 新奇性のある情報を広げることで 自分の地位が高まるからです
そこで 流れてくる真実 あるいは 虚偽のツイートの新奇性を測るために 当該のツイートを その人がツイッター上で その前の60日間に見た情報と比較しました でもこれでは不十分でした 内心ではこう考えていたからです 「虚偽のニュースは情報理論的な意味では 真実よりも新奇性があるかもしれないが だからといって より新奇性があると 人々が思うとは限らない」
ですから 虚偽のニュースが どう受け止められるかを理解するために 真実のツイートと虚偽のツイートへの リプライに含まれている 情報と感情を検証してみることにしました その結果― それぞれに異なる種類の感情として ここでは 驚き 嫌悪 恐怖 悲しみ 期待 喜び そして信頼を考えましたが 虚偽のツイートへのリプライには 驚き そして嫌悪が 有意に多く含まれていたことが分かりました そして真実のツイートへのリプライには 期待や喜び そして信頼が 有意に多く含まれていました この驚きの発見は 私たちの新奇性仮説を裏付けるものです 新しくて驚かされるものは 共有したい気持ちが高まるのです
そして同じころ アメリカでは両議会で 議会証言が行われていました デマ情報の拡散で ボットが どんな役割を果たしているかについてでした これについても調べてみました 複数の高性能な ボット検出アルゴリズムを用いて データの中のボットを見つけ 取り出します そして取り出した場合と ボットも含む場合とで 計測結果がどう変化するか 比較しました これで分かったのは そう 確かに ボットはネットの虚偽ニュースの 拡散を加速させていましたが 真実のニュースの拡散もほぼ同じ度合いで 加速させていました つまり ボットの存在では ネットにおける 真実と虚偽の拡散度合いの違いを 説明できなかったのです 私たちがこの説明責任を 放棄することはできません なぜなら私たち人間こそが 虚偽の情報の拡散の責任を負っているからです
さて ここまでお話したことはすべて 大変残念ながら― まだマシなお知らせです
というのも まさにこれから 何もかもが どんどん悪化していくところだからです 事態を悪化させるのは 2つのテクノロジーです 合成メディアの巨大な波が 今押し寄せようとしているのです 人の目にとって 極めてもっともらしい フェイク動画やフェイク音声です 2つのテクノロジーが この巨大な波を推進していくでしょう
1つめは「敵対的生成ネットワーク (GANs)」と呼ばれるもの これは機械学習モデルで 2つのネットワークから成ります 1つは識別ネットワーク ある情報が真実か虚偽かを 決定する役割を持ちます そして生成ネットワーク 合成動画を出力する役割を持ちます 生成ネットワークが 合成動画や音声を出力すると 識別ネットワークがこれが「リアルか フェイクか」を判定しようとします 生成ネットワークの仕事というのは 作り出す動画や音声がリアルだと 識別ネットワークを騙せるまで 合成動画のもっともらしさを 最大化することなのです これは 機械が処理を高速で繰り返し 人間を騙すテクを どんどん 磨こうとするようなものです
これが 2つめのテクノロジーと合体します そのテクノロジーは本質的には AIの民主化ともいうべきものです 誰でも AIや機械学習の基礎知識がなくても 合成メディアを出力するための この手のアルゴリズムを使えるようになる AIの民主化 これがGANsと融合し 合成動画を 作り出すことが果てしなく簡単になるのです
たとえばホワイトハウスは 虚偽の加工動画を公開しました これはホワイトハウスのインターンが記者から マイクを返してもらおうとしたときの動画で 動画から数フレームを取り除き 記者の動きを より攻撃的に 見せようとしたものです 映像作家やスタントを仕事とする人たちは この手の技術について聞かれて こう答えていました 「ええ 映画ではいつも使っていますよ パンチやキックをより激しく 攻撃的に見せるためにね」 でも この加工動画の目的の一部は ジム・アコスタという記者から ホワイトハウスへの入館許可証を はく奪するのを 正当化するためでした CNNは許可証を取り戻すために 政権を提訴しなければなりませんでした
これらは非常に難しい問題ですが その一部にでも取り組み 解決するために 5つの手段があると私は見ています それぞれに可能性がありますが また それぞれに課題もあります 1つめはラベリング こういうものです 食料品店に行って食べ物を買うとします どの商品もラベルがついていますね カロリーはどれくらいか どれくらい脂肪分が含まれているか けれど情報を消費するときは ラベルなんて全然ついていません この情報には何が含まれているか? 情報源は信頼できるか? どこで集められた情報か? こうしたことを 何も知らずに 情報を消費しているのです 情報へのラベリングは見込みのある 手段ですが 課題もあります たとえば 何が真実で何が虚偽か この社会で 誰が決めることになるんでしょう? 政府? フェイスブック? それともファクトチェックをする 独立したコンソーシアム? そしてファクトチェックを チェックするのは誰?
2つめの見込みある手段は インセンティブです 前回のアメリカの大統領選では マケドニアから誤情報が 流れこんできていました 政治的動機をまったく持たず 経済的動機で行われたものです こうした経済的動機が存在するのは 虚偽のニュースが 真実よりも 遠くまで 速く 深く届くゆえに この手の情報で注目と関心を集めれば その分広告収入を得られるからです しかしこうした情報の拡散を 抑えることができれば そもそもデマ情報を生み出そうとする インセンティブを 減らせるかもしれません
3つめに考えられるのは規制です 避けることなく この選択肢を考えるべきです 現在私たちは アメリカ国内で もしフェイスブックなどの企業が規制を 受けたらどうなるかを研究しています 今後検討すべきなのは 政治的な発言の規制や 事実に基づいて 政治的発言だと ラベリングすること 政治的な発言に外国勢力が資金投入して 介入できないようにすることなどですが この手段には危険もつきまといます たとえば マレーシアでは デマ情報を拡散した人に対して 懲役6年を課す法を制定しました 独裁政権下では この手の制度は少数派の意見を 封じ込めるために そして抑圧を拡大し続けるために 使われかねません
4つめの選択肢は透明性です 私たちが知りたいのは フェイスブックの アルゴリズムはどう動いているのか データはアルゴリズムとどう組み合わされて 私たちが目にするものを 出力しているのかということです フェイスブックに情報を開示してもらい 内部の動きがどうなっているのかを 正確に教えてもらうのです そしてソーシャルメディアが 社会へ及ぼす影響について知るには 科学者や研究者といった人々が この手の情報へ アクセスできる必要があります けれど同時に フェイスブックには すべての厳重な保管― 全データの安全な管理が 求められてもいます
つまりフェイスブックなどの ソーシャルメディアプラットフォームは 私が「透明性のパラドックス」と呼ぶものに 直面しているわけです 彼らは 同時に オープンで透明であること そして 安全であることを求められているのです これはごく小さい針に糸を通すような難題です でも やってもらわなければなりません ソーシャルメディアの技術は 素晴らしい未来を約束していますが 同時に危機も内包していますから
最後の5つめは アルゴリズムと機械学習です これはフェイクニュースを探し出して それがどう広まるかを理解し その流れを押しとどめる技術です 人間自身が このテクノロジーに 関わっていく必要があります なぜなら どんな技術的解決策や アプローチの根底にも 根本的な倫理的・哲学的問いが 潜んでいるからです 「真実と虚偽をどう定義するのか」 「それを定義する力を誰に与えるのか」 「いずれの意見が正当なのか」 「どのタイプの発言が許されるべきか」 といった疑問です テクノロジーは答えを出してはくれません 答えを出せるとしたら それは倫理学 そして哲学です
人間の意志決定 協力行動 そして協調行動に関する理論はほぼすべて 真実を判別する能力を 中核に据えています けれどフェイクニュースや フェイク動画 フェイク音声の台頭によって 現実がフェイクに浸食されていき 今や何が現実で何がフェイクか 分からなくなっているのです この事態には 途方もない危機が潜んでいます
デマ情報から真実を守るために 用心しなければなりません そのために必要なのは テクノロジーと規制ですが それ以上に欠けてはならないのは 私たち個人個人の責任と 決意 態度 そして行動なのです
ありがとうございました
(拍手)
フェイクニュースによって選挙結果が左右され、株が暴落し、日常に不和の種がまかれる時代。データサイエンティストのシナン・アラルが、フェイクニュースはなぜ、どのように、こんなにも速く広まるのか、デマ情報に関する最大規模の研究を引用しつつ分かりやすく説明します。そして、真実と虚偽の間のもつれた糸をときほぐすのを手助けしてくれる5つの戦略を示してくれます。