【ファクトチェック白書2024】第5章 FIJのファクトチェック支援システム


記載の情報は基本的に2024年3月時点のものです。
出典のウェブサイトは、特記なき限り2024年6月時点の内容をもとにしています。

はじめに 第1章 第2章 第3章 第4章 第5章 第6章 資料

 

5.1 ClaimMonitorとFact-checking Console

ファクトチェック・イニシアティブ(FIJ)では、メディアのファクトチェック活動を支援する2つの情報共有システム「ClaimMonitor(クレイムモニター)」[342]「FactCheck Console(FCC)」[343]を構築・提供している。前者は正確性に疑義のある言説・情報(疑義言説)を共有するナレッジベース、後者は自然言語処理技術に基づく疑義言説の検出・自動収集システムである。

ClaimMonitorは2018年から運用が開始され、2020年からは改良版のClaimMonitor 2の提供が開始されている。 一般通報で寄せられた疑義言説や、FCCを用いて自動検知された疑義言説が収集され、協力関係にあるファクトチェッカーが閲覧できるようになっている。

FactCheck Console(FCC)は、Twitterの投稿を分析し疑義言説を自動的に検出、誤りの可能性を予測しスコアリングする。自然言語処理を専門とする東北大学大学院の乾研究室(現:自然言語処理研究グループ)[344]と、ニュースアプリ開発・運営会社スマートニュースとの共同開発により、2018年から運用を開始した。

両システムを活用しFIJがメディアに提供するファクトチェック支援システムの全体像は以下のとおりである。


図5-1

①,②:SNS上の「疑義言説」を自動収集システムFCCが収集。一般通報フォームから寄せられた「疑義言説」情報はClaimMonitorに収集される。

③:FIJの活動に参加している市民・学生らのスタッフが、①②の情報および自らSNS上などで収集した中から一定以上の拡散状況などをもとに選んだ「疑義言説」および「端緒情報」(当該言説・情報に疑義があることを指摘・示唆している情報)をClaimMonitorに入力・登録する。

④ :登録された新着情報がファクトチェッカーにSlackで通知され情報共有される。


図5-2  ClaimMonitorトップページ、タグ検索結果、個別情報画面

 


図5-3 FCC画面(X[Twitter]アカウント情報を加工済み)

 


図5-4

 

5.2 ClaimMonitor収集データの概要(2020-2021)

ClaimMonitorへの疑義⾔説登録数は、2020年に2615件、2021年に2304件、2022年に2123件であった[345]。また、2020年〜2022年の間にメディアやファクトチェック組織によって記事化されたファクトチェックの約5割がClaimMonitorを活⽤したものと確認されている。該当する記事はFIJが運営するFactCheck Navi[346]上で確認できる。

▼ClaimMonitorに集まる「疑義⾔説」の種類

ClaimMonitorに集まる疑義⾔説はどのようなものか、実際にClaimMonitorに登録された2019年12⽉〜2021年12⽉[347]の疑義⾔説データを⽤いて検証を⾏った。下図のように⾔説カテゴリを⽤意し、より具体的な話題に着⽬して単⼀のカテゴリに分類した。

なお、選挙期間中や⼤規模災害時など特定のトピックに関して作業時間の増強が図られた機会がある[348]ほか、プロセスの③のとおり登録する⾔説の取捨選択には作業者の判断も加わっている。これらの要素が、カテゴリごとの登録件数に影響を与えている可能性に留意が必要である。


図5-5

疑義⾔説全体の37%ほどを「Covid-19」が占めており、次に「政治(15.3%)」「国際(12.9%)」のカテゴリが続いている。「Covid-19」には、Covid-19ワクチンに関する⾔説や治療薬など、Covid-19に関する⾔説すべてが含まれている。「政治」は⽇本の国内政治に関する⾔説だけに限り、⽇本以外の国の政治ニュースについては、その他の⽇本国外に関する⾔説とともに「国際」にカウントしている。なお選挙に関する⾔説については、国内外とも「選挙」カテゴリにカウントし、⼩カテゴリにそれぞれの地域(国内、北⽶、欧州等)を設定している。各カテゴリが全体に占める割合を以下のグラフで⽰す。


図5-6

 

⾔説カテゴリにさらに細かく分類を加えた⼩カテゴリの件数のグラフを下に⽰す。


図5-7

 

⼩カテゴリ別の⾔説件数と、総計に対する割合を以下に⽰す。なお、太字は⼤カテゴリとその件数・割合を⽰している。

 

表5-1 カテゴリ別の疑義言説件数

言説カテゴリ 言説の件数 総計に対する割合
Covid-19 1852 36.97%
Covid-19 1362 27.19%
ワクチン 490 9.78%
政治 764 15.25%
国政 498 9.94%
地方自治 190 3.79%
外交 76 1.52%
国際 645 12.87%
北米 228 4.55%
国内(在日外国人等) 171 3.41%
アジア・太平洋 130 2.59%
欧州 57 1.14%
中東 48 0.96%
アフリカ 9 0.18%
中南米 2 0.04%
社会 548 10.94%
その他の社会問題、話題 382 7.62%
事件・事故・裁判 166 3.31%
選挙 231 4.61%
北米 161 3.21%
国内 67 1.34%
アジア・太平洋 2 0.04%
欧州 1 0.02%
科学・環境・IT 226 4.51%
テクノロジー・IT 101 2.02%
環境・エネルギー 77 1.54%
科学 48 0.96%
経済 170 3.39%
企業・産業 96 1.92%
金融政策・財政 58 1.16%
労働・雇用 16 0.32%
医療・健康 161 3.21%
文化・芸能 156 3.11%
芸能 81 1.62%
コンテンツ 75 1.50%
スポーツ 143 2.85%
気象・災害 89 1.78%
ワクチン(Covid-19以外) 25 0.50%
総計 5010 100.00%

「Covid-19」の⼤カテゴリには、Covid-19に関連する事柄(ワクチン以外)を扱う「Covid-19」と、Covid-19ワクチンに関する事柄を扱う「ワクチン」の 2 つの⼩カテゴリが存在する。前者の⼩カテゴリの件数は1362件で、⼩カテゴリの中でも⼀番件数が多くなっており、疑義⾔説全体の27%ほどを占める。また、後者のCovid-19ワクチンについての⾔説は490件であり、こちらは全体の10%近くを占めている。

⼤カテゴリの中で2番⽬に多い「政治」に関する⾔説の中では、⼩カテゴリ「国政」に属するものが499件あり、全体の10%近くを占めている。⽇本国外に関する「国際」⾔説の中では「北⽶」地域に関連する⾔説が⼀番多く、⽇本国内に住む外国⼈についての⾔説も130件存在することがわかった。加えて「選挙」に関する⾔説の中では「北⽶」が161件、「国内」のものも66件確認されている。

▼「疑義⾔説」のカテゴリの時系列変化

カテゴリ別に、疑義⾔説件数の時系列推移を確かめる。以下のグラフに、⽉ごとの各⾔説カテゴリの件数の推移を⽰した。なお、カテゴリ間で件数の差が⼤きく、カテゴリ⾃体の数も12個と多いことから、合計件数が500を超える「Covid19」「政治」「国際」「社会」の4カテゴリとそれ以外の8カテゴリとに分けて、それぞれグラフ化している。したがって、2つのグラフの縦軸の最⼤値は異なる。


図5-8

「Covid-19」の⾔説件数は、2020年1⽉から3⽉にかけて増加を続け、初めて緊急事態宣言が発出された2020年4⽉にピークを迎えている。その後も複数回にわたって、⾔説件数が増加と減少を繰り返している。


図5-9

その他のカテゴリのなかでは、「選挙」の⾔説件数が2020年の11⽉に急増している。これは同⽉3⽇に投開票が⾏われた、⽶国⼤統領選挙の時期と重なっている。加えて、2021年の10月にも「選挙」言説の件数が増加している。これは、2021年の10月31日に投開票が行われた、日本の衆議院選挙の時期と一致する。また、2021年の7⽉には「スポーツ」の⾔説件数が急増した。これは東京オリンピックの開催時期(7⽉23⽇〜8⽉8⽇)と重なっている。

▼⾔説の「発信媒体」の種類

次に、ClaimMonitorで収集される疑義⾔説が、最初にどのような媒体から発信されているかを⽰した。⾔説の発信媒体は、「ソーシャルメディア」が76.2%で、全体の約4分の3を占めている。次に「伝統メディア[349](15.6%)」「デジタル・メディア[350](1.9%)」「個人サイト/匿名サイト(1.8%)」が続く。「演説・講演会、ビラ・チラシ」(0.8%)、「企業・団体のウェブサイト」(0.6%)、「公的機関のウェブサイト」(0.5%)、「ポータルサイト」(0.5%)は1%未満となっている。


図5-10[351]

伝統メディアの記事や報道は、事前に事実関係の確認を行う体制が整っており、間違いは相対的に少ないと一般に言われている。評価の基準は異なるが、日本の伝統メディアの偽情報リスクは小さいという調査結果も存在する[352]。にもかかわらず、今回の集計では、ClaimMonitorの疑義言説の発信媒体において「伝統メディア」が15.6%を占めることになった。7件に1件が「伝統メディア」が発信したものであり、「ソーシャルメディア」の疑義言説数の5分の1に相当する。この数字が意味するところについては、次項のファクトチェック・検証済みの言説のデータ分析も踏まえて考察する。

▼ファクトチェックや検証の対象になった疑義⾔説のカテゴリ・発信媒体の割合

5.1で⽰したとおり、ClaimMonitorの疑義⾔説は各ファクトチェック組織などに共有され、ファクトチェックや検証の候補となる。ファクトチェック・検証済みは356件で、疑義言説全体5010件の7.11%となっている。実際にファクトチェックや検証記事の対象になった疑義⾔説をそれぞれカテゴリ別、発信媒体別に集計し、2つの円グラフを作成した。

検証済みの言説全体に占める各カテゴリの割合は、ClaimMonitorに登録された疑義言説全体の傾向(図5-6)と似通っており、「Covid-19」が39.6%でもっとも多く、「政治」が15.4%と続いた。「社会」と「国際」は同数で各11%を占めた。

また、発信媒体別では「ソーシャルメディア」が76.7%、次いで「伝統メディア」が9%だった。検証済み言説中における「伝統メディア」の比率はClaimMonitorに登録された比率(15.6%)(図5-10)よりも低かった(後述)。


図5-11

 


図5-12

さらにカテゴリ別、発信媒体別に疑義言説全体の件数とファクトチェック・検証済み件数を比較する2つの表を以下のように作成した。そのうえで、ファクトチェック・検証の対象となる疑義言説にどのような特徴があるのかを検討した。

その結果、カテゴリ別では、選挙の言説のファクトチェック・検証済み件数の割合がやや高い傾向が見られたが全体に統計的な有意差は見られなかった。しかしながら、発信媒体別においては、統計的に有意な差異が⾒られた。

発信媒体別に見ると、ファクトチェック・検証済みの割合が有意に高かったのは「演説・講演会、ビラ・チラシ」(25%)と「個人サイト/匿名サイト」(14.61%)だった。「公的機関のウェブサイト」も有意差はないものの高い傾向にあった。反対に有意に低かったのは「伝統メディア」で4.08%だった 。

「伝統メディア」の疑義言説は全体の15.6%を占めていたが、ファクトチェック・検証済み件数は全体の9%となった。ファクトチェック・検証された割合(4.08%)は発信媒体別ではもっとも低い数字である。疑義言説が多く登録された要因として、FCCシステムによる自動抽出や人の手によるClaimiMonitorへの登録過程において、伝統メディアの言説が他媒体以上にピックアップされやすいバイアスが存在した可能性も考えられる。そうであれば、他媒体より広い範囲の疑義言説が登録されたため、ファクトチェック・検証済みの言説の割合が低くなったと説明できる。ただし、あくまで仮説であり、今後の検討課題といえる。もっとも、「伝統メディア」発でファクトチェックや検証の対象となった言説・情報は全媒体計356件中の32件であり、依然「ソーシャルメディア」に次ぐ二番目の多さであることも、特筆すべきであろう。

参考データとして、「伝統メディア」発でファクトチェックされた言説・情報の事例の一覧を掲載する。

 

表5-2 カテゴリ別の疑義言説件数とファクトチェック・検証済み件数

言説カテゴリ 疑義言説全体(A) ファクトチェック・検証済み(B) 割合
B÷A×100(%)
Covid-19 1852 141 7.61
政治 764 55 7.2
国際 645 39 6.05
社会 548 39 7.12
選挙 231 25 10.82
科学・環境・IT 226 12 5.31
経済 170 12 7.06
医療・健康 161 8 4.97
文化・芸能 156 7 4.49
スポーツ 143 11 7.69
気象・災害 89 6 6.74
ワクチン(Covid-19以外) 25 1 4

 

表5-3 各発信媒体の疑義言説全体での割合、
ファクトチェック・検証済みの言説での割合

発信媒体 疑義⾔説全体(A) ファクトチェック・検証済み(B) 割合
B÷A×100(%)
ソーシャルメディア 3820 273 7.15
伝統メディア 784 32 4.08
デジタル・メディア 94 6 6.38
個⼈サイト/匿名サイト 89 13 14.61
不明/削除済み 78 9 11.54
演説・講演会、ビラ・チラシ 40 10 25
企業・団体のウェブサイト 32 3 9.38
その他 27 5 18.52
ポータルサイト 23 1 4.35
公的機関のウェブサイト 23 4 17.39

 

表5-4 「伝統メディア」発でファクトチェックされた言説・情報の事例

疑義言説 言説カテゴリ(大) 言説カテゴリ(小) 発信媒体 発信媒体サブカテゴリ ファクトチェックの判定 ファクトチェック記事URL
国連、処理水放出に「深い憂慮」 科学・環境・IT 環境・エネルギー 伝統メディア 共同通信 「不正確」 リンク
(新型コロナワクチン)「日本初の死亡者も…」 Covid-19 ワクチン 伝統メディア 週刊新潮 「根拠不明」 リンク
(コロナワクチン)感染予防効果はなし Covid-19 ワクチン 伝統メディア デイリー新潮 「誤り」 リンク
大江戸線運転士の集団感染、要因の一つは共用洗面所の蛇口 Covid-19 Covid-19 伝統メディア 読売新聞、
共同通信、
NHK、民放各局
「ミスリード」 リンク
大阪市4分割ならコスト218億円増 都構想実現で特別区の収支悪化も 市試算 政治 地方自治 伝統メディア 毎日新聞 「根拠不明」 リンク
「GoToトラベル事務局」大手出向社員に日当4万円 Covid-19 Covid-19 伝統メディア 文春オンライン、
テレビ朝日
「ミスリード」 リンク
日本学術会議の人は6年間働いたら学士院に入って年金250万円貰える 政治 国政 伝統メディア フジテレビ 「誤り」 リンク
WHOは布マスクの使用を「どんな状況でも勧めない」 Covid-19 Covid-19 伝統メディア 朝日新聞 「ミスリード」 リンク
キッチン用エタノールの消毒効果 科学的証明はされていない Covid-19 Covid-19 伝統メディア NHK 「不正確」 リンク
小池知事 東京マラソンの中国人参加自粛を要請 国際 国内(在日外国人等) 伝統メディア 産経新聞 「不正確」 リンク
れいわ新選組 最大3ヶ月のステイホーム期間中、消費税ゼロにと公約 Covid-19 Covid-19 伝統メディア 読売テレビ 「不正確」 リンク
遺伝子を破壊した野菜や魚『ゲノム編集食品』は安全審査なし、発がん物質の発見も 医療・健康 医療・健康 伝統メディア 週刊女性 「誤り」 リンク

 

5.3 FactCheck Navi

FactCheck Navi(ファクトチェック・ナビ)[353]は、ファクトチェック記事やファクトチェックに関連する情報を一覧・検索できるツールとしてFIJが開発・運営するウェブアプリである[354]。2020年8月に一般公開、運用を開始した。不正確な情報の見極めに役立つ情報・知識を社会で容易かつ適時に共有する仕組みの確立を図るものとして開発が進められ、ウェブサイトを単独のアプリのように動作させることを可能とするPWAの技術を採用した。スマートフォン・タブレット向けとして無料で提供されるが、PCのブラウザからも閲覧できる。

主たる利用者として、ファクトチェックに携わってこなかった個人としての記者や一般のネットユーザー等が想定され、情報の受容者にとどまらず、彼らが独自に気づいた情報や疑問をメニューに用意された情報提供フォームで迅速にファクトチェッカー側に提供する役割も期待されている。

FactCheck Naviが提供する主たる情報は、国内のメディアが発表したファクトチェック記事や、偽情報・誤情報問題に関するニュース・論考・研究等へのリンクである。これらの情報をタグ付け等により分類し検索機能を提供することで、誤情報等に関心を持つユーザーに有用なデータベースとして機能する。また国政選挙等の重要なトピックについては関連情報の一覧画面へのショートカットボタンやバナーを配置して誘導する。




図5-13  FactCheck Naviトップページ、カテゴリ別一覧、役に立つリンク集

 

5.4 セミナー・シンポジウム

FIJは「ファクトチェックの認知・信頼向上」のための情報発信事業として、前項のFactCheck Naviの公開のほかにセミナー等を開催している。開催概要や講師についてはFIJウェブサイトに掲載している[355]

表5-5 FIJが開催したイベントの一覧

 

 

 

[342] https://fij.info/activity/support-system/claimmonitor

[343] https://fij.info/activity/support-system/fcc なおFCCはXとのAPI連携の停止に伴い2024年3月現在は稼働を停止している。

[344] https://www.nlp.ecei.tohoku.ac.jp/about-us/members/

[345] https://fij.info/activity/support-system/claimmonitor

[346] https://navi.fij.info/factcheck_navi_tag/cm-advantage/

[347] 使⽤したデータには、2019年12⽉1⽇〜2021年12⽉31⽇に収集された疑義⾔説が含まれている。

[348] 選挙時のプロジェクトの例 https://fij.info/archives/10946

[349] 「伝統メディア」は「既存の新聞社、テレビ局、出版社が制作するウェブメディア」を意味する。

[350] 「デジタル・メディア」は「Digital Native Media」の意味。最初からオンラインでスタートしたメディア。既存メディアと他企業の合同出資でできたニュースメディアを含む。既存メディアが立ち上げたデジタル版は伝統メディアに分類した。

[351] 「不明/削除済み」は集計時にSNSアカウントやウェブサイトが削除されていたものを分類した。

[352] Nagai K, Tomura N, and Segawa S. 2023. “Disinformation Risk Assessment: The Online News Market in Japan,” Global Disinformation Index. https://www.disinformationindex.org/country-studies/2023-02-24-disinformation-risk-assessment-the-online-news-market-in-japan/

[353] https://navi.fij.info/

[354] https://fij.info/archives/7841

[355] https://fij.info/activity/advocacy/events

 

第4章「偽情報・誤情報対策の動向」へ戻る  第6章「ファクトチェックの課題と展望」へ進む