では、これら二手法を組み合わせたらどうなるか。その場合、まずファイヤーホース方式で膨大なデータを手に入れ、その中でエンゲージメント(いいね、閲覧回数、引用回数など)を基にランキングを作り、上位アカウントとトピックとの関連性を精査し(アルゼンチンのサッカーに関するポストを消すなど)、残ったものをリストにする。そのリストに含まれていないが研究者の知見的に重要だと思われるアカウント(ひと月に一回しか投稿しないのでエンゲージメントは低いが注目度は高い現役大臣のアカウントなど)を手作業で追加し、合わせたものを分析対象とすることになる。

 この手法の課題は、分析範囲の定義がぶれているため、なんの調査なのかわからなくなることである。「アルゼンチンの選挙に関心がある人と、関心が別に高くないけれどエンゲージメントが高い人たちを合わせた5000人の間で、今週の注目トピックが何かを調べたところ、一番言及されていたのはメッシ選手でした」という分析結果になりがちなので、経験上一概にはおすすめできない。

発信者はどこにいる?

 ファイヤーホース方式の難点の一つに「スペイン語で選挙と検索するだけではアルゼンチンのみならずスペインやペルーのデータも含んでしまう可能性が高い」と述べた。アルゼンチン政治に限定したデータを取るためには「選挙」という一般名詞よりも「ミレイ」などアルゼンチン選挙関連の固有名詞を入れるのが良いだろう。ただし、それだけではスペイン在住でハビエル・ミレイ氏に興味のあるペルー人の投稿を分析から排除することはできない。

 Facebookの一部例外的な取り組みを除いて、SNSプラットフォームはユーザーが自らタグ付けした以外の位置情報を研究者に共有していないので、タグ付けされていない限り、発信者がアルゼンチンにいるのかスペインにいるのか、はたまた実は日本にいるのかは他のユーザーにも研究者にも判断できない。

 さらに言えば、当地の政治的な状況によって発信者の多くがVPN(仮想プライベートネットワーク)を使用している場合、ますます地理情報は混乱させられる。当然、発信者の人種や国籍などについても、よほど本人がプロフィールで大きく主張していない限り判断できない。この課題は特に、ディアスポラ(母国を離れて異国で暮らす民族集団)が多い国や地域に関するトピックについてSNS分析を行いたいときに必ず議論される。

 しかし、地理的障害のないSNSの世界で、発信者が地理的にどこにいるのかは果たして重要なのだろうか? 相手がどこにいるのかも、本当に存在しているのかもわからないながら情報交換が行われているのがSNSの醍醐味ではないだろうか。SNS分析をするならば、分析の範囲を「ディアスポラ」対「母国住民」と分けるのではなく、「どこにいる何人でも構わないけどxx語でA反対の人」対「どこにいる何人でも構わないけどxx語でA賛成の人」と分ける方が無理なく、SNS社会のリアリティをよく反映しているように思える。

◎新潮社フォーサイトの関連記事
スーダン「最後のアラブの春」の挫折と南スーダン「独裁下の小康」が投げかける問い
金正恩「2024年の施政方針」6つの議題を読み解く
「経済と気候中立」両立へ舵を切った「環境先進国」スウェーデン