海ミハ車両区

宮原太聖(Miha)の雑記帳。おおむね週1回更新でした。当面(記事がある程度貯まるまで)はおおむね月1回の更新です。

文系大学院生が見た「マストドン」-大手3鯖のユーザー数・トゥート数の分析を添えて(アドベントカレンダー)

 この記事は、Mastodon 2 Advent Calendar 2017の、12月15日付記事です。
 昨日は、twoterabytesさんの「(アイ)マストドン向けbotシステム「Usa_bot」誕生秘話(?)」でした*1

 

www.itmedia.co.jp

www.itmedia.co.jp

 

 アドベントカレンダーという企画、今回初めて知ったのですが、とても良い企画ですね。IT系以外にもぜひ広まって欲しいですし、何なら、学会としてこれやっても良いんじゃないですかね。歴史学とか心理学とか経済学とか地理学とか文化人類学とか……。

 

 という訳で、マストドンのアドベントカレンダー2からお越しの皆様、こんにちは。中山ドン管理人の宮原太聖と申します。
 私は、ITのプロパーではないどころか、理系でも工学系でもない、文系(人文科学系)の人間です。本業の研究は、近代日本の交通とか土地所有とか、地方が都市に従属的になっていく過程の分析とか、そういうことをやってます。
 今回、別に技術者じゃなくてもいいとのことでしたので、文系大学院生から見た「マストドン」を、文系でもできるような簡単な分析を添えて投稿いたします。どうぞ、ご笑覧くださいませ。

 もし、「てめぇ、これ、データの使い方おかしいぞ」「事実誤認乙」みたいな点に気付かれましたら、遠慮なくご指摘ください。

 

 ……なお、調子乗って書いていたら、1万字を超える文章量になってしまいました*2。まあ、「CW:長文注意」ってことでひとつ。
 忙しい方は、最後の「まとめ」だけ読んでください。

 

 

目次:

 

私がマストドンをはじめたきっかけ(自己紹介に代えて)

 さて、先に述べたように、私は文系の人間です。が、PCやITに全く無縁という訳ではなくて、2003年にタグ手打ちでサイトを作ってから今まで(放置という名の)維持をしてきました。
 ……あ、今、「その程度で無縁じゃないなんて言うなら、今時、PCやITに無縁な人って居ないだろ」って思ったでしょ? 結構いますよ、パワポすら操作覚束ない文系研究者。私がIT系そこそこ詳しいって顔できる程度には。

 まあそういう事情で、私は、ある種文系には珍しく(?)、RSSリーダーを使っていたり、RSSリーダーにIT系のニュースサイトとかが結構登録されていたりします。で、そんなある日、IT media NEWSさんのマストドンに関する記事が目に入った訳です。

 以前から、ポストTwitter問題、つまり、Twitterが倒産などした場合に代替ものが無いという問題に対して懸念を抱いていました。そのような中、マストドンを知ったのですが、当初は、興味はあるものの中々手が出せないでいました。
 というのも、やはり管理者が個人であるということがネックになっていて、将来的にインスタンスをユーザー情報ごとどこかへ売却してしまうリスクはあるなぁと感じていたからです。登録時に必要な情報はメールアドレスだけでしたから、流出したとしても大して痛くはないのですが、登録後に一体どういう情報が求められるかわかったものではない……と、当時は思っていました。主としてLINEやFacebookのトラウマですね。
 どこか……それこそドワンゴmixi辺りの、既にアカウントを持っている会社が参入してくれないかなぁと考えていた所、PixivがPawooをオープンしたというニュースを、これまたIT media NEWS で見ましたPixivなら既にアカウントを持っていますので、今更登録する情報が増えた所で……という判断。それに、Pawooの鎖国問題がTwitterでも話題になっていたので、そこも気になってましたし。

 

 

 で、結果、「とりあえずアカウントを作るだけ作ってみる」だけに留まらず、気付いたらかつて敬遠していたJPにすらアカウントを作り、今日に至ります。

 

 「価値観」を分析し、ときに掻きまわし、逆転させるというのは、文系の大切な仕事のひとつだと思います。「価値観」という言葉が難しいようであれば、「物差し」と言い換えてもいいでしょう。人間が世界を認識するときに、世界を計るための指標とか概念とかですね。
 ある特定の価値観が支配している状態では、ブレイクスルーは生まれにくく、社会が停滞してしまいます。クリエイティブな仕事のためには、従来過度に価値が置かれていたものに対して、実は実態のない幻想だと指摘したり、逆に、従来価値が認められていなかったものの価値を発見する必要があります。
 ものの見方が変われば、(主観的な)世界も変わります。「異世界転生」するまでもなく、周囲が従来と異なる世界になるわけです*3

 従来のSNSにとって、ユーザー数(アクティブユーザー数)を増やすこと、つまりスケールは正義でした。ユーザーは多ければ多いほどよく、独占できれば独占できただけ良かったのです。しかし、マストドンは違います。後述するように、マストドンインスタンスのユーザー数は多ければ多いほど良いわけではないですし、むしろ、ユーザー数を減らした方が上手く回る(ユーザー数が減ることが、適切に機能している証拠になる)場合すらあります。
 つまりマストドンは、従来型SNSの「価値観」を引っ掻き回し、逆転させている存在で、そういった所に文系院生としての私は強く関心を抱いていますし、期待もしています。

 

私が3大インスタンスのユーザー数・トゥート数をウォッチする理由

 この記事を読まれている諸氏には、最早釈迦に説法でしょうけれど、マストドンは、分散型のSNSです。Twitterなどの既存のSNSは、スケールこそが正義、ユーザー数こそが力……といった感じではあるのですが、マストドンは、特定のインスタンスへユーザーが集中してしまうのは好ましくなく*4、様々なインスタンスに分散しつつマストドン全体としてユーザー数を増やし、スケールしていく必要があります。

 つまり、マストドンインスタンスは、青天井にユーザー数を増やせばいいってもんではなくて、適切なユーザー数というものが存在する訳です。そのユーザー数とは、はたしていかほどなのでしょうか?
 本来は、マストドン全体のユーザー数をインスタンス数で割った数値を適切なユーザー数と言いたい所ですが、マストドン全体のユーザー数もインスタンス数も、常に変わり続ける数値で、インスタンスを評価するための「定規」としてはちょっと使いづらいかと思います。

 そこで、ユーザー視点に立ち、LTLやFTLを最も快適に使える規模をインスタンスの最適規模と仮に決め、この規模はいかほどかについて、ちょっと考えてみたいと思います。
 この最適規模がわかれば、インスタンスのユーザー数が多いか少ないかを議論する上での「物差し」となるだけではなく、インスタンスを立てるとなった時に、どの程度のユーザー数を前提にインフラを構築すればいいか、どの程度の人数になったら一旦新規ユーザー受け付けを止めればいいかなどを判断する上でも有益でしょう。

 具体的には、大手3鯖のユーザー数とトゥート数とが、月単位あるいは週単位でどのように推移していくかを分析にすることで、マストドンインスタンスの最適な規模(ユーザー数ないしトゥート数)を明らかにすることを試みました。
 マストドンインスタンス同士は、自由競争状態にあるので、きっと、「見えざる手」によって、自然と最適な数に落ち着いているハズです。

 資料(史料)は、Pawoo_infoさんのデータを使いました。比較的初期から動いている統計botで、かつ、アクセス容易だからです。

 

 大手3鯖の4月から11月までのトゥート

f:id:t_miyahara:20171201142912p:plain

第1図:大手3鯖の新規ユーザー数と1人あたりトゥート数の推移

 

 第1図は、pawoo.net(Pawoo)、mstdn.jp(JP)、friends.nico(ニコフレ)の3インスタンスの新規ユーザー数と、ユーザーあたりトゥート数の推移を示した図です。この図を見ると、1人あたりのトゥート数は全体として減少傾向にあることがわかります。
 ただ、Pawooとニコフレは、比較的緩やかな減り方をしている一方で、JPは5月をピークに、とくに7月に急激な減少を見せています。この急激な減少は、JPのアクティブユーザーが急減した可能性も考えられるのですが、以降の推移も併せて考えると、ニコフレのようなチャット的な使用法から、PawooのようなホームTL前提の使い方へ移行したのではと思われます(当時、私はJPに垢持ってなかったのでわかりませんが……)。

 新規ユーザー数は、常にPawooがJPやニコフレより多い状況が見受けられます。Pixivは自分のユーザーに対して積極的にPawooアカウントも作らせようとしていますから、その影響もあるかも知れません。
 ただ、後述する8月末から9月頭にかけてのユーザー大量流入の影響は、Pawooでのみ発生しているので、JPやニコフレの知名度を上げていく施策はやはり何か必要なのかも。

 

f:id:t_miyahara:20171201142908p:plain

第2図:2017年4月から11月までの新規ユーザー数とトゥート数の推移

 

 第2図は、月あたりの新規ユーザー数とトゥート数の推移を示した図です。この図のトゥート数を見ると、おおむね、100万~150万トゥートに収束しつつあることがわかります。……というか、Pawooとニコフレは100万~150万トゥートでずっと推移しているのに対して、JPは6月以降、この100万~150万トゥートのラインへ合流している感じでしょうか。Pawooは8月9月にユーザー急増を経験しているのですが、それにも関わらず、150万トゥート程度を維持しているのは、非常に興味深いです。

 今のところ、まだ半年プラスアルファ程度の蓄積しか無く、季節性などの分析も全くできていない状況です。こんな短期間の数値だけで傾向を導き出そうとするのは、非常に誤謬を招きやすく、大変危険ではあるのですが、とはいえ、とても興味深い数値です。
 

なぜ大手3鯖の1ヶ月のトゥート数はほぼ同じ数値となるのか?

 この100万~150万トゥートというラインは、おおむね、日あたり3~5万トゥート、秒あたり0.3~0.5程度。つまり、2秒に1回か3秒に1回ぐらいトゥートが流れてくるような速度です。
 映画字幕なんかだと、1秒につき4文字程度読めるのを前提に字幕が作られるそうなので、2秒だと8文字、3秒だと12文字程度でしょうか。PCブラウザからマストドンを見た場合、(環境によりますが)トゥートの1行がおおむね14字ぐらいだと思います。ちょっと早いぐらい? けど、実際に表示される時間はもっと長いはずなので、まあ、気になるトゥートがあった場合、39文字ぐらいまでのトゥートであれば、LTLでトゥートが流れきる前にある程度読めるかと思います。

 マストドンインスタンス同士の垣根はほぼありません。ユーザーは、気軽にインスタンス間を移動できます。加えて、LTLやFTLが存在することで、ユーザーが集中しすぎると、LTLやFTLが「滝」になることで、「読めねぇよ」と、ユーザーに「不快感」を与えるような構造になっています*5
 この「不快感」は、決して悪いことではなく、むしろ、分散を促すための原動力あるいはトリガーの役割を担っています。大手鯖から派生する形で、「より仲間内で楽しみたい」といった需要を満たすようなインスタンスが作られる現象も、ほぼ同様でしょう。また、軽い潜在的な「不快感」を抱いた時点で気軽に他のインスタンスへ移れることが、顕在的なより強い「不快感」を抑制・予防しているとも言えるかもしれません。
 蛇足ですが、既存の商業SNSは、FacebookにしてもTwitterにしても、人間の「綺麗な部分」を前提とした作りになっているのではと思います。ユーザーは聖人君子であり、軽犯罪すら滅多に起こさず、異性とは清廉潔白で紳士淑女的なお付き合いをする……それ以外の「異端者」は排除して構わない、みたいな。少なくとも、特殊性癖を持つユーザー同士が交流するとか、社会的に認知度が低かったり迫害されかねない趣味を持っているユーザーとか、そういったことは考えて無さげですよね。もっと、人間の悪徳のようなものの存在を認めて、そういったものをむしろコミュニティー全体の利益につなげるような仕組みが必要だと思います。マストドンの「不快感」を用いた分散の仕組みは、人間が誰しも持つ必ずしも道徳的とは言えない側面をマストドン全体の利益に繋げるという点においても、大変興味深いものだと思います。

 そんなこんなで、特定のインスタンスに一定以上のユーザー(より正確には、トゥート)が集中すると、自ずと、他のインスタンスへユーザーが逃げていくような現象が発生しているのだと考えられます。仮にこの現象が意図されたものであるならば、特定のインスタンスにあまりにユーザーが集中しすぎるといったことが起きにくい、とてもよくできた仕組みだと言えるでしょう。


 さて、マストドンインスタンスの最適規模を仮にトゥート数100~150万程度だとしましょう。Twitterユーザーの1日の平均ツイット数は25.7回だそうなので、仮にマストドンでもTwitterのツイット数と同程度トゥートするならば、約1000~2000人程度が実際の、かつ、LTLを快適に使えるアクティブユーザー数であろうと推測されます。
 このアクティブユーザー数の推測ですが、匠さんの調査によると、日あたりのアクティブユーザー数はPawooで約2200人、JPが約1300人、ニコフレは446人とのことなので、ニコフレ以外はだいたい合ってるようです。ニコフレがユーザー数少な目なのは、Twitterよりもより投稿数が多い(チャット的な使い方をしてる)からでしょう。
 なお、Twitterのユーザー数は4500万人だそうなので、Twitterを完全に代替するには、2万2500ケ以上のインスタンスが必要です。その頃には、メールサーバーのようにインスタンスが立てられ、メールアドレスのようにアカウントが作られ使われるようになってるでしょう。逆に言えば、「マストドンTwitterを置き換える」なんてことになると、これぐらいの大事になるはずなので、現時点であれこれ騒ぐだけ無駄というか、本気でTwitterを打ち負かしたいのなら、これぐらいのインスタンス数でもちゃんと支障なく動くように今から設計を工夫しておくとか、そういったことが必要かも。

 尤も、この数値は、色々な仮定のもとで、試しに計算してみただけのものなので、インスタンスの使われ方によって大きく変化することが容易に想像されます。
 たとえば、毎度毎度500字きっかりトゥートするようなインスタンスではより少人数が最適に、空リプをあまり行わず、リプライチェーンでの会話がよく行われる(トゥートの反応がLTLなどに流れない)インスタンスや、ミュートが積極活用されている場合では、より大人数が最適になるかと思います。
 また、時間帯による偏りを考慮していないので、たとえば時差が12時間程度ある国同士(日本と南米とか)のユーザーが集まるなどして、24時間のトゥート数が平準化されている場合などでも、より大人数が使っても、LTLの流速は快適な状態を維持できるかも。

 このアクティブユーザー1000人~2000人を賄うインフラとなると、素人にはなかなか難しそうです。Pleromaだと「接続しているすべてのネットワーク」のTLが最初に表示されるようになっているので、もっと少ない人数で充分快適な(賑やかさが担保される)TLになることが期待できそうです。そういう意味でも、Pleromaは、小規模インスタンスやおひとり様インスタンスに向いてそう。喩えるなら、マストドンはフル規格の鉄道で、PleromaはLRT軽便鉄道みたいな感じでしょうか。
 あるいは、マストドン(あるいは、マストドンのフロントエンド)でも、長文トゥートを許容・推奨するとか、逆に、短文チャット的な用法を推奨するとか、あえて特定の時間帯しかトゥートできないようにするとか、リプまでLTLに流れるようにするとか、とにかくLTLに流れるトゥートの数を増やす、あちこちのインスタンスのユーザーや鯖缶、ブースターズ(ブーストBot)をフォローしてFTLの流速を上げ、かつ、FTLの利用を促進するetc.etc...してもいいかも。

 

Pawooの8月9月におけるユーザー急増

f:id:t_miyahara:20171106185436p:plain
第4図:Pawooにおける第31週(2017年7月31日~8月6日)から第43週(10月23日~29日)までの週あたり新規ユーザー数とトゥート数の推移

 

 さて、Pawooでは、8月末から9月にかけて、急激なユーザー増が発生しました。第4図は、ユーザー急増時にPawooで何が起きていたかを示した図です。この図を見ると、W35(8月28日~9月3日)とW37(9月11日~17日)に突出したユーザー増が起きていることがわかります。タイミング的に、前者がTwitterからの流入、後者はWeiboからの流入ですね。
 とくに、W35には、僅か1週間のうちに5万ユーザー近い流入が発生していました。この時、同時にトゥート数も通常の倍以上に跳ね上がっています。このトゥート数激増は、「はじめまして」トゥートや過去絵連投によるものでしょう。一方で、Weiboからの流入は、Twitterからの流入と比べて約半数程度に留まりました。トゥート数増加も、Weiboからの流入が理由なのかちょっと疑わしい状態。

 流入が一段落した後、トゥート数や新規ユーザー数は、流入以前と比べて微増といった所です。ただ、思ったより、ユーザー大量流入による影響はそこまで長引かないようです。
 中国政府の規制の影響も考えられますが、中国では既に中国のマストドンインスタンスができているようなので、新規ユーザーの流入はそちらへ移ったのかも。

 

集中と分散

 私の本業の研究は、地理学という分野に属しています*6
 地理学は、基本、大地の上で営まれるありとあらゆる物事に関心を見出す分野なのですが、色々なものの空間的な偏り(たとえば、やたらコンビニが潰れる所とやたらコンビニが集まっている所とか、やたらラブホテルが建ってる地域とか)ってものも、伝統的な関心のひとつです。
 分散も同様に、重要な関心事です。たとえば、富山県礪波市では、伝統的に農家があちこちに分散して建てられているのですが、なぜこういう分散が起きたのか、というのは、「砺波散居村論争」というとても大きな議論になりました。

 L・H・クラーセンは、ヨーロッパの都市の人口の変化から、「都市の発展段階論」というのを提唱しました*7。簡単に説明すると、都市というのは、

(1)集まった方が色々と便利なので、とりあえず集まる。都市ができる。
(2)都市に人とか工場とかが集まりすぎて狭苦しくて不便になる。
(3)狭苦しい都市から、広々とした郊外へ分散し始める。
(4)郊外に人が移ってしまったので都市は衰退する。
(5)1に戻る
 という流れで、都市(と郊外)は人口の増減を繰り返しながら発展していく……という考え方です*8

 この考え方をインターネットの世界に適用するなら*9、かつての2ちゃんねるや今のTwitterといったものは都市、個人サイトやマストドンインスタンスは郊外に相当するんじゃないかと。で、現状というのは、上の段階でいくと2の段階に相当します。

 時たま、マストドンTwitterなどを比較して、将来的にマストドンTwitterを代替するんだとか、ちゃんとユーザー奪えていないからマストドンはオワコンだとか、そういう意見を目にします。しかし、マストドンTwitterに完全に取って代わるとするなら、それは上の段階でいくと4に相当するでしょう。将来的にはまず間違いなく分散の方向へ行くにしても、それが起きるまでにはまだ時間があります*10

 そして、この「都市の発展段階論」をマストドン内でのユーザー分散のメカニズムを説明するために応用したのが第5図です。……もはや原型留めてませんが。

 

f:id:t_miyahara:20171110215057p:plain
第5図:ユーザー分散のメカニズム


 ユーザーが流入してくると、LTLの流速が上がります。同時に、LTLが活発化して利便性が向上します。
 しかし、ユーザーが増えすぎ、LTLの流速が物凄く上がってくると、LTLが「滝」になり、利便性が下がります。
 LTLの利便性が下がると、トゥートが不活発化し、あるいは、他のインスタンスへユーザーが流出していきます。
 他のインスタンスへユーザーが流出すると、LTLの流速も落ちます。
 LTLの流速が落ちると、「滝」状態が解消され、LTLの利便性が復旧します。
 LTLの利便性が復旧すると、利便性を求めて他のインスタンスからユーザーが流入してきます。

 現状、まだマストドンが充分に普及していませんから、「他インスタンス」の部分に「他のSNS」と併記しなくてはなりませんが、このサイクルが正しく回れば、マストドンの分散の思想は、達成可能ではないかと考えます。

 

私が一番理想的だなと妄想しているのはTwitterがActivityPubに対応することです。ActivityPubでは全てのデータをActivity Streams 2.0と呼ばれるオープンなフォーマットに則って表現することになっています。一方で、2014年にTwitterに買収されたGnipが提供するTwitterの投稿データフォーマットはどうやらActivity Streamsに則った形式になっているようで、そこらへんどうにかなったら面白いよなーというようなことを考えています。

で、結局Mastodonって何だったの? - 九尾空間

 都市と地方との関係に喩えると、TwitterがActivityPubに対応するというのは、丁度、都心から郊外へ通勤路線が伸びていくのと似ているかも知れません。東急とか阪急とか名鉄とかですね。
 行き来がしやすくなることで、郊外から都心へ人々が通勤するようになったり、都心から郊外の観光地へ行くのが盛んになったりするわけです*11
 マストドンからTwitterの企業垢をフォローするようになったり、Twitterからマストドンの個性的な垢へのフォローが流行るようになったりするかも。想像するだに、楽しそう。

 

まとめ

 長々と書きましたが、総括すると以下の通り。

  • マストドンは、既存SNSの「価値観」を引っ掻き回し、逆転させる存在(文系的興味関心)。
  • インターネットを都市に喩えると、Twitterなどの既存SNS中心市街地で、マストドンは郊外住宅地。ただ、本格的な「郊外化」の時代はもちっと先かもね。まあ、気長にやろうよ。
  • マストドンは自ずとユーザー分散が起きる仕組みを持った凄いSNS。分散のトリガーは「不快感」。
  • アクティブユーザー数にして約1000~2000人程度(=月あたり100万~150万トゥート)が、インスタンスの最適規模か。(Pleromaのフロントエンドだともっと少ない人数でも良さそう)
  • 8月末~9月のPawooのユーザー増は、短期間のうちに急激なユーザー流入・トゥート数増加を見せたものの、影響はそこまで引きずっていない。
  • JP鯖は、6月頃までと7月頃以降とで使われ方が大きく変わった感じ。合ってる?

 

 それでは皆さま、引き続きよいマストドンライフを!

*1:botを使ってインスタンスの参入障壁を下げるというのは、大変良いアイデアだと思います。とくに、LTL前提のインスタンスは、どうしても参入障壁が上がりやすいので、そういった工夫は必須かもしれません。こういったbotの技術や知見の蓄積が求められているのかも。

*2:文系の論文や学会報告って、大概は長くなりがちです。史学系だと、報告時間1時間質疑30分でも「短い!」とか言われたり。数式などの形で圧縮できない議論が多いから、仕方がないね。

*3:そういう意味では、文系とは、社会に対する「転生トラック」の役割を担っているのかも。

*4:同時に、短期的なユーザー増減に一喜一憂する必要も無いと思います。

*5:また、ユーザー数が増えれば増えるほど、自身の価値観と全く合わない人と遭遇する確率が上がるため、そういう点でも「不快感」が増すでしょう。

*6:地理学って、文系の地理学と理系の地理学とがあるんですが、私の場合は、文系の地理学(人文地理学・歴史地理学)です。……とか書いたら、本名特定されそう(^^;)

*7:クラーセンや、「都市の発展段階論」は、地理学(とくに都市地理学)の教科書には、ほぼ必ず登場する人です。土木学(計画系)や都市社会学の教科書にも出てるかも。

*8:大雑把に過ぎるので、詳細は自分で調べてくださいネ。

*9:尤も、この手の理論の安易な流用は、色々と誤謬を招く元になるので、その是非については慎重な議論が必要です。ノーモア・ルイセンコ。ノーモア・ヤロビ農法。

*10:そもそも、マストドンに関する色々な議論って、時空間的にかなり近視眼的・ミクロ的過ぎやしませんかね? 数年・数十年単位で見てもいいと思うんですよ、私。

*11:日本では、大正期から昭和初期にかけて、あちこちで鉄道が作られました。鉄道会社(とくに阪急)は、郊外に住宅地と観光地を積極的に作りました。郊外から都心へ通勤客を運び、都心から郊外へ観光客を運べば、往復共に儲けれるわけですね。結果、この時期、日本全国で観光ブームが起きました。日本全国にある「弘法大師の井戸」みたいなものも、だいたいはこの時期に……うわなにするやめくぁwせdrftgyふじこ