VTuberタレントのファン層を定量評価する挑戦!「VTuber2Vec」開発の舞台裏
みなさん、こんにちは。
Single ID Marketing本部データソリューション部の徳山です。
2025年9月に開催された第116回モバイルコンピューティングと新社会システム研究会(SIG-MBL研究会)にて、我々の研究論文「VTuber2Vec: VTuberタレントの定量的解釈に向けた文書ベクトルの応用」が優秀論文賞を受賞しました。(*1)。
※1)第 116 回モバイルコンピューティングと新社会システム(MBL)・第 87 回ユビキタスコンピューティングシステム(UBI)・第 44 回コンシューマ・デバイス&システム(CDS)・第 33 回高齢社会デザイン(ASD) 合同研究発表会(2025 年 9 月 17 日〜 9 月 18 日にて優秀論文賞(1件のみ採択)を受賞。https://mbl.ipsj.or.jp/excellent/2025/
本研究は、当社Single ID Marketing本部データソリューション部所属の徳山儀亮・吉井健敏らが、統計数理研究所の持橋大地先生にご指導・ご監修をいただき実施したもので、インフルエンサーマーケティングの高度化に向けたVTuberタレントのファン層評価について分析アプローチを考案しました。
今回はその徳山・吉井に、データソリューション部部長の木下が研究の動機や今後の展望についてインタビューしてくれました。
はじめに
木下:
この度は受賞おめでとうございます!ユニークな研究発表だったと思います。改めて、研究概要や動機を教えてもらえますか?
徳山:
ありがとうございます!はい、この研究はVTuber(バーチャルYouTuber)を取り扱い、彼らタレントさんがそれぞれ持つファン層の違いを定量的に明らかにすることを研究目的としています。今回優秀賞をいただいた研究では「VTuber2Vec」というアプローチを定義し、法人事務所に所属される200名超のVTuberタレントさんのファン層を分析しました。
元々は社内の勉強会で吉井がVTuberを題材にした研究発表を行っており、私がそこに相乗りさせてもらいました。
吉井:
社内で私が発表したのは24年の7月くらいでしたね。当時はトイデータとして採用したつもりだったのですが、思いのほか徳山さんに興味を持ってもらい、表彰されるまでたどり着いたことに驚いています。
木下:
なるほど。その定量評価のアプローチの「VTuber2Vec」ですが、これは具体的にどんなものなのでしょうか?
徳山:
VTuber2Vecは端的に言うと、自然言語処理分野で有名なWord2Vecを踏襲したアイディア(*2)で、「文書」と「単語」の関係を用いた分析を応用して「タレント」と「ファン」の関係を捉えよう、というものです!
※2) 以下論文に示されるWord2Vecと本質的に等価な特異値分解(SVD)をVTuber2Vecの作成に採用しています。
Omer Levy and Yoav Goldberg. Neural word embedding as implicit matrix factorization. Advances in neural in- formation processing systems, Vol. 27,2014.
https://proceedings.neurips.cc/paper_files/paper/2014/file/b78666971ceae55a8e87efb7cbfd9ad4-Paper.pdf

研究の苦労話
木下:
研究活動は大変だったと思うのですが、なにか裏話はありますか?
徳山:
私はリサーチャーとして研究活動にコミットすること自体が初めてだったので、研究計画の立て方や論文の書き方などほぼ0から模索しました。この研究でどんな価値を出せるのかを考えぬくのは非常に難しかったですが、私自身がVTuber文化を好きであったこともあり、自分なりのユニークな視点を分析に落とし込めないかなというのを特に意識しました。
例えば、個人的な視聴経験上、ファンの方によるチャットの有無はタレントさん同士のコラボレーションの有無に大きく影響されているだろうことが容易に想像できたため、コラボレーション動画の有り無しでVTuberベクトルを作り分けて結果を比較してみようと思い立ちました。単語Nグラムというモデルで自動的な判別を行うために、実験に使用した数万件の動画データセットから数千件をピックアップし、動画を1件ずつ視聴してコラボレーション有無の判定を行う、というものすごく地味なことを行いました。泥臭いところで分析を積み上げていけたのは誇らしいことかなと感じます。
吉井:
研究のミーティングでびっしり詰まったスプレッドシートファイルを持ってきたタイミングがありましたが、その時の話ですよね(笑)。論文の提出締め切り直前は何かと疲労がたまっていそうでした(笑)。
徳山:
その節はお世話になりました…(笑)! これでひとまずやり切れたといえるのか、頭をフル回転させる日々でした。
VTuberベクトルとインフルエンサーマーケティング
木下:
分析をしてみてなにかマーケティングに活かせそうな知見や発見はありましたか?
徳山:
はい。ハイライトは2点ありまして、まずタレントさんごとのVTuberベクトルの分布形状を確認した際に、ファン分布が所属事務所によって明確に分かれていることが示されました。これはタレントさんが所属する事務所がそのファン層を決定づけていることを意味しており、いわゆる「箱推し」ファンの方の存在も支持するものです。
先程今回の分析が文書と単語の関係の比喩を用いたものだとお話しましたが、面白いのはそこで「所属事務所」という情報は一切使用していないというところですね。あくまでタレントさんとファン層の二部グラフに着目してこの結果だというのがインパクトがあることだと感じています。
広告主さんの目線では、一概にチャンネル登録者などの単一的な指標でタレント事務所さんを選んでしまうと望んだマーケティングができない可能性があり、キャスティングの重要性が示唆されているといえます。
もう一つのハイライトは、今回高次元データの本質的な次元数を評価する内在次元(Intrinsic Dimension)というアプローチを用いたことで、企業所属VTuberタレントのファン層は最大6次元の意味解釈可能な軸で表される、という見解を得られたことです。詳細は論文に譲りますが、これはつまり高次元空間内に獲得したVTuberベクトルを6つの線形的な軸に圧縮することで、「この軸は『タレントさんのゲームプレイスキル / マルチタレント性の軸だな』といったように人間が意味を理解できる形で因数分解できるということです。
この6つの軸の中で分散が大きい軸やその個数が事務所によって明確に異なっていることも確認されたため、事務所ごとにファン獲得戦略上どういった変数が重要なのか、その異なりが定量的に示されたものだと考えられます。

木下:
VTuberのファン層が6つの要素程度で分析可能、というのはマーケティングにおいて非常に強力な示唆となりそうですね。
Single ID Marketingへの応用
木下:
当社D2Cは、ドコモデータを活用したSingle ID Mareketing(※3)によるクライアント支援を行っております。特に今回の研究で行われたクラスタリングやユーザの可視化等、実際のクライアントのマーケット課題の解決においても色々と応用の切り口がありそうですが、お二人の考えを聞かせてください。
※3)Single ID Mareketingとは、ドコモが保有する会員情報を1つのIDに統合し、オンライン・オフラインの行動データを連携することで、データが分断されず、生活者の購買までトレース可能なマーケティング手法です。広告施策、販促、CRM、効果検証までを一貫して最適化します。
徳山:
今回の研究の本質は視聴者対タレントの二部グラフに着目したという点にあるので、この形式に持ち込めてさえしまえば分析アプローチを応用できるというのが強みだと考えています。例えばスマートフォンにおけるバナー広告とそのクリック者、あるいはECサイトにおける商品とその購入ユーザーなどにも分析が適用できる認識です。ドコモIDを起点にこのような分析をサービス横断ですることで、エンドユーザーの方への解像度があがり、Single ID Mareketingの推進が実現できるのではないでしょうか。
吉井:
ドコモデータ(※4)のみの活用に限らず、こうした研究を応用して外部のクライアントへの支援をできる余地もあるのではと考えています。例えば、他企業様の1st Party Dataを連携いただければ、ドコモデータとID単位で結びつけた時の示唆をだしていき、クライアントの把握できていなかった顧客像を可視化し、実際のマーケティング施策への活用みたいなところまでパッケージングできると考えております。
※4)ドコモデータとは、株式会社D2Cが、ドコモから提供を受けている第三者提供に同意されたユーザーデータ(広告識別子・属性情報・位置情報・行動履歴など)。1億超(2025年9月末時点のdポイントクラブ会員)の会員基盤を持ち、属性データ(性別、年齢など)だけでなくキャリアならではの位置情報・購買履歴などの実行動データを保有しています。また、これらのドコモデータを活用した業種別広告商品の取り扱いも行っています。なお、これらのドコモデータには個人が特定されるデータは含まれておりません。
URL:https://www.d2cr.co.jp/dms/analysis
木下:
広告主様の1st Party Dataに対してもドコモデータで色付けしていくことで顧客像の解像度が高められそうですね。先程の内在次元数の話も、タレントをマネジメントする視点に立っていえばこれは各事務所の戦略的な変数の数だともいえますよね。なにか分析提案のような活動にも結びつけられるのではないですか?
徳山:
おっしゃるとおりです!あくまで広告主様への価値還元はメインミッションに据えつつ、吉井の話ともリンクしますがタレントさんを取り巻くステークホルダーへの多様な分析提案にもぜひ結びつけていきたいと考えています。
木下:
研究結果を起点にそのようなことができたらとても価値がありますね。データソリューション部内でも議論していきましょう!
本日は有難うございました!
編集者
徳山 儀亮
編集者
徳山 儀亮
事業会社とコンサルティング会社でのデータ分析経験を経て2023年にD2Cへ入社。広告プロダクトにおける機械学習モデルの開発・運用をするかたわら、趣味が高じたVTuber研究に取り組み、データサイエンスの観点から「推し」文化の探求を行っています。 VTuber以外の趣味はサイクリングです。