こんにちは@shuhei_fujiwaraです。
今回は技術書典のデータの話をしましょう。
かんたん後払いとアンケートのデータ分析
技術書典ではQRコードを読み込んで本を購入し、後でまとめて支払うかんたん後払い」という技術書典独自のシステムがあります。「誰がどの本を買ったか」という情報は現金を手渡ししていたときは知る手段がありませんでしたが、かんたん後払いを導入したことで部分的にデータが得られるようになりました。
かんたん後払いとサークル出展アンケートの結果をもとに、出展者の皆さんがおそらく気になるであろう「どんな本がよく売れるのか?」「サークルチェックした人がどれくらい買いに来るのか」といった頒布傾向の調査結果を紹介します。
精一杯、正確になるように注意して分析しましたが解釈が難しいデータも多く、完全な指標を示しているとはいえません。しかしデータで可能な限り客観的に振りかえることは多くの気付きが得られます。率直な考察もまじえて伝えていければと思います。
多くの人に手にとってもらえるのはどんな本?
当たり前ですが、より多くの人に自身の本を手にとってもらえるかは重要な関心ごとです。技術書を自分で出版するわけですから書きたい内容を思う存分書くことが一番大事ですが、手にとってもらうためという視点では、内容を良くする以外にもできる下準備がたくさんあるのです。
頒布物情報の登録はとても大事
技術書典では事前に頒布物情報を登録できます。
このように頒布物を登録することで、一般来場者は欲しい本であるかという事前のサークル確認ができます。
そして、この情報は次の図のように頒布部数と強い相関があります。
頒布物情報の文字数を「0~99」「100~199」「200~399」「400~」と4つに分類しています。左図は文字数と頒布点数(頒布している品種の数)をグラフ化しています。説明文が短い書籍が多く長くなるにつれて頒布点数が単純減少しています。かわって右図は、文字数と実際の頒布部数をグラフで表しています。説明文をきっちり書いているほど頒布部数が伸びるというわかりやすい結果が得られています。
頒布物情報は画像も登録可能です。文字数とおなじく比例関係にあるか調査しました。
画像に関しては左図では登録画像が1枚(つまり表紙のみ)というケースがもっとも多かったです。しかし右図で頒布傾向をみてみると基本的には登録画像が多い方が頒布部数が伸びています。意外なことにグラフからは画像が4枚以上になると頒布部数の減少を読み取れます。簡潔に内容を伝えるということも大事なのかもしれません。
ここで説明した分析データは因果関係まで明らかにしたものではありません。じつは因果が逆で「頒布物情報を丁寧に書くとたくさん頒布できる」ではなく「たくさん頒布する本を書く人は頒布物情報を丁寧に書く傾向がある」が真実である可能性はあります。
それでも事前に頒布物情報が来場者に正しく伝わることにデメリットはありません。間違いなく伝えたい技術を伝えるという側面ではプラスに働きます。ぜひ頒布物情報は丁寧に書いてみてください。
頒布価格とページ数
技術書典での頒布傾向を考えたとき価格とページ数の関連性は、これまで不明でした。
たくさんの人に読んでもらいたいと思ったときは価格を低く設定した方が良いのでしょうか?またページ数が多いほど頒布部数が伸びるのでしょうか?これも皆さん気になるところかと思います。
はじめに価格の影響度をみてみます。次の図は書籍の価格帯と頒布点数、書籍の価格帯と頒布部数の平均の2つをグラフ化したものです。
左図では「500~999円」のレンジの書籍が飛び抜けて多いとわかります。続く「1000~1499円」と「0~499円」のレンジはかなり僅差です。右図では価格が頒布部数(レンジごとの平均)にどの程度影響があるか確認できます。「0~499円」はおそらく無料配布が相当数含まれており、それ以外のレンジでの頒布部数は500〜1999円と広い範囲でそれほど差は見られません。技術書典に来る人は基本的にお財布の紐が緩くなっているので、このあたりの価格の差はそれほど気にしないのかもしれません。2000円以上になるとさすがに頒布部数に影響があるので、この価格帯で出すなら気合を入れて作る必要がありそうですね。
次の図はページ数と頒布部数の関係についてです。
図ではページ数を「0~29」「30~59」「60~99」「100~149」「150~」の5つに分類してレンジごとの頒布点数を積み上げています。左図のグラフをみるかぎり100ページ以上の書籍は少なくなるようです。技術書典では100ページ未満の薄い本がメインということですね。右図のグラフからはページ数と頒布部数の目立った傾向が読み取れません。ページ数はほとんど関係がなさそうです。
サークル配置と頒布
サークル配置は頒布部数に影響を与えるのでしょうか?場所に差があるのかもみてみました。
こちらのグラフは「あ」~「こ」および「ス」での頒布部数の平均(頒布点数の差が影響しないよう1サークル単位で正規化を実施しています)を表示しています。混雑対応が行われた「あ」「S(ス、企業協賛ブース)」は突出していますが、それ以外はそれほど差はありませんでした。
気になってジャンルなどでもデータを確認してみましたが(こちらはニッチなジャンルほど頒布部数が伸びる傾向にありました)特別影響があった様子は見つけられませんでした。これは自動配置による配置最適化の成果もあるかもしれませんが、技術書典では多種多様なサークルが受け入れられているといって良さそうです。
サークルチェックの裏では何が起こっているのか
開催が近づくと、サークルチェック数を見ながら何部用意するべきか頭を抱えるという共通の課題が技術書典にあります。
サークルチェックで登録した人のうち、実際にどれくらいの割合の一般参加者がブースへ足を運んで「これください!」といってくれるのか、気になるところです。
印刷部数の決定は毎回のこととはいえ深刻な問題ですね。
先に結論を書いてしまいましょう。サークル参加アンケートの結果と合わせて分析することで(多少乱暴な数値になりますがわかりやすさを優先して書くと)次の傾向を確認しています。サークルの頒布部数について平均的には…
- 最終的なサークルチェック数に対して係数1.0~1.2をかけると平均的な頒布部数となる(ただしブレが激しい)
- 頒布部数のうち約3割がサークルチェックしてくれた人である
- のこりの7割は偶然手にとってくれた人である可能性が高い
正直なところ解釈が難しい結果となりました。最終的なサークルチェック数は当日に確定するため印刷部数の判断にはあまり意味をなさない指標ですし、偶然見つけるという運の要素に総数の7割が引っ張られるためサークルチェック数と実際の頒布部数はかなりブレやすいです。どちらにせよ注意が必要という身も蓋もない結論だからです。
この結論にたどり着くまでをダイジェストで紹介します。次の図をみるとサークルチェックと頒布部数には明らかな相関があることがわかります。
左図は「サークルチェックの数ごとの頒布点数」のグラフ、右図は頒布部数(各レンジの平均)を積み上げたものですが、確かにサークルチェックと頒布部数は比例しているようです。
このようなカウントデータは平均が大きくなると分散も大きくなるため多めの部数を予定している人は、ブレに注意しておくといいでしょう。
この段階で私の中にはさらなる疑問が生まれました。「サークルチェックは前日の夜にかけて急激に伸びることを考えると、そもそもチェックした人がちゃんと買いに来ているのか?」という点です。
サークルチェックはどれくらい頒布に繋がるのか
頒布状況については現金に関するデータは得られていないことは前述のとおりです。運営事務局では、かんたん後払いのデータしか分析できないため、次の2つにケースを絞って調査する必要がありました。
- 一般参加者がかんたん後払い利用者である(少なくとも1回は利用している)
- 出展者のサークルでかんたん後払いに対応している
この2つが前提条件です。これらに絞ってサークルチェックの利用動向を調べたところ(涙がでるぐらい大変な試行錯誤があったのですが割愛して結果だけお伝えしています)「全ユーザーのサークルチェック総数のうち約3割が頒布に繋がっている」という結果を得ました。これは、前提条件としたかんたん後払いのデータとサークル参加アンケート結果の統計情報から導出した結果です。サークルチェックしてくれたひとの約3割が頒布に繋がっていると予想されます。
サークルチェックせずに買う人がどれくらいいるのか
先ほどは「サークルチェックの3割が頒布に繋がる」という結果でしたが、サークルチェック数の3割の部数を持ち込めば足りるわけではありません。
実際には75000部が頒布されており、こちらの統計値をベースとした場合、次の内訳であると推測できました。
サークルチェックをせずに購入する人がかなりの数(おおよそ7割)存在していることがわかります。サークルチェックは、その本がどうしても欲しいひと、探している人へ届ける良い方法ですが、今現在は偶然の出会いを生み出していません。会場という場所を共有することで化学反応がおきて数多くの頒布へつながっているのです。
一方で機会損失については次のように考えることもできます。サークル参加アンケート結果では全体の51%の品種で完売を示唆しています。欲しくても手に入らなかったケースを考慮すると、在庫が十分であれば頒布部数が伸びる可能性があります。
結局どれくらいの部数を持ち込めば良いの?
サークルチェック数を参考に持ち込み部数を決めるときは、次のような平均像を念頭に置いてください。
- サークルごとの平均でもチェック数よりちょっと多いくらいの頒布部数が見込める
- 技術書典5全体では、サークルチェック総数56000に対して頒布部数の総数は75000冊
- サークルチェックだけに基づいた頒布部数予測はブレやすい
- サークルチェック機能を使わずに来場し、書籍を手に取る人の割合はかなり大きい
身も蓋もない結論ですが実際の頒布部数は、かなりブレやすいのでどの程度のブレを許容できるかが肝要です。サークルチェック数だけではなくて色んな指標を使ってください。
とくに自分が納得感をもって当日を迎えられるかは大事な要素です。部数決めは自分との戦いでもあります。
おわりに
- 頒布物情報はとても大切なので丁寧に書いてみてください。全然違いますよ
- 価格設定やページ数については、それほど細かいことを気にしなくても大丈夫です
- 当日はサークルチェックしていなくても思いがけず購入する人がかなりいます。周りに迷惑にならないよう全力で楽しみましょう
- かんたん後払いを使うと貴重なデータが蓄積されて技術書典も改善されていくので、どんどん使ってください!