売上予測モデル構築のイロハ(AIモデルの罠)

「売上予測モデル」は店舗開発を高度化する上での昔ながらの有望な武器だが、そこには多くの罠がある。

  • 店舗ビジネスを担う企業にとって、新規出店は成長の源泉であると同時に、最大級のリスクをはらむ。それ故、「売上予測モデル」の必要性は、長年にわたって認識されてきた。
  • 2024年現在、AI、ディープラーニング、大規模言語モデルなどの普及を背景に、数理モデルのビジネス活用が脚光を浴びている。しかし、店舗売上予測へのAI活用には、いくつかの罠が存在する。
  • AI全盛期の今においても、エスノグラフィカルな取り組みを通じ、「商圏の質」を定量的に明らかにする試みが、実は売上予測モデル構築においても重要である。
  • コロナ禍、少子高齢化、ECの利便性向上等により、日本の店舗ビジネスは変革圧力を受けているが、変革の第一歩を踏み出すにあたっても、「売上予測モデル構築」は汎用的な検討手法になり得る。
  • 売上予測モデルの構築は、(1)自社の顧客/自社の提供価値の再認識、(2)経営にデータを活用する癖付け、(3)店舗ビジネス変革(新たな取り組み)のイネーブラーになり得る。

はじめに

店舗ビジネスにとって、出店判断は極めて重要なトピックである。出店には多大な投資が必要で、その新店が不振店(赤字店)になれば、そこにPL上の赤字まで乗ってくる。さらに、不振店であったとしても、契約期間中はなかなか撤退することも難しい。そこで、店舗ビジネス、特に新規出店の文脈では、「売上予測モデル」を活用したビジネス判断へのニーズが大きかった。

2024年1月現在、AI、ディープラーニング、大規模言語モデルなどの新しい技術が脚光を浴びている。これらの新しい技術を活用した売上予測モデルへも、強い期待が集まっている。しかし筆者の知る限り、このような機械学習をベースとした売上予測モデルは、その期待値に対して思ったような成果を挙げられていない。

機械学習の思想を大変乱暴に言ってしまえば、「数百万~数億レコード等、多くのデータを読み込むことで高い精度を実現する」方針である。しかし、1ブランドが展開する店舗は、最大でも高々数千店舗であろう。店舗売上予測は、機械学習が得意とするフィールドではないのである。

本レポートにおいては、あるべき売上予測モデルの構築手法、よくある落とし穴、売上予測モデルの応用的な活用方法について触れたい。

 

売上予測モデルとは何か

売上予測モデルは、ある物件の特徴を表すデータ(周辺人口、競合、広さなど)を入力すると、そこに出店した時の期待売上を返す、数式である。この数式をくみ上げるにあたり、どのような変数に着目するかの判断が重要である。当社では売上予測モデルの構築に30年の経験値を有しているが、売上は10の要素で説明できる、と考えている。(商圏系:①マーケット規模、②商圏の質、③ポイント規模、④自社競合、⑤他社競合、立地系:⑥顧客誘導施設、⑦認知性、⑧導線、⑨建物構造、⑩アプローチ)。

逆に言えば、店舗売上を10の要素で回帰分析することで、売上予測式を構築することが出来る。売上予測式は、「その店舗は何故売れる/売れないのか」を明らかにし、そのビジネスの商圏/立地的な勝ちパターンを明らかにする。

 

売上予測モデルの肝(「商圏の質」の重要性)

過去においては、量的指標(マーケット規模等)、及び立地系指標が売上に大きな影響を与えることが多かった。即ち、「店前通行量がどの程度か」が売上に大きな影響を与えていた。しかし近年においては、質的指標(商圏の質等)が売上に大きな影響を与える事業者が増えてきている。(例えば、コンビニの売上は店前通行量が大きな影響を与える。一方で美容脱毛の売上多寡は、店前通行量ではなく、その街の審美意識の高さ、などが効いてくる)

これは、リアル店舗の主流なビジネスモデルが変化しているためと解釈できる。店舗を通じて提供するものが「モノ」から「コト・トキ」へ変化する、と言われて久しい。各店舗が、例えば誰しもが購入する汎用品をモノ売りするだけであれば「店前通行量がどの程度か」に着目すればよい。しかし、各社が店舗を通じて「コト・トキ」を提供する場合、「そこにどの様な消費者がいるか」が重要になる。「コト・トキ」に汎用品はないからである。

そこで「そこにどのような消費者がいるか」を知ること、すなわち商圏の質に着目する必要が出てくる。商圏の質は「ペルソナ」と「モード」から評価することが有効である。「ペルソナ」は、各種統計データから、年齢、性別、所得、家族構成などの属性別の人口データを取得することが出来る。近年は携帯電話ベンダーが人流データを公開しており、益々その定量把握が容易になっている。

「モード」は、そういった消費者が、ある場所にどの様な気分(モード)で訪れているかを評価する概念である。ある特定の消費者が、スーパー、オフィス、百貨店、ショッピングセンター、観光地など色々な場所に訪れるが、当然その時々でモードが異なり、求める体験も異なる。当社は、商業施設においてはテナントミックス、ある地域においては店舗ミックスを分析することで、このモードを評価できると考えている。

 

AI進化の落とし穴

売上予測モデルには、大きく分けて統計モデルと機械学習モデルの2種類が存在する。一般に、統計分析は少数データでの分析に強く、説明可能性に重きが置かれる。機械学習は大量データでの分析に力を発揮し、精度に重きが置かれる。

前述の通り、近年のコンピューティングパワーの増大、アルゴリズムの洗練化、機械学習の台頭により、機械学習モデルが勃興している。しかし、分析サンプル数がたかだか数百~数千しかない店舗ビジネスの売上予測と、これらテクノロジーの進化は本来相性が悪い。

加えて「売上要因」が量指標から質指標に変化していることも、機械学習アプローチには不利に働く。機械学習アプローチでは大量のデータが必要になる。大量の説明変数データを「作る」のは現実的ではなく、「世の中のオープンデータ」「その会社内に存在するデータ」を大量にインプットすることになる。しかし、質指標(ある街の審美意識の高さなど)は、オープンデータでは表現しにくいのである。質指標は「作る」必要がある。

この様な中で、「AI×売上予測モデル」に、やや過剰な期待が寄せられていると感じる。
もちろん、AIによる予測が適切なケースは多く存在する。また「質指標」の重要性を意識した機械学習モデル活用であれば「良いところ取り」も可能だろう。さらに、AI、機械学習の進化スピードには目を見張るものがあり、このような欠点が克服されるかもしれない。
店舗売上予測への盲目的なAI活用には、罠があるのである。

予測モデル構築の具体手法

以前のレポートで、店舗開発を練り上げるための検討手法として、4S分析を提案している(1. Demand & Supply Study、2. Sales Simulation、3. Site Selection、4.Spatial Profiling)。

売上予測モデル構築にあたっては、10の売上要因を活用した網羅性は持ちつつ、主たる売上要因(近年では商圏の質)を捉えることが重要である。そのためには、(a)エスノグラフィ、(b)データクラフト、(c)データサイエンスが重要になる。

エスノグラフィ

エスノグラフィとは、元来は文化人類学や社会学の用語で、集団や社会の行動様式をフィールドワークにより調査、記録する手法を意味する。売上予測モデルの文脈でいえば、自社店舗の実査を通じ、自社顧客/利用シーン/当社の提供価値を読解くこと、を意味する。

繰り返しになるが、店舗を通じて提供するものが「モノ」から「コト・トキ」へ変化する中で、当社は「どのような顧客に、どのようなシーンで、どのような価値を提供するのか」、デザインする重要性が増している。事業開始時にはこれをデザインするはずだが、ある程度店舗展開した後は、実際にどのように店舗が利用されているのか、把握する必要がある。これを明らかにすることで、「どの様な顧客/どの様な周辺環境であれば、当社が求められ易いのか」が明らかになり、売上予測モデルのキーコンセプトが固まる。

例えば当社が、大盛り提供/提供時間の短さが売りのパスタ店舗を提供していたとする。当初は大学生などを主な顧客と想定していたが、実際の店舗利用者は、20-30代男性の社会人で、「短時間でがっつり食べたい」需要を満たしていたとする。この場合、例えば20-30代男性従業員が多く、一方で丼もの/麺類などの「短時間でがっつり」系の店舗が少ない場所であれば、当社が求められ易い、という推察が可能だろう。

データクラフト

売上予測モデルのキーコンセプト、当社が有利に戦える環境が固まれば、次はこれを「定量的に表現する」必要がある。売上予測モデルのキーコンセプトを表現するデータを作ることを、ここではデータクラフトと呼ぶ。前述の通り、得てして簡単に手に入るオープンデータ、自社データ単体では、こういった概念を表すことは難しい。そのまま使用するのではなく、主たる売上要因を表現する指標を作り込むことが重要である。

前述の例を踏まえれば、特定の産業に絞り、20-30代男性従業員数を取得、一部推計することが有効だろう。また、競合となる業態セットを定義し、競合店舗数をカウントすることも必要になる。これらは必ずしもオープンデータから簡単に取得できるわけではない。しかし、この工程は致命的に重要である。

データサイエンス

当然ながら、売上予測モデルのキーコンセプトを定量表現したものと、既存店のパフォーマンスが、相関していなければ意味がない。ここで、統計分析寄りの「データサイエンス」が重要になる。単回帰分析、重回帰分析、あるいはより高度な統計分析を用いて、売上予測精度を高めていく。

機械学習と異なり、統計分析は「説明可能性」も重視する。理想的な売上予測モデルは、(a)店舗実査を踏まえて得られた「自社顧客/利用シーン/当社の提供価値」を踏まえ、(b)当社が有利に戦える事業環境が定量的に表現されており、(c)これが既存店舗売上とも高い精度で相関している、モデルである。このようなモデルになっていれば、加えて補助的な変数をいくつか加えることで、説明可能性と精度を高いレベルで両立するモデルになるはずである。

 

店舗ビジネスの未来

2020年に猛威を奮ったコロナ禍の影響で、例えば、主要駅における人流は2020年から2021年にかけ▲20%程度減少した。様々な業態に影響が及んだが、店舗ビジネスは中でも最大の影響を被った業態だった。2050年までに、日本の総人口はピークであった1.28億人から▲20%減少し、1.0億人を下回ると予測されている。ということは、日本においては今後30年で「あのコロナ禍」における人流が常態化する。

店舗ビジネスを営む事業者は、強い逆風および変革圧力を受けている。その様な中で、店舗事業者は新たな取り組みを模索している。1つはリアル店舗での購入をEC購入近付ける様な取組みで、省人化/無人化/購入行動の省力化を志向している(Amazon Go等)。ほかにも、リアル店舗を「購入の場」から「体験の場」に変革する取組みも見られる。これらの店舗は、従前よりもさらに「コト消費」「トキ消費」を志向している(beta8等)。

しかし、Amazon Goやbeta8等、最先端テクノロジーを活用した小売企業ですら、「大成功」を納めているわけではない。「30年後」を見据えた時に、店舗ビジネスは大変革の必要性があることは論を待たないが、その基本的な方向性は、まだ見つけられていない様に見受けられる。

 

売上予測モデル構築の応用

こういった状況下、私は売上予測モデルの構築こそが、店舗ビジネスを営む企業が抱える諸課題を解きほぐし、進化の方向性を見定める、汎用的な切り口になり得ると考えている。

1つ目の理由として、多くの企業にとって重要な、直接的な売上/利益の最大化に繋がるからである。
売上予測モデルは、何故その店舗はよく売れるのか(売れないのか)を、地理データ(GISデータ)を用いて明らかにすることが出来る。「どこに出店すべきか」「どこは退店やむ無しか」「どの店舗はどの程度改善可能か」等の問いに答えることが出来る。これにより、まず自社の筋肉質化を実現することが出来る。

2つ目の理由として、多くの経営テーマに関わる検証仮説が得られるからである。
売上予測モデルの肝は、自社の顧客は誰で、どの様な利用シーンで自社店舗を利用しているのかの洞察である。同分析で得られた知見は、出退店や店舗改善のみならず、マーケティング、事業ポートフォリオ管理、新規事業創出など、幅広い経営課題に活かすことが出来る。すなわち、幅広い領域で検証仮説を立てることが出来るようになる。

3つ目の理由として、幅広い事業ステージにおいて、活用することが出来るからである。「エスノグラフィ」「データクラフト」「データサイエンス」を基軸とする統計分析型の売上予測モデル構築は、店舗数が比較的少ないうちにも、取組むことが出来る。ビッグデータのビジネス活用が唱えられて久しいが、大企業/中小企業では、自社内で活用可能なデータ量に大きな差が存在する。しかし、世の中にオープンなGISデータは多く存在し、これにアクセスすることで、小規模事業者であってもビッグデータの恩恵を受けることが出来る。

 

終わりに

「売上予測モデル」は、店舗ビジネスを営む事業者にとって、近視眼的に有望物件を選別する上でも、長期的に店舗ビジネスの未来を描く上でも、重要な武器になる。

しかし売上予測モデル構築には「罠」がある。

  • マス層を狙う「モノ消費」ビジネスから、特定ターゲット層を狙う「コト・トキ消費」ビジネスへの移行が進み、
  • 必然、主たる売上要因は量指標から質指標に変化しているにも関わらず、
  • AIブームにより量指標への依存が大きい、機械学習モデルの魅力が(一見)増している
  • 機械学習の強み/弱みを意識しないまま、盲目的にこれに飛びつくのは危ない

そうではなく、売上予測モデル構築にあたっては、

  • [エスノグラフィ]自社顧客/利用シーン/当社の提供価値を読解き、主たる売上要因を定義し、
  • [データクラフト]オープンデータ、自社データをそのまま使用するのではなく、主たる売上要因を表現する指標を作り込み、
  • [データサイエンス]既存店のパフォーマンスとこの指標が有意に相関するのか、慎重に検証すること

を、強くお勧めしたい。

統計分析も機械学習も、あくまで分析手法の1つである。売上予測モデル構築のイロハは、自社ビジネスの深い理解から始まるのである。

植井 陽大

プリンシパル

東京大学卒業後、野村総合研究所にて、介護、食品、医薬品業界等に対するコンサルティングを提供。海外展開支援、官公庁受託調査に従事。 その後、GCA(現Houlihan Lokey)にて、成長戦略立案、海外展開支援、ビジネスDDなどのサービスを提供。 これらの知見を活かし、2020年に当社に入社、PEファンド向けDD、出資後のVUP、及び当社新規事業の推進に従事。

Disclaimer

本レポートは一般的なガイダンスを目的として作成されています。
本レポートに記載された内容は、最新の情報を基に作成されていますが、その正確性や完全性を保証するものではありません。また、本レポートに記載された情報は、特定の投資、法律、税務、会計、またはその他の専門的なアドバイスとして解釈されるべきではありません。当社または第三者のコンテンツ提供者は、間接的、偶発的、結果的、懲罰的損害、利益の損失に対して、その可能性について通知されていたかどうかに関わらず、いかなる責任も負いません。
© 2024. D.I.Consultants. All rights reserved.

この記事に関する
お問い合わせやご質問、
その他ご相談は
こちらまでご連絡ください。