2020.06.05 「Einstein AI で Salesforce は進化する:(4) Einstein Discovery は御社の専任データサイエンティストです(前編)」
≪ 2020.05.22 「Einstein AI で Salesforce は進化する:(3) Einstein 予測ビルダーを通じて Einstein AI に触れてみましょう(後編)」
2020.06.12 「Einstein AI で Salesforce は進化する:(5) Einstein Discovery は御社の専任データサイエンティストです(後編)」 ≫
お世話になっております。
ウフル カスタマーサポート Salesforce 担当の 後藤 でございます。
皆様いかがお過ごしでしょうか。
大都市圏の緊急事態宣言が解除されて1週間が経過し、私も原則オフィス出勤となりました。
朝の通勤電車も通常時の7割くらいの乗車率まで戻ってきましたが、各所で第二波とみられる感染報告も聞かれます、まだ油断はできませんので、弊社も含めて、カバーできる部分は極力テレワークにて引き続き対応をしていければと存じます。
さて、お送りいたしております Salesforce Einstein のシリーズも第4回となりました。
前回と前々回は「Einstein の入り口」として「Einstein 予測ビルダー」についてご案内をいたしましたが、「AI による予測」を Salesforce 上で簡単に体験いただくには最適な機能だったと思われます。
今週と来週は、より高次な Einstein 予測機能として「Einstein Discovery」について、実際の設定と使用例と併せてご案内させていただきます。
前提知識として Einstein 予測ビルダーについてご理解いただくことが重要となりますので、未見の方は、先週までの記事に目を通したうえで今週と来週の記事をご覧いただければ幸いでございます。
2020.05.22 「Einstein AI で Salesforce は進化する:(2) Einstein 予測ビルダーを通じて Einstein AI に触れてみましょう(前編)」
https://csminfo.uhuru.jp/hc/ja/articles/900001001363
2020.05.29 「Einstein AI で Salesforce は進化する:(3) Einstein 予測ビルダーを通じて Einstein AI に触れてみましょう(後編)」
https://csminfo.uhuru.jp/hc/ja/articles/900001089163
* Einstein Discovery - データに埋もれていた「発見」を提供する
Einstein Discovery とは、いったいどのようなものでしょうか。
いつものように公式ヘルプから引用いたします。
Einstein Discovery での説明、予測、おすすめ
https://help.salesforce.com/articleView?id=bi_edd.htm&type=0
============================================================
Einstein Discovery は、精巧なソフトウェアと統計モデルを構築することなく、データ内の関連する事実とテーマを明らかにします。先入観のない説明、予測、おすすめが生成されます。
============================================================
「データ内の関連する事実とテーマを明らかにする」のが、Einstein Discovery の最大の目的のようです。
まさしく「Discovery = 発見」の名の如し、ですね。
先週まで取り上げた Einstein 予測ビルダーの記事の最後に、「予測モデルが提供するのは、あくまでもレコードごとの予測値のみで、予測ファクターの相関関係、およびそれから導き出されるシナリオやストーリーは、ユーザが結果から読み取る必要がある」と記させていただきました。
それに対し、Einstein Discovery は、予測ビルダーではユーザ自身で読み解く必要があった「事実とテーマ」の提供を受けられる、ということになります。
Einstein Discovery は Einstein Analytics という体系に含まれるひとつの機能となり、Einstein Analytics ライセンスが必要となります。
Einstein 予測ビルダーは全ての Salesforce 組織に「予測モデル設定 10 個まで、うち一つだけ有効化可能」な試用ライセンスが提供されていますが、Einstein Discovery にはそのようなライセンスは提供されていないため、ライセンス購入前の評価は、専用の開発者組織で行うことになります。
各種エディションと料金 - Einstein Analytics
https://www.salesforce.com/jp/editions-pricing/einstein-analytics/
Einstein Analytics 評価用の Developer Edition 組織は、通常の開発者コミュニティでアカウントを作成しても取得はできません。
以下の Trailhead モジュールにて単元を進める過程で、Analytics 開発組織を取得する手順をご確認いただけます。
Einstein Discovery の基礎
(Analytics 組織取得は第二単元「 Einstein Analytics データセットの作成」に手順の記載があります)
https://trailhead.salesforce.com/ja/content/learn/modules/wave_exploration_smart_data_discovery_basics
組織が取得できたら、早速ログインしてみましょう。
Einstein Discovery の有効化は、Lightning Experience の下記メニューから行います。
プラットフォームツール > 機能設定 > 分析 > Einstein Discovery > 始めましょう
「Analytics 開発者組織を取得したはずなのに、メニューが出てこない、おかしいぞ」とお思いの方もいらっしゃるかもしれません。
その場合は、恐らく「権限セットの付与」が完了していないはずです。
Einstein Discovery の有効化、Einstein Ayalytics アプリケーションへのアクセス、データセットの作成とストーリーの構築、ストーリーからモデルをリリースする、などの作業には、以下の権限セットを割り当てる必要があります。
- Einstein Analytics Platform 管理者
- Einstein Analytics Plus システム管理者
(システム管理者であっても権限セットを割り当てないと機能にアクセスできません)
Einstein Discovery の権限と権限セットについて
https://help.salesforce.com/articleView?id=bi_edd_setup_user_permissions.htm&type=5
Einstein Discovery 機能を有効化したら、次はデータセットの作成です。
「サンプルデータを取り込んで分析し、その結果を予測対象に反映させる」という流れ自体は、Einstein 予測ビルダーの時と変わりません。
但し、予測ビルダーの時は設定メニューからウィザードを起動したのに対し、Einstein Discovery は「Analytics Studio」アプリケーションにアクセスし、そこからデータセットの作成メニューを開きます。
(アプリケーションランチャーに Analytics Studio が表示されませんか?権限セットを今一度確認しましょう!)
Analytics Studio ホーム画面です。
データセットを作成するには、右上の「作成」をクリックします。
データセットの新規作成メニューです。
Einstein 分析ビルダーでは「Salesforce に取り込み済みのレコード」しか使用できませんでしたが、Einstein Discovery では CSV ファイルから直接取り込むことができます。
今回は、分析ビルダーとの比較をわかりやすく行うため、先週使用した「タイタニック号の乗船者リスト」を流用したいと思います。
生存情報が入っている方のデータ(train.csv)を指定します。
そのまま「次へ」をクリックし、データセットの作成を開始します。
データセットの作成が完了した画面です。
ここから「ストーリー」を作成していきます。
ストーリー作成の初期画面です。
ストーリーの目標は、「Survived(生存フラグ)」を「最大化」すること(=他のパラメータで何を選ぶと生存フラグの値を極力「1」に近づけることができるようになるか)になります。
ストーリーのタイトルは、初期値ではデータセットの名前(「train」)が入っていますが、わかりやすいように「タイタニック号:生存の可能性を最大化」などに変更しておきます。
ストーリーの種類を訊かれます。
ストーリーの内容を確認するだけならば「インサイトのみ」で構いませんが、今回はこれから作成したストーリーをモデルとして保存して予測セットへの反映を行うので、「インサイトと予測」を選択します。
項目の選択です。
慣れるまで最初のうちは「自動」で問題ないでしょう。
「ストーリーを作成」をクリックすると、アインシュタイン博士が分析を開始します。
今回は1000件に満たないので数分で終わりますが、万単位のデータの場合はそれなりに時間が掛かりますので、コーヒーでも入れて一息つきましょう。
分析が完了しました!
さあ、ストーリーを見ていきましょう。
モデルに対して影響度の高い項目順に上からストーリーの詳細が表示されていきます。
最も影響度の高い項目は、やはり「性別」です。
「生存フラグへの影響度は 29.3%」と記載があります。
生存率の平均スコアが 38% なのに対し、男性の平均スコアは 19%、女性の平均スコアは 74% との数値が出ました。
ここからが Einstein Discovery の見どころです。
「性別を軸に見ると確かに "男性の生存率" は低い、しかし男性でも "15歳以下の児童" に着目すると、生存率は一気に 51% まで跳ね上がることがわかった」と、興味深いデータを「提案」してくるのです。
同様に女性の場合、15歳以下は逆に 65% まで低下しますが、Einstein は「重要ではない」と言ってきます。恐らく誤差のレベルだということでしょう。
そして、Einstein 予測ビルダーの回でも取り上げた「チケット等級が三等だと、男女ともに生存率が一気に半減する」ことも、しっかりとストーリーの提案事項に含まれています。
予測ビルダーでは「自分で読み解く必要があった」データ分析結果のシナリオを、Einstein Discovery ではストーリーとして提案してくれるわけです。
ちなみにストーリー画面の上部に「2か所の改善点」ボタンが表示されています。
クリックすると、「チケット等級(Pclass)と乗船料金(Fare)はデータモデルに対して極めて近い影響度を持っているため、どちらか一方を選択して保持することで、ストーリーの解釈が容易になります」とのことです。
確かにチケット等級と乗船料金は(同じ区間なら)比例するものなので、どちらか一方に絞った方がよりスッキリするはずです。
今回はより影響度の高いチケット等級を残します。
「推奨バケット」については、数値項目でバケット化(クラスタ化)すると解釈がより容易になるとのことです。
どの項目かは示されていませんが、「237から512」というのがあるのを見ると、これは乗船料金を指しているものと見受けられます。
先ほどの重複項目で「乗船料金は切り捨ててチケット等級のみ保持する」と選択したので、ここでは「何もしない」で構いません。
「新規ストーリーを作成」をクリックします。
再度アインシュタイン博士が長考モードに入りますが、既にパターンの検出まで終わっており、改善点の評価とグラフの再生成だけが要求されるため、わずかな時間で終わるはずです。
再生成されたストーリーを見ると、乗船料金(Fare)に関するものがなくなりました。
チケット等級(Pclass)の項を見れば傾向がわかるので必要ない、というわけです。
Einstein 予測ビルダーには無かった「ストーリーの提案」こそが、Einstein Discovery の最大の特徴です。
とはいえ、Einstein 予測ビルダーには「設定が容易である」「確率のみを的確に算出する」というメリットがあるので、どちらを取るかは、求められる結果や状況により分かれてくるはずです。
さて、予測ビルダーでは「予測セットに対してスコアリングをする」というプロセスがありましたが、Einstein Discovery でも同じように「現在のレコードに対してストーリーを当てはめる」というプロセスがあります。つまり「分析モデルのリリースと適用」です。
次回の "後半戦" では、モデルのリリースとストーリーの適用についてご案内させていただきます。
=================================================
Salesforce Einstein のシリーズも、徐々に「深いところ」に入ってきた感があります。
カスタマーサポート通信の配信を始めたときは、まさか一介の Salesforce コンサルタントがデータ分析の話をすることになるとは想像もつきませんでした。
つまり、Salesforce Einstein は、私のような今までデータ分析には縁も無かった Salesforce ユーザに対しても、スムーズかつフレンドリーにデータ分析の領域に誘ってくれる、実に画期的な機能であると言えます。
しかも Einstein Discovery のストーリー画面には、恐らくデータ分析を専門にされている方ならば有益に活用できそうな(=私にはまだまだ未知の領域な)情報が並んでおり、「奥はもっと深そうだな」と感じました。
Einstein Discovery はまさに「御社の専任データサイエンティスト」(Trailhead の文言の受け売りですが)、この機会に是非触れてみてはいかがでしょう。(私にも比較的容易に理解できたのですから、皆様ならきっとすぐに慣れるはずです!)
不明点は遠慮なくお問合せください。一緒に学習していきましょう!
今後ともウフル カスタマーサポートを引き続きご愛顧いただきますよう、何卒よろしくお願い申し上げます。
コメント