現在的企業面臨著越來越複雜和不穩定的現實。零售、製造、醫療保健等行業的公司都面臨著準確規劃和預測的挑戰。預測未來的庫存需求、設定可實現的戰略目標以及有效預算,都需要應對不斷變化的消費者需求和全球市場力量。庫存短缺、過剩以及未滿足的客戶期望,都是持續的威脅。供應鏈預測對於幫助企業應對這些不確定性至關重要。
通過使用歷史銷售和供應數據來預測未來需求的變化,供應鏈預測支持高層在庫存、戰略和預算方面的決策。分析過去的趨勢,同時考慮從季節到世界事件的影響,提供了指導企業規劃的見解。利用預測能力來指導決策的組織,可以在激烈的競爭和市場波動中蓬勃發展。總的來說,掌握需求預測使企業能夠通過在正確的時間提供正確的產品來滿足客戶期望。
在這篇文章中,我們將介紹亞馬遜網路服務 (Amazon Web Services, AWS) 如何通過定制機器學習 (Machine Learning, ML) 模型來解決預測挑戰。我們將深入探討亞馬遜 SageMaker Canvas,並解釋它如何幫助零售和消費品 (Consumer Packaged Goods, CPG) 企業解決預測挑戰。
亞馬遜 SageMaker Canvas 介紹
亞馬遜 SageMaker Canvas 是一個強大的無需編碼的機器學習服務,為商業分析師和數據專業人士提供了構建準確機器學習模型的工具,而無需編寫任何代碼。這種可視化的點擊界面使機器學習變得更加普及,使用者可以利用人工智慧 (AI) 的力量來應用於各種商業應用。SageMaker Canvas 支持多種機器學習模式和問題類型,滿足基於數據類型的各種用例,例如表格數據(我們在這篇文章中的重點)、計算機視覺、自然語言處理和文檔分析。要了解亞馬遜 SageMaker Canvas 支持的模式,請訪問亞馬遜 SageMaker Canvas 產品頁面。
對於時間序列預測用例,SageMaker Canvas 使用自動機器學習 (AutoML) 在您的歷史時間序列數據集上訓練六種算法,並使用堆疊集成方法將它們結合起來,創建最佳的預測模型。這些算法包括:卷積神經網絡 – 分位數回歸 (CNN-QR)、DeepAR+、Prophet、非參數時間序列 (NPTS)、自回歸整合移動平均 (ARIMA) 和指數平滑 (ETS)。要了解更多關於這些算法的信息,請參閱亞馬遜 SageMaker 文檔中的時間序列預測算法支持。
亞馬遜 SageMaker Canvas 如何幫助零售和 CPG 製造商解決預測挑戰
用戶友好的界面和 SageMaker Canvas 中的自動機器學習技術相結合,為用戶提供了高效構建、部署和維護機器學習模型的工具,幾乎不需要編碼。例如,沒有編碼或雲端工程專業知識的商業分析師,可以快速使用亞馬遜 SageMaker Canvas 上傳他們的時間序列數據並進行預測。而且,這不僅僅是商業分析師可以使用的服務。零售或 CPG 公司的任何團隊都可以使用這項服務,通過 SageMaker Canvas 的用戶友好界面生成預測數據。
為了有效使用亞馬遜 SageMaker Canvas 進行零售預測,客戶應該使用他們希望預測需求的一組 SKU 的銷售數據。考慮到零售環境中需求的季節性變化,全年各個月份的數據至關重要。此外,提供幾年的數據以消除數據中的異常或極端值也是必要的。
零售和 CPG 組織在預測方法中依賴行業標準方法,其中之一是分位數。預測中的分位數代表可能未來值的預測分佈中的特定點。它們使機器學習模型能夠提供概率預測,而不僅僅是單一的點估計。分位數幫助量化預測中的不確定性,顯示可能結果的範圍和分佈。常用的分位數包括第 10 百分位數、第 50 百分位數(中位數)和第 90 百分位數。例如,第 90 百分位數的預測意味著實際值有 90% 的機會在該水平以下。
通過提供未來需求的概率視圖,分位數預測使零售和 CPG 組織能夠在不確定性面前做出更明智的決策,最終提高運營效率和財務表現。
亞馬遜 SageMaker Canvas 通過結合分位數回歸的機器學習模型來滿足這一需求。使用分位數回歸,您可以從廣泛的規劃場景中選擇,這些場景以分位數的形式表達,而不是依賴單一的點預測。正是這些分位數提供了選擇。
這些分位數意味著什麼呢?請查看以下圖形,這是使用亞馬遜 SageMaker Canvas 的時間序列預測示例。該圖形提供了通過分位數回歸實現的多個結果的時間序列預測的視覺效果。紅線標記為 p05,表示實際數字預計在約 5% 的時間內會低於 p05 線。相反,這意味著 95% 的時間內,真實數字可能會高於 p05 線。
零售或 CPG 組織可以評估多個分位數預測點,考慮每個項目的過度和不足供應成本,自動選擇在未來期間內最有可能提供最大利潤的分位數。如有必要,當商業規則希望固定分位數而非動態分位數時,您可以覆蓋選擇。
要了解更多關於如何為您的業務使用分位數的信息,請查看這篇文章《超越預測:滿足客戶需求與業務增長之間的微妙平衡》。
亞馬遜 SageMaker Canvas 提供的另一個強大功能是「假設分析」,這補充了分位數預測,能夠互動式探索輸入變量的變化如何影響預測。用戶可以更改模型輸入,並立即觀察這些變化對個別預測的影響。這一功能允許實時探索不同的場景,而無需重新訓練模型。
SageMaker Canvas 中的假設分析可以應用於各種場景,例如:
預測未來幾個月的庫存
預測下一季度的銷售
評估價格降低對假日季節銷售的影響
預估未來幾小時內商店的顧客流量
如何生成預測
以下示例說明用戶如何從時間序列數據集中生成預測,我們使用消費電子產品數據集來預測基於當前和歷史需求的 5 個月的銷售。要下載此數據集的副本,請訪問。
要訪問亞馬遜 SageMaker Canvas,您可以直接使用 AWS 管理控制台登錄並導航到亞馬遜 SageMaker Canvas,或者您可以使用單一登錄直接訪問亞馬遜 SageMaker Canvas,具體請參見《使用 AWS IAM 身份中心啟用亞馬遜 SageMaker Canvas 的單一登錄訪問》。在這篇文章中,我們通過 AWS 控制台訪問亞馬遜 SageMaker Canvas。
生成預測
要生成預測,請按照以下步驟操作:
在亞馬遜 SageMaker 控制台的左側導航窗格中,選擇 Canvas。
在右側的「開始使用」下選擇「打開 Canvas」,如以下截圖所示。如果這是您第一次使用 SageMaker Canvas,您需要按照屏幕上的提示創建一個 SageMaker Canvas 用戶。將為 SageMaker Canvas 控制台打開一個新的瀏覽器標籤。
在左側導航窗格中,選擇數據集。
要導入您的時間序列數據集,選擇導入數據下拉菜單,然後選擇表格,如以下截圖所示。
在數據集名稱中,輸入一個名稱,例如 Consumer_Electronics,然後選擇創建,如以下截圖所示。
從您的計算機或亞馬遜簡單存儲服務 (Amazon Simple Storage Service, Amazon S3) 存儲桶上傳您的數據集(CSV 或 Parquet 格式)。
預覽數據,然後選擇創建數據集,如以下截圖所示。
在狀態下,您的數據集導入將顯示為處理中。當顯示為完成時,請繼續下一步。
現在您已創建數據集並上傳了時間序列數據文件,創建一個新模型以生成數據集的預測。在左側導航窗格中,選擇我的模型,然後選擇新模型,如以下截圖所示。
在模型名稱中,輸入一個名稱,例如 consumer_electronics_forecast。在問題類型下,選擇您的用例類型。我們的用例是預測分析,它使用表格數據集構建模型以解決不同問題,包括預測。
選擇創建。
您將被轉移到構建。在目標列下拉菜單中,選擇您希望生成預測的列。這是我們數據集中需求的列,如以下截圖所示。在選擇目標列後,SageMaker Canvas 將自動選擇時間序列預測作為模型類型。
選擇配置模型。
將彈出一個窗口,要求您提供更多信息,如以下截圖所示。輸入以下詳細信息:
選擇唯一識別數據集中項目的列 – 此配置決定您如何唯一識別數據集中的項目。對於此用例,選擇 item_id,因為我們計劃預測每個商店的銷售。
選擇一列,按該列中的值對預測進行分組 – 如果您在前一字段中選擇的項目有邏輯分組,您可以在此處選擇該功能。對於此用例,我們沒有,但例如可以是州、地區、國家或其他商店的分組。
選擇包含時間戳的列 – 時間戳是包含時間戳信息的特徵。SageMaker Canvas 需要數據時間戳的格式為 YYYY-MM-DD HH:mm:ss(例如,2022-01-01 01:00:00)。
指定您希望預測的未來月份數 – SageMaker Canvas 預測的值將延伸到時間戳字段中指定的時間點。對於此用例,我們將預測未來 5 個月的值。您可以選擇輸入任何有效值,但請注意,較高的數字將影響預測的準確性,並且可能需要更長的計算時間。
您可以使用假日計劃來提高預測準確性 – (可選)如果您希望了解它如何幫助提高準確性,您可以啟用使用假日計劃並選擇相關國家。不過,由於我們的數據集是合成的,這對於此用例可能影響不大。
要更改之前解釋的默認分位數,請在左側導航窗格中選擇預測分位數。在預測分位數字段中,輸入您自己的值,如以下截圖所示。
SageMaker Canvas 根據您的數據選擇自動機器學習算法,然後訓練一個集成模型以進行時間序列預測問題的預測。使用時間序列預測,您可以進行隨時間變化的預測,例如預測:
您未來幾個月的庫存
您未來幾個月的銷售
假日季節降價對銷售的影響
未來幾小時內進入商店的顧客數量
產品價格降低對銷售的影響
如果您不確定要嘗試哪些預測算法,請選擇所有算法。要幫助您決定選擇哪些算法,請參考時間序列預測的算法支持,您可以在那裡了解更多詳細信息並比較算法。
選擇保存。
訓練模型
配置完成後,您可以訓練模型。SageMaker Canvas 提供兩種構建選項:
快速構建 – 與標準構建相比,花費的時間更少。潛在的準確性以速度為代價。
標準構建 – 從優化過程中構建最佳模型,這一過程由自動機器學習提供支持。速度以最大的準確性為代價。
在這次演示中,我們選擇標準構建,如以下截圖所示。
當模型訓練完成後,您將被轉移到分析頁面。在那裡,您可以找到平均預測準確性和對預測結果的列影響。
您的數字可能與以下截圖顯示的不同。這是由於機器學習過程的隨機性。
以下是這些指標的解釋以及如何使用它們:
wQL – 平均加權分位數損失 (wQL) 通過對 P10、P50 和 P90 分位數的準確性進行平均來評估預測(除非用戶已更改它們)。較低的值表示模型更準確。在我們的示例中,我們使用了默認分位數。如果您選擇不同百分位數的分位數,wQL 將集中於您選擇的數字。
MAPE – 平均絕對百分比誤差 (MAPE) 是所有時間點的百分比誤差(預測值與實際值的平均差異的百分比)。較低的值表示模型更準確,其中 MAPE = 0 表示沒有誤差的模型。
WAPE – 加權絕對百分比誤差 (WAPE) 是絕對誤差的總和,按目標的絕對值總和進行標準化,這衡量了預測值與觀察值的整體偏差。較低的值表示模型更準確,其中 WAPE = 0 表示沒有誤差的模型。
RMSE – 均方根誤差 (RMSE) 是平均平方誤差的平方根。較低的 RMSE 表示模型更準確,其中 RMSE = 0 表示沒有誤差的模型。
MASE – 平均絕對標準化誤差 (MASE) 是預測的平均絕對誤差,按簡單基線預測方法的平均絕對誤差進行標準化。較低的值表示模型更準確,其中 MASE < 1 被估計為優於基線,MASE > 1 被估計為劣於基線。
您可以根據需要更改默認指標。wQL 是默認指標。公司應選擇與其特定業務目標一致且易於利益相關者解釋的指標。指標的選擇應由需求數據的特定特徵、業務目標和利益相關者的可解釋性要求驅動。
例如,一家高流量的雜貨店銷售易腐爛的商品,需要最低的 wQL。這對於防止因庫存不足而導致的銷售損失至關重要,同時也避免過度庫存,這可能導致這些易腐爛商品的變質。
通常建議評估多個指標並選擇最符合公司預測目標和數據模式的指標。例如,wQL 是一個穩健的指標,可以處理間歇性需求,並提供對不同分位數的預測準確性的更全面評估。然而,RMSE 由於平方運算對較大誤差給予更高的權重,使其對異常值更敏感。
選擇預測以打開預測頁面。
要生成數據集中所有項目的預測,選擇批量預測。要為特定項目生成預測(例如,實時預測需求),選擇單一預測。以下步驟顯示如何執行這兩個操作。
要為特定項目生成預測,請按照以下步驟操作:
選擇單一項目,然後從項目下拉列表中選擇任何項目。SageMaker Canvas 為我們的項目生成預測,顯示平均預測(即該項目在時間戳下的需求)。SageMaker Canvas 提供所有上限、下限和預期預測的結果。
擁有範圍而不是單一預測點是最佳實踐,這樣您可以選擇最符合您的用例的選擇。例如,您可能希望通過選擇下限來減少過度庫存的資源浪費,或者您可能希望選擇上限以確保滿足客戶需求。例如,在促銷傳單中高度廣告的商品可能會按照第 90 百分位數 (p90) 進行庫存,以確保可用性並防止客戶失望。另一方面,較不可能吸引顧客流量的配件或大件商品可以按照第 40 百分位數 (p40) 進行庫存。通常不建議庫存低於第 40 百分位數,以避免持續缺貨。
要生成預測,選擇下載預測下拉菜單按鈕,將預測圖表下載為圖片或預測值下載為 CSV 文件。
您可以使用「假設情景」按鈕來探索改變價格將如何影響某項商品的需求。要使用此功能,您必須將未來日期的行留空,這是您正在預測的特徵。此數據集對於一些項目有空白單元格,這意味著此功能對它們啟用。選擇假設情景並編輯不同日期的值,以查看改變價格將如何影響需求。此功能幫助組織測試特定情景,而無需對基礎數據進行更改。
要對整個數據集生成批量預測,請按照以下步驟操作:
選擇所有項目,然後選擇開始預測。狀態將顯示為生成預測,如以下截圖所示。
當完成時,狀態將顯示為準備就緒,如以下截圖所示。選擇三點附加選項圖標,然後選擇預覽。這將在預覽頁面中打開預測結果。
選擇下載以將這些結果導出到您的本地計算機,或選擇發送到亞馬遜 QuickSight 進行可視化,如以下截圖所示。
訓練時間和性能
SageMaker Canvas 提供高效的訓練時間,並提供有關模型性能的寶貴見解。您可以檢查模型準確性,進行回測,並評估基於所選性能指標的各種性能指標。通過在背景中結合多個算法,SageMaker Canvas 顯著減少了訓練模型所需的時間,與單獨訓練每個模型相比。此外,通過使用模型排行榜儀表板,您可以根據所選性能指標(默認為 wQL)評估每個訓練算法在特定時間序列數據上的性能,並進行排名。
該儀表板還顯示其他指標,您可以使用這些指標比較不同算法在各種性能指標上的表現,從而促進明智的決策和模型選擇。
要查看排行榜,請選擇模型排行榜,如以下截圖所示。
模型排行榜顯示了用於訓練您數據的不同算法及其基於所有可用指標的性能,如以下截圖所示。
整合
零售和 CPG 組織通常依賴於如庫存生命週期管理、訂單管理系統和商業智慧 (Business Intelligence, BI) 儀表板等應用程序,這些應用程序集成了預測能力。在這些情況下,組織可以無縫地將 SageMaker Canvas 預測服務與現有應用程序集成,使其能夠利用預測數據的力量。要在這些應用程序中使用預測數據,需要為預測模型提供端點。儘管 SageMaker Canvas 模型可以部署以提供端點,但這一過程可能需要來自機器學習運營 (MLOps) 的額外努力。幸運的是,亞馬遜 SageMaker 簡化了這一過程,簡化了 SageMaker Canvas 模型的部署和整合。
以下步驟顯示您如何使用 SageMaker 部署 SageMaker Canvas 模型:
在 SageMaker 控制台的左側導航窗格中,選擇我的模型。
選擇您要部署的模型旁邊的三點附加選項圖標,然後選擇部署,如以下截圖所示。
在實例類型下,選擇將部署模型的實例大小。選擇部署,並等待您的部署狀態更改為服務中。
部署服務後,在左側導航窗格中選擇 ML Ops 以獲取已部署模型的端點,如以下截圖所示。您可以測試您的部署或開始在應用程序中使用該端點。
可重現性和 API 管理
重要的是要了解亞馬遜 SageMaker Canvas 使用加速您的時間序列預測的功能,這可以使預測速度提高 50%。有關詳細信息,請參閱 AWS 機器學習博客中的相關內容。
見解
零售和 CPG 企業通常使用可視化工具,例如亞馬遜 QuickSight 或第三方軟件(如 Tableau)來理解預測結果並在業務單位之間共享這些結果。為了簡化可視化,SageMaker Canvas 提供了嵌入式可視化功能,用於探索預測結果。對於希望在自己的 BI 儀表板系統(如亞馬遜 QuickSight、Tableau 和 Qlik)中可視化預測數據的零售和 CPG 企業,SageMaker Canvas 預測模型可以部署以生成預測端點。用戶還可以從預測窗口生成批量預測文件,以便將其發送到亞馬遜 QuickSight 進行批量預測,如以下截圖所示。
以下截圖顯示了 QuickSight 中的批量預測文件,您可以使用該文件進行分析。
當您的數據集在亞馬遜 QuickSight 中時,您可以開始使用可視化工具分析或可視化您的數據,如以下截圖所示。
成本
亞馬遜 SageMaker Canvas 提供靈活且具成本效益的定價模型,基於三個關鍵組件:工作區實例運行時間、預構建模型的使用以及自定義模型創建和預測生成的資源消耗。計費週期從啟動 SageMaker Canvas 應用程序開始,涵蓋數據攝取、準備、探索、模型實驗以及預測和可解釋性結果的分析等一系列基本任務。這種全面的方法意味著用戶只需為他們實際使用的資源付費,提供透明和高效的定價結構。要了解更多定價示例,請查看亞馬遜 SageMaker Canvas 定價。
所有權和可攜性
越來越多的零售和 CPG 企業因多種原因採用多雲部署。為了簡化在亞馬遜 SageMaker Canvas 上構建和訓練的模型向其他雲提供商或本地環境的可攜性,亞馬遜 SageMaker Canvas 提供可下載的模型工件。
此外,許多零售和 CPG 公司在組織內部擁有許多業務單位(如商品銷售、規劃或庫存管理),這些單位都使用預測來解決不同的用例。為了簡化模型的所有權並促進業務單位之間的簡單共享,亞馬遜 SageMaker Canvas 現在將其模型註冊表集成擴展到時間序列預測模型。客戶只需單擊一下,即可將在亞馬遜 SageMaker Canvas 上構建的機器學習模型註冊到 SageMaker 模型註冊表,如以下截圖所示。要了解如何找到存儲模型工件的 S3 存儲桶位置,請參見《在亞馬遜 SageMaker 開發者指南中註冊模型版本》。
清理
為了避免產生不必要的費用,您可以刪除剛剛構建的模型,然後刪除數據集,並退出您的亞馬遜 SageMaker Canvas 域。如果您還註冊了亞馬遜 QuickSight,您可以取消訂閱並刪除您的亞馬遜 QuickSight 帳戶。
結論
亞馬遜 SageMaker Canvas 賦予零售和 CPG 公司無需編碼的預測解決方案。它提供自動化的時間序列預測,用於庫存規劃和需求預測,具有直觀的界面和快速的模型開發。憑藉無縫的整合能力和具成本效益的見解,它使企業能夠提高運營效率,滿足客戶期望,並在快速變化的零售和消費品市場中獲得競爭優勢。
我們鼓勵您評估如何利用亞馬遜 SageMaker Canvas 改進您的預測能力。使用直觀的無需編碼的界面來分析和提高零售和 CPG 產品需求預測的準確性,增強庫存管理和運營效率。要開始使用,您可以查看亞馬遜 SageMaker Canvas 沉浸日的工作坊。
關於作者
Aditya Pendyala 是 AWS 的首席解決方案架構師,總部位於紐約市。他在架構基於雲的應用程序方面擁有豐富的經驗。目前,他正在與大型企業合作,幫助他們設計高度可擴展、靈活和韌性的雲架構,並指導他們所有與雲相關的事宜。他擁有 Shippensburg 大學的計算機科學碩士學位,並相信「當你停止學習時,你就停止成長。」
Julio Hanna 是一位 AWS 解決方案架構師,總部位於紐約市,專注於企業技術解決方案和運營效率。他的職業生涯專注於推動創新,目前利用人工智慧、機器學習和生成式 AI 幫助組織應對數字轉型之旅。Julio 的專業知識在於利用尖端技術為企業環境提供戰略價值並促進創新。
本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!