資料衰退：保險公司應重視合成數據的原因

從周遭世界的經驗（或稱“數據”）中學習，就像呼吸一樣自然。但這項美好的努力，完美地反映了人類的狀況，現在已不再是僅限於人類的經驗。

直接說：機器的學習方式與人類相似。我們來看看怎麼回事。

神經網絡是一種計算系統，擁有互相連結的節點，運作方式就像人類大腦中的神經元。透過算法，它們可以識別原始數據中的隱藏模式和關聯，進行聚類和分類，並隨著時間不斷學習和改進。

作為早期的人工智慧形式，神經網絡依賴於數據，而數據則代表著經驗。世界變化越快，我們（或機器）學習的數據就越不可靠。

過去經驗的數據：我們還能信任它嗎？

想想五年前的真實情況：沒有 COVID、沒有烏克蘭戰爭、沒有 ChatGPT（或生成式人工智慧 (GenAI) 的熱潮）、沒有通貨膨脹、沒有供應鏈中斷或廁紙戰爭。

考慮到當前變化的速度，我們用來決定利率、做出承保決策或解決索賠的歷史數據有多可靠？這些數據在多長時間內是有效的，之後又會變得不可信？我們的損失經驗、保單接受（或拒絕）決策，或銷售和行銷策略是否準確反映了不斷變化的風險？

在2019年，答案可能是肯定的。但隨著每一天的過去，感覺我們的數據就像一個雙面間諜，正在對抗我們。

我們不應該被舊真理束縛。相反，我們應該探索將合成數據（生成式人工智慧的一種形式）融入我們流程的可能性。

合成與雙胞胎

為什麼要使用不是來自真實世界的數據呢？原因有很多：敏感或私密信息、成本、偏見、可用性、稀有情況……這個清單還在繼續。

對於保險公司來說，有幾種被廣泛接受且可靠的技術可以生成合成數據。

生成對抗網絡（GANs）由伊恩·古德費洛（Ian Goodfellow）及其同事在2014年的論文《生成對抗網絡》中首次提出。想深入了解技術細節，可以參考賈森·科隆（Jason Colon）的討論。簡單來說，生成器創建數據並試圖“欺騙”判別器——這可以是圖像、文本、音頻、視頻或表格數據。這兩個網絡相互競爭時，結果顯示其準確率超過99%（因此稱為“對抗”）。

合成少數過採樣技術（SMOTE）通過補充少數數據集來改善整個數據集的統計意義，以解決類別不平衡。在一篇技術論文中，SMOTE被認為是一種高度可靠的數據科學技術，用於確定保險費用的非支付取消。

數位雙胞胎技術從真實世界生成物理物體或系統的虛擬模型。例如，製造商可能會建立一個大型設備的數位雙胞胎，以了解潛在的損失情況。這可以防止因振動或離心力造成的災難性故障，並預測何時需要更換或維護部件。數位雙胞胎可以使用歷史、真實世界數據、合成數據和系統反饋循環數據作為輸入。這些輸入可以批量處理或實時處理。

保險公司在面對稀有事件、不完整數據或難以獲得的數據時，可以使用這些合成數據生成技術。除了上述例子，保險公司還可以使用合成數據來對抗偏見、避免違反隱私法規以及防止敏感信息的洩露。

模糊的清晰度

保險公司對合成數據生成的投資將解決數據衰退問題並增加價值。像 Hazy 這樣的先驅組織已經證明了合成數據的價值。

根據高德納（Gartner）的預測，到2026年，75%的企業將使用生成式人工智慧來創建合成客戶數據，這一比例從2023年的不到5%上升。IDC特別指出，到2027年，“40%的保險公司在保單持有者價值鏈中使用的人工智慧算法將利用合成數據，以確保系統的公平性並遵守法規。”報告進一步預測，這種整合將擴展到承保、行銷和索賠。

SAS的數據和人工智慧研究確認了這些預測：“50%的保險公司預期人工智慧投資的回報將達到兩倍，41%的預期超過三到四倍。”還指出，生成式人工智慧將改善索賠流程和運營效率。

在考慮到數據隱私和保護法律（如一般數據保護條例 (GDPR)、健康保險可攜性和責任法案 (HIPAA) 或歐盟人工智慧法案）時，這些結果也提供了可信的設計保證。

這麼簡單……

有多簡單？點擊即可。不需要編碼。

這是真的。2024年SAS黑客馬拉松的冠軍團隊StatSASticians展示了當今數據和人工智慧工具的易用性和功能。

他們的黑客故事專注於工人安全和SMOTE技術。從“智慧頭盔”收集的數據被輸入到儀表板中，目的是監控熱中暑的早期警告信號。然而，收集的信息不平衡（沒有提供足夠多樣化的數據），因此團隊使用SMOTE技術來解決這一不平衡。

結果？一個適用於工人賠償保險的工人安全模型，可以提供“預測和預防”的結果。

令人印象深刻的是，該團隊在幾週內建立了解決方案——數據量極少。這相當於托尼·史塔克在洞穴中建造原始鋼鐵人套裝。想像一下大型企業能用這樣強大的技術做什麼。（你知道《鋼鐵人3》的一部分是在SAS總部拍攝的——真瘋狂，對吧？）。

那麼，真實世界的數據和合成數據哪個更好？

這個問題的答案聽起來像是一個糟糕笑話，但這是來自個人經驗的。

想像一下：你和一家大型保險公司的人工智慧負責人和首席精算師一起吃早餐。你開始討論合成數據。人工智慧負責人說：“我們不喜歡合成數據。我們喜歡真實數據。”首席精算師說：“如果我們沒有真實數據，合成數據也能很好地工作。”人工智慧負責人說：“這不如真實數據好，所以我們不喜歡它。”首席精算師回答：“好吧，有東西總比沒有好。”

他們就這樣繞圈子，直到帳單來了。

雙方都是對的。如果你擁有足夠的真實數據，並且可以訪問、使用和信任，那就太好了。但這並不總是如此。

結論：挑戰現狀

用湯米·李·瓊斯（Tommy Lee Jones）在《黑衣人》（Men in Black，1997）中的一句話來改述一些聰明的見解，知識和確定性有時可能是愚蠢和危險的。無論我們討論的是“地球是平的”、“四分鐘的英里無法打破”還是“我們只喜歡真實數據”——總有人對這些觀念提出質疑。

像 MAPFRE 這樣的保險公司已經將合成數據稱為“戰略優勢”。ERGO 也呼籲行動，要求“解鎖你的數據寶藏”，以解決索賠、打擊詐騙和開發新產品。

這兩項工作都可以完成——我們仍然可以使用真實世界和合成數據。只需記住，隨著數據的衰退，我們應該優先考慮最新和最可靠的經驗，並將其與生成式人工智慧的力量結合起來。

保險行業在實施生成式人工智慧的競賽中將面臨什麼？查看我們的全球研究報告以了解更多。

新聞來源

本文由 AI 台灣使用 AI 編撰，內容僅供參考，請自行進行事實查核。加入 AI TAIWAN Google News，隨時掌握最新 AI 資訊！

Tags: 資料衰退保險公司應重視合成數據的原因

資料衰退：保險公司應重視合成數據的原因

什麼是 F-Beta 分數？

液體人工智慧推出STAR：一個自動演變量身定制架構的AI框架

Related Posts

中國教育改革人工智慧助力創新人才培育

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2027 年 AI 預測人類水平 AI 的全新里程碑

AI 技術對人類智能的影響我們在失去什麼？

人工智慧重塑遊戲開發遊戲未來從現在開始

液體人工智慧推出STAR：一個自動演變量身定制架構的AI框架

在自然語言處理中平衡隱私與穩健性：大型語言模型中安全提示學習的新方法

發佈留言取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

資料衰退：保險公司應重視合成數據的原因

從周遭世界的經驗（或稱“數據”）中學習，就像呼吸一樣自然。但這項美好的努力，完美地反映了人類的狀況，現在已不再是僅限於人類的經驗。

過去經驗的數據：我們還能信任它嗎？

合成與雙胞胎

對於保險公司來說，有幾種被廣泛接受且可靠的技術可以生成合成數據。

模糊的清晰度

這麼簡單……

那麼，真實世界的數據和合成數據哪個更好？

結論：挑戰現狀

保險行業在實施生成式人工智慧的競賽中將面臨什麼？查看我們的全球研究報告以了解更多。

什麼是 F-Beta 分數？

液體人工智慧推出STAR：一個自動演變量身定制架構的AI框架

Related Posts

發佈留言 取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

發佈留言取消回覆