合成數據幫助保險公司減少偏見

保險業因為「公平偏見」的做法已經受到長期關注。企業實踐中的不良數據和偏見確實是保險公司的典型特徵。不幸的是，這導致了邊緣化的社群。

根據某些業內專家的說法，包括美國前保險專員，人工智慧（AI）監管領域最大的問題將是歧視。原因在於，客戶數據可能會揭露過多不利信息，使保險公司只能選擇最理想的風險。

對保險公司來說，什麼是不良數據？

在開發模型時，訓練數據非常重要。舉例來說，生命保險中的身體質量指數（BMI）。這個例子顯示，缺乏多樣化、具代表性和高品質的保險數據，導致了80年來所謂的「理想風險」，最終被美國醫學會認為是有偏見的。

在這個案例中，BMI數據主要基於白人男性的身高和體重數據。最近的研究顯示，BMI並未考慮骨密度和肌肉量等因素，這使得它對於許多人來說並不是評估風險的正確標準。

如同BMI的例子所示，數據的不足會導致可得性偏見（對於容易獲得的數據過度信任），這會導致不良結果。由於數據是人工智慧的燃料，將不良數據輸入AI系統將導致不良結果。

什麼是算法，為什麼它們重要？

AI算法是一組設計用來執行特定任務或解決特定問題的逐步指令。生成合成數據（創建合成數據）是使用AI算法的過程，例如機器學習算法和神經網絡。

偏見：一個四個字母的詞

多年來，保險公司使用郵遞區號或區域代碼來計算保險費用。但這些看似無害的變數可能是敏感數據的代理，例如種族、性別或宗教。這些變數可能隱藏著偏見。

舉例來說，2017年Propublica在芝加哥的一篇報導中提到，汽車保險費用的不平等，郵遞區號被用作確定費率的主要數據點。後來的研究顯示，少數族裔居住的郵遞區號地區的居民支付了更高的保險費，而年齡、保險範圍、性別和事故歷史等因素並未被考慮。

在最令人震驚的例子中，當郵遞區號改變時，保險費的差異在某些少數族裔超過50%的社區中高達300%。而且在34家提到的公司中，這種差異普遍存在。

如果這類偏見不被調查和限制，脆弱的社群將會被進一步邊緣化。AI只會使這種不平等變得更糟。

AI和可靠性：促進AI知識、包容性參與和可證明的可靠性的努力已經達到了最高政府層級。

生成性AI的角色

大多數生成性AI（GenAI）的商業案例都使用大型語言模型（LLM）。另一種GenAI——合成數據，特別有助於解決隱私和公平等數據問題。合成數據為開發者提供了不需要使用數據掩碼來保護敏感個人數據的優勢。以下是這些公司的說法：

Property Casualty 360引用了這句話：“到2027年，將有多達40%的保險公司使用的AI算法將整合合成數據，以確保其流程公平並符合規範”（來自IDC FutureScape的預測）。
MAPFRE稱合成數據為保險的“戰略優勢”。他們表示：“合成數據完全不依賴於特定個體，確保了隱私受到尊重，同時嚴格遵守規範。”

這聽起來太美好了？絕對不是。

合成數據結果的實際案例

在2022年，SAS與Syntho和荷蘭AI聯盟合作，顯示合成數據提供的結果比匿名數據更可靠，並保持了進行更高級分析所需的深層統計模式。

這些發展，加上對隱私保護的日益擔憂，正是IDC預測到2027年，40%的保險公司AI算法將在保單持有者的價值鏈中使用合成數據，以確保系統的公平性並遵守規範的原因。

合成數據在保險中的應用：聖杯還是AI的靈丹妙藥？

僅僅依賴合成數據並不能解決所有問題。請記住，您仍然需要原始數據來創建合成數據。因此，原始數據中的持續偏見可能仍然存在。

任何有關安全使用AI（包括GenAI）的對話都必須面對一些事實：

偏見會造成不平等。
所有模型都有偏見。
偏見可以被限制，但無法完全消除。

為了在這個行業中樹立領導地位，公司必須發展自己的可靠AI原則。他們還必須：

促進數據素養文化和數據驅動決策的使用。
使員工能夠識別無意的AI風險。
將數據倫理守則作為企業的核心部分。

最近，SAS與一家大型保險公司合作，進行了一個合成數據的保險項目，該公司實驗了合成數據和信用評分。實驗結果非常有希望。隨後的討論也揭示了有關信用和其他影響保費評估因素的一些不愉快真相。例如：

多項研究證實，少數族裔和女性駕駛者的汽車保險費用更高。
駕駛行為可能受到警方偏見的影響。
通過智能設備跟踪駕駛行為可能會根據不同社區的道路條件產生偏差的影響。

閱讀美國眾議院金融服務委員會對汽車保險實踐的詳細評估。

合成數據在保險中的未來

保險公司可以使用GenAI的方式有很多種。

保險公司可以利用生成性AI模型創建情境，然後主動識別風險並預測結果。GenAI可以提供定價和保險範圍決策的信息。它還可以自動化索賠處理，以降低成本並改善客戶體驗（和滿意度）。此外，GenAI還可以用來更好地檢測詐騙，並向客戶提供針對性的風險預防建議，以減少索賠的可能性。

合成數據打破了保險業中的偏見循環。

整個保險社群不應該專注於AI可能帶來的負面影響，而應該提出正確的問題，並謹慎關注用於生成合成數據的數據質量。這樣，我們可以保護隱私，顯著減少偏見，同時充分利用生成性AI的巨大價值。

獲取SAS Data Maker的獨家預覽——一個低代碼、無代碼的界面，用於快速增強或生成數據

新聞來源

本文由 AI 台灣 運用 AI 技術編撰，內容僅供參考，請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團，
隨時掌握最新 AI 動態與實用資訊！

Tags: 合成數據幫助保險公司減少偏見

合成數據幫助保險公司減少偏見

ByBit 遭竊 14 億美元，創下史上最大加密貨幣盜竊案

索尼研究人員提出TalkHier：一種新穎的AI框架，用於解決LLM-MA系統中通信和精煉的關鍵挑戰

Related Posts

中國教育改革人工智慧助力創新人才培育

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2027 年 AI 預測人類水平 AI 的全新里程碑

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

AI 技術對人類智能的影響我們在失去什麼？

MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言

索尼研究人員提出TalkHier：一種新穎的AI框架，用於解決LLM-MA系統中通信和精煉的關鍵挑戰

月球計畫人工智慧與加州大學洛杉磯分校研究人員發布月光：一個使用5.7T標記訓練的3B/16B參數專家混合模型，採用穆昂優化器

發佈留言取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

合成數據幫助保險公司減少偏見

保險業因為「公平偏見」的做法已經受到長期關注。企業實踐中的不良數據和偏見確實是保險公司的典型特徵。不幸的是，這導致了邊緣化的社群。

對保險公司來說，什麼是不良數據？

什麼是算法，為什麼它們重要？

AI算法是一組設計用來執行特定任務或解決特定問題的逐步指令。生成合成數據（創建合成數據）是使用AI算法的過程，例如機器學習算法和神經網絡。

偏見：一個四個字母的詞

生成性AI的角色

合成數據結果的實際案例

合成數據在保險中的應用：聖杯還是AI的靈丹妙藥？

合成數據在保險中的未來

ByBit 遭竊 14 億美元，創下史上最大加密貨幣盜竊案

索尼研究人員提出TalkHier：一種新穎的AI框架，用於解決LLM-MA系統中通信和精煉的關鍵挑戰

Related Posts

發佈留言 取消回覆

Archives

Categories

Welcome Back!

Retrieve your password

發佈留言取消回覆