星期日, 15 6 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home AI 綜合新聞

哈佛大學將發布一個由 OpenAI 和微軟資助的大型免費 AI 訓練數據集

2024-12-12
in AI 綜合新聞
0 0
0
哈佛大學將發布一個由 OpenAI 和微軟資助的大型免費 AI 訓練數據集
Share on FacebookShare on Twitter
Your Ad


機構數據計畫與波士頓公共圖書館合作

除了大量的書籍,機構數據計畫(Institutional Data Initiative, IDI)也在與波士頓公共圖書館合作,掃描數百萬篇現在已經進入公共領域的報紙文章。他們表示,未來會開放與其他類似機構合作的可能性。目前,書籍數據集的具體發布方式尚未確定。機構數據計畫已經請求谷歌(Google)一起合作進行公共發佈,而谷歌也承諾會提供支持。

數據集的影響

無論機構數據計畫的數據集如何發布,它都將加入許多類似的專案、初創公司和計畫,這些專案承諾能讓公司獲得大量高品質的人工智慧(AI)訓練材料,而不會面臨版權問題。像是Calliope Networks和ProRata等公司已經出現,發放許可證並設計補償計畫,以確保創作者和權利持有者能夠因提供AI訓練數據而獲得報酬。

新的公共領域專案

還有其他新的公共領域專案。去年春天,法國的AI初創公司Pleias推出了自己的公共領域數據集,名為Common Corpus,根據專案協調員Pierre-Carl Langlais的說法,這個數據集包含約300到400萬本書籍和期刊收藏。這個專案得到了法國文化部的支持,這個月在開源AI平台Hugging Face上已經下載超過60,000次。上週,Pleias宣布他們將發布第一組基於這個數據集訓練的大型語言模型,Langlais告訴WIRED,這些模型是“首次完全基於開放數據並符合歐盟(EU)AI法案”進行訓練的模型。

創建影像數據集的努力

目前也在努力創建類似的影像數據集。AI初創公司Spawning在今年夏天發布了自己的數據集Source.Plus,這個數據集包含來自維基共享資源(Wikimedia Commons)以及各種博物館和檔案館的公共領域影像。許多重要的文化機構早已將自己的檔案作為獨立專案向公眾開放,例如大都會藝術博物館(Metropolitan Museum of Art)。

對於數據集的看法

Ed Newton-Rex曾是Stability AI的高管,現在他運營一個非營利組織,負責認證倫理訓練的AI工具。他表示,這些數據集的興起顯示,建立高效能和高品質的AI模型不需要竊取版權材料。OpenAI之前告訴英國立法者,沒有使用版權作品,創造像ChatGPT這樣的產品是“不可能的”。Newton-Rex說:“像這樣的大型公共領域數據集進一步推翻了某些AI公司用來辯解竊取版權作品以訓練模型的‘必要性辯護’。”

對未來的擔憂

但他仍然對機構數據計畫及類似專案是否真的會改變訓練現狀抱有保留態度。他說:“這些數據集只有在被使用的情況下,可能與其他數據的授權一起,才能對替代竊取的版權作品產生正面影響。如果它們只是被添加到混合中,成為一個包含世界創作者未授權作品的數據集的一部分,那麼它們將主要使AI公司受益。”



新聞來源

本文由 AI 台灣 使用 AI 編撰,內容僅供參考,請自行進行事實查核。加入 AI TAIWAN Google News,隨時掌握最新 AI 資訊!

Tags: artificial intelligencecopyrightmachine learningmicrosoftopen sourceopenai和微軟資助的大型免費哈佛大學將發布一個由訓練數據集
Previous Post

這是每個人都退出社交媒體的一年嗎?

Next Post

AI 助力醫療保險抗爭新創公司如何改變遊戲規則

Related Posts

中國教育改革人工智慧助力創新人才培育
AI 綜合新聞

中國教育改革人工智慧助力創新人才培育

2025-06-11
AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破
AI 綜合新聞

AI 助力中風患者康復Devon 的 SAMueL-2 計畫創新突破

2025-04-24
全球AI教育市場蓬勃發展智慧學習工具引領新趨勢
AI 綜合新聞

全球AI教育市場蓬勃發展智慧學習工具引領新趨勢

2025-04-21
2027 年 AI 預測人類水平 AI 的全新里程碑
AI 綜合新聞

2027 年 AI 預測人類水平 AI 的全新里程碑

2025-04-21
AI 技術對人類智能的影響我們在失去什麼?
AI 綜合新聞

AI 技術對人類智能的影響我們在失去什麼?

2025-04-20
MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言
AI 綜合新聞

MIT 研發新技術提升 AI 生成代碼準確性助力非專業人士掌握 SQL 語言

2025-04-18
Next Post
AI 助力醫療保險抗爭新創公司如何改變遊戲規則

AI 助力醫療保險抗爭新創公司如何改變遊戲規則

AI在醫療中的應用需嚴格監管專家呼籲關注算法

AI在醫療中的應用需嚴格監管專家呼籲關注算法

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。