星期一, 16 6 月, 2025
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
AI TAIWAN 台灣人工智慧中心
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全
No Result
View All Result
AI TAIWAN 台灣人工智慧中心
No Result
View All Result
Your Ad
Home 機器學習與應用

dMel: 語音標記化簡化版

2025-02-28
in 機器學習與應用
0 0
0
dMel: 語音標記化簡化版
Share on FacebookShare on Twitter
Your Ad


大型語言模型如何改變語言處理

大型語言模型透過自我監督的預訓練,利用大量的文本數據,徹底改變了自然語言處理的方式。受到這一成功的啟發,研究人員開始探索複雜的語音標記方法,將連續的語音信號轉換成離散的標記,這樣就可以將語言建模技術應用於語音數據中。然而,現有的方法要麼專注於語義(內容)標記,可能會失去聲音的資訊;要麼專注於聲學標記,則有可能失去語義(內容)資訊。擁有多種標記類型也使得架構變得複雜,並需要額外的預訓練。

dMel的簡單表示法

我們展示了一種新的方法,將梅爾濾波器頻道離散化為離散的強度區間,這種表示法稱為dMel,並且它的表現優於其他現有的語音標記方法。我們使用一種LM風格的變壓器架構來進行語音與文本的建模,全面評估了不同的語音標記方法在語音識別(ASR)和語音合成(TTS)上的表現。我們的結果顯示,dMel在這兩個任務中都能在統一的框架內達到高效能,為語音和文本的有效聯合建模鋪平了道路。

圖1. dMel標記化和去標記化的過程。
圖2. 我們的語音重建實驗比較了在三種音頻條件下的各種標記方法:清晰語音、帶有音樂背景噪音的語音,以及有重疊說話者的語音。結果顯示,dMel的重建表現與清晰語音的實際音頻質量在詞錯誤率(WER)方面相匹配。此外,當引入音樂或語音噪音時,所有其他標記方法都失敗了,而dMel仍然保持了其表現。



新聞來源

本文由 AI 台灣 運用 AI 技術編撰,內容僅供參考,請自行核實相關資訊。
歡迎加入我們的 AI TAIWAN 台灣人工智慧中心 FB 社團,
隨時掌握最新 AI 動態與實用資訊!

Tags: dMel語音標記化簡化版
Previous Post

一種古老的RNA引導系統可能簡化基因編輯療法的傳遞 | 麻省理工學院新聞

Next Post

Convergence AI 發布 WebGames:一套全面的基準測試套件,旨在評估通用網頁瀏覽 AI 代理

Related Posts

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台
機器學習與應用

劍橋大學和莫納什大學的研究人員推出 ReasonGraph:一個可視化和分析大型語言模型推理過程的網絡平台

2025-03-16
生成式人工智慧的影響及其對數據科學家的啟示
機器學習與應用

生成式人工智慧的影響及其對數據科學家的啟示

2025-03-15
這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成
機器學習與應用

這篇AI論文介紹了BD3-LMs:一種結合自回歸模型和擴散模型的混合方法,用於可擴展和高效的文本生成

2025-03-15
九個生鏽的Pico PIO瓦特(第二部分)
機器學習與應用

九個生鏽的Pico PIO瓦特(第二部分)

2025-03-15
開始使用 Amazon Bedrock Agents 的電腦操作
機器學習與應用

開始使用 Amazon Bedrock Agents 的電腦操作

2025-03-15
評估使用 Amazon Bedrock 知識庫的 RAG 應用程式
機器學習與應用

評估使用 Amazon Bedrock 知識庫的 RAG 應用程式

2025-03-14
Next Post
Convergence AI 發布 WebGames:一套全面的基準測試套件,旨在評估通用網頁瀏覽 AI 代理

Convergence AI 發布 WebGames:一套全面的基準測試套件,旨在評估通用網頁瀏覽 AI 代理

2025年最佳網路取證軟體:Windows取證及其他頂尖工具

2025年最佳網路取證軟體:Windows取證及其他頂尖工具

發佈留言 取消回覆

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Archives

  • 2025 年 6 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月
  • 2024 年 10 月
  • 2024 年 9 月
  • 2024 年 8 月
  • 2024 年 7 月
  • 2024 年 6 月
  • 2024 年 5 月
  • 2024 年 4 月
  • 2024 年 3 月
  • 2024 年 2 月
  • 2023 年 10 月
  • 2023 年 9 月
  • 2023 年 8 月
  • 2023 年 7 月
  • 2023 年 5 月
  • 2023 年 3 月
  • 2023 年 1 月
  • 2022 年 12 月
  • 2022 年 11 月
  • 2022 年 5 月
  • 2022 年 4 月
  • 2022 年 1 月
  • 2021 年 11 月
  • 2021 年 8 月
  • 2021 年 5 月
  • 2021 年 3 月
  • 2021 年 1 月
  • 2020 年 12 月
  • 2020 年 10 月
  • 2020 年 9 月
  • 2019 年 7 月
  • 2018 年 11 月

Categories

  • AI 智慧產業
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • 安全
  • 機器人與自動化
  • 機器學習與應用
  • 神經連結和腦機接口
  • 自然語言處理
  • 道德與法規
Your Ad
  • 關於我們
  • 廣告合作
  • 免責聲明
  • 隱私權政策
  • DMCA
  • Cookie 隱私權政策
  • 條款與條件
  • 聯絡我們
AI TAIWAN

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • AI 綜合新聞
  • AI 自動化與 AI Agents
  • AI 智慧產業
  • 機器學習與應用
  • 自然語言處理
  • 神經連結和腦機接口
  • 機器人與自動化
  • 道德與法規
  • 安全

版權 © 2024 AI TAIWAN.
AI TAIWAN 對外部網站的內容不負任何責任。