English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 80990/80990 (100%)
造訪人次 : 42733942      線上人數 : 1636
RC Version 7.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 查詢小技巧:
  • 您可在西文檢索詞彙前後加上"雙引號",以獲取較精準的檢索結果
  • 若欲以作者姓名搜尋,建議至進階搜尋限定作者欄位,可獲得較完整資料
  • 進階搜尋


    請使用永久網址來引用或連結此文件: http://ir.lib.ncu.edu.tw/handle/987654321/46498


    題名: 實現於音訊壓縮域之內涵式歌者分類法;Design and Implementation for Content-based Singer Classification on Compressed Domain Audio Data
    作者: 黃昱翔;Yu-siang Huang
    貢獻者: 電機工程研究所
    關鍵詞: 壓縮域;內涵式;歌者辨識;歌者分類;classification;identification;content-based;compressed domain;MP3;AAC
    日期: 2010-11-18
    上傳時間: 2011-06-04 16:13:26 (UTC+8)
    出版者: 國立中央大學
    摘要: 在本論文中,我們提出了一個實現於MP3及AAC音樂壓縮域的自動化歌者分類法。不同於早年在MP3壓縮域使用MDCT (Modified Discrete Cosine Transform) 係數的作法,在本論文中我們是使用梅爾倒頻係數 (Mel-Frequency Cepstral Coefficients, MFCC) 當作辨識之特徵值。雖然梅爾倒頻係數經常用於音樂分類及語者辨識,但是這類的研究大多都不是在壓縮域中實現,因為梅爾倒頻係數無法直接由壓縮域中取得。在本論文中,我們使用了一個修正的梅爾倒頻係數計算法,使得梅爾倒頻係數可以從MP3及AAC音樂壓縮域中取得。除此之外,為了描述特徵空間中梅爾倒頻係數向量的分布,我們使用了高斯混合模型 (Gaussian Mixture Model, GMM)。而為了找出最相近的歌者/分類,我們則是使用最大似然分類法 (Maximum Likelihood Classification, MLC)。藉由最大似然分類法,每一個輸入的梅爾倒頻係數向量將會分配到其最相似的群聚中。最後,我們將演算法實現在兩個不同的嵌入式平台上,分別是Socle CDK及ITRI PAC Duo。最後的實驗結果也證實了我們所提方法的可行性。 In this thesis we proposed a singer classification approach to automatically identify the singer of an unknown MP3 or AAC audio data. Differing from previous researches for singer identification in MP3 compressed domain, we use Mel-Frequency Cepstral Coefficients (MFCC) as the feature instead of MDCT (modified discrete cosine transform) coefficients. Although MFCC is often used in music classification and speaker recognition, it can not be directly obtained from compressed music data such as MP3 and AAC. In this thesis, we introduce a modified method for calculating MFCC vector in MP3 and AAC compressed domain. Besides, for describing the distribution of MFCC vectors in MFCC feature space, the GMM (Gaussian mixture model) is used. And then, for finding the nearest singer, we use maximum likelihood classification (MLC) to allot each input MFCC vector to its nearest group. Finally, we implement our approach on two embedded platforms, including Socle CDK and ITRI PAC Duo. Except the two embedded platforms, two operation system configurations are adopted, including Linux and Android. The experimental result verifies the feasibility of the proposed approach.
    顯示於類別:[電機工程研究所] 博碩士論文

    文件中的檔案:

    檔案 描述 大小格式瀏覽次數
    index.html0KbHTML662檢視/開啟


    在NCUIR中所有的資料項目都受到原著作權保護.

    社群 sharing

    ::: Copyright National Central University. | 國立中央大學圖書館版權所有 | 收藏本站 | 設為首頁 | 最佳瀏覽畫面: 1024*768 | 建站日期:8-24-2009 :::
    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 隱私權政策聲明