科技專欄
 

讓電腦不只能說也能聽的技術 – 語音辨識

2010-08-20

  自古以來,人類之間互相溝通最方便也最直接的方式就是語音交談,無論是表達意見,或請別人幫忙,直接開口說出來,就能夠立刻讓對方了解意思。而現代人大量依賴電腦幫忙日常工作,例如在電腦上寫電子郵件聯絡事務,利用電腦查詢資料,或以電腦記錄重要事件或想法等,就需要透過電腦鍵盤一字一句地輸入電腦中。要是,電腦可以像人一樣,聽得懂我們說的話,把人類「告訴」電腦的話語,自動轉換成文字記載下來,或者了解意思後執行工作,那會有多麼方便輕鬆啊!
  語音辨識技術這門學問的主要目的就是希望電腦聽懂人類說話的聲音,進而命令電腦執行相對應的工作。語音辨識可以為電腦等設備提供人性化的操作介面,就像科幻電影裡的情節般,主角只要對電腦說「打開資料夾」、「查詢機密檔案」、或「銷毀資料」等各種命令,電腦就能夠了解並執行。其實,在我們現實生活中,語音辨識技術已經應用在許多地方了,例如:
1.手機接受語音輸入要撥號的對象,只要對著手機說出通訊錄中存在的名字,手機就會撥號給那個號碼。
2.在手機或電腦的網頁搜尋頁面上,說出要搜尋的關鍵詞,搜尋引擎就為你列出符合搜尋條件的網頁結果。
3.語言教學互動系統不僅可以播放教師的發音示範,也可以讓學生練習複誦,由電腦系統判斷是否正確,並提供修正意見,協助改進學習。
4.智慧聲控家電可接受語音操作,例如回家時家中一片漆黑,只要說「開燈」,電燈就會自動開啟。
  語音辨識技術的原理是,當聲音從人類口述的類比格式轉換到數位格式,輸入電腦內部並以數值方式儲存後,語音辨識便開始以事先儲存好的聲音樣本與輸入的測試聲音樣本進行比對。比對完成後電腦便輸入一個它認為最“像”的聲音樣本,我們就可以知道使用者剛剛唸進去的聲音代表什麼意思,進而命令電腦執行對應的指令。由此可知,「聲音比對」是語音辨識技術很關鍵的原理,比對聲音內容可以得到聲音代表的意義,而比對聲音特徵可以判斷說話者的身份,兩者各有不同的應用範圍,也都是專家學者持續探討的研究領域。
  語音辨識技術從提供人們一個更人性化的操作介面、縮短輸入資料的時間、到確認說話者身份的安全機制等各方面,都扮演了很重要的角色。雖然目前語音辨識技術的正確率還有改進空間,不過已經可以預見未來的遠景,絕對不止於現在用口說命令機器人跳舞或踢球等幾個簡單指令而已!讓我們發揮想像力並且期待吧!
 
文/臺灣大學計資中心  邵喻美

回上一頁  回首頁  TOP

台灣展翅協會(原終止童妓協會) ECPAT Taiwan
104 台北巿中山區民權東路二段26號4樓之5
4F.-5, No.26, Sec. 2, Minquan E. Rd., Zhongshan Dist., Taipei City 104, Taiwan (R.O.C.)
劃撥帳號:17927432 
TEL:02-2562-1233 FAX:02-2562-1277 E-mail: ecpattw[at]ecpat.org.tw
版權所有:2007 ECPAT TAIWAN All Rights Reserved

下載專區網路安全資料庫科技專欄新聞發佈 活動快訊