2008年11月1日 星期六

Praat: doing phonetics by computer

http://www.fon.hum.uva.nl/praat/


Praat語音學軟體,原名Praat: doing phonetics by computer,通常簡稱Praat,是一款跨平台的多功能語音學專業軟體,主要用於對數字化語音信號進行分析、標注、處理合成等實驗,同時生成各種語圖和文字報表。

背景概要
命名
Praat(國際音標 [praːt])在荷蘭語中是說話或交談的意思,而doing phonetics by computer即使用計算機研究語音學。作為軟體的名稱,簡便起見,不妨合起來翻譯作Praat語音學軟體。

作者
Praat的作者是荷蘭阿姆斯特丹大學人文學院語音科學研究所的主席保羅·博爾斯馬(Paul Boersma)教授和大衛·威寧克(David Weenink)助教授。

版本
Praat最早的版本發佈於1993年。起初用戶還無法自由地下載使用,但從2003年6月5日的4.1版起,作者取消了專門的授權並開放了絕大部分原始碼。進一步,從2004年3月4日的4.2版起,作者開放了全部原始碼,使Praat成為採用GNU通用公共許可證授權的開源軟體。相隔短則一天,長則月余,作者就會發布最近修訂的版本,消除舊的故障,增添新的功能。2007年12月10日發布了5.0版。[1]
Praat目前支持在多種計算機平台上運行,包括:
Macintosh
Windows[2]
Linux, FreeBSD
SGI, Solaris, HPUX
作者為以上平台的用戶提供已編譯好的目標文件。高級用戶還可以在其他作業系統平台上修改並編譯原始碼後運行Praat程序。
Praat能夠在圖形命令行兩種用戶界面下運行,但兩種界面的目標文件(可執行文件)各自獨立,以Windows版為例,即分為praat.exe和praatcon.exe兩個可執行文件,其中後者只能通過命令行方式從控制台調用。

用途概述
Praat的主要功能是對自然語言語音信號進行採集、分析和標注,並執行包括變換濾波等在內的多種處理任務。作為分析結果的文字報表和語圖,不但可以輸出到個人計算機磁碟文件中和終端顯示器上,更能夠輸出為精緻的向量圖點陣圖,供寫作和印刷學術論文與專著使用。
此外,Praat還可用於合成語音或聲音統計分析語言學數據、輔助語音教學測試,等等。隨著新版本的發布,Praat的功能和用途仍在不斷擴展,但實際上多數用戶只需要用到一小部分功能。

構成與界面
Praat程序由外圍與核心兩層構成。外圍主要包括對象窗口(Object window,標題為Praat objects)、畫板窗口(Picture window,標題為Praat picture)、腳本編輯器(ScriptEditor)、按鈕編輯器(ButtonEditor)、數據編輯器(DataEditor,無固定標題)、情報窗口(Info window)和手冊(Manual)等不負責具體的信號處理任務的輔助性組件。Praat每次啟動時,自動打開對象窗口和畫板窗口。對象窗口也是Praat的主控窗口,在Praat程序的會話進程中始終打開,大部分功能也需要由此展開。腳本(script)在是Praat中執行各種操作的宏命令,能夠簡化日常操作,減少出錯,並實現大量複雜操作的自動化。按照作者的最初設想,除了Praat之外還會有其他程序使用與Praat相同的外圍程序,但多年來一直沒有實現[3]
Praat的核心部分即具體負責語音信號處理任務的程序,包括所有的對象類型(Types of object)、動作命令(Action commands)和相應的編輯器(Editors)。對象(object)是由Praat程序所構建的數據存儲載體,有很多種類型,如聲音(Sound)、文本表格(TextGrid)、音高(Pitch)、變換(Manipulation),等等,通過執行編輯器或動態選單(Dynamic menu)中的動作命令完成對數據的查詢(數字化測量)和處理(生成新對象)任務。聲音編輯器(SoundEditor)和文本表格編輯器(TextGridEditor)是Praat中最常用的兩種編輯器,多用於涉及語音分析和標注的科學研究與課堂教學。

語音分析與標注
對語音信號的分析與標注是Praat的基本功能。在Praat中錄音或讀取音頻文件後,可以按用戶要求顯示以下多種語圖:
三維語圖(spectrogram)
頻譜切片(spectral slices)
音高(即基頻[4])曲線(pitch contour)
共振峰曲線(formant contour)
音強曲線(intensity contour)
所有的語圖都可以繪製成精緻的向量圖,也可以將相應的對象數據保存為磁碟文件。除直觀的語圖外,Praat也能通過對信號數據的計算獲得各種文字情報,比如音高、時長、第一或第二共振峰頻率的數值等,也同樣可以根據需要輸出為適當的形式。
Praat允許用戶對語音數據進行標注,包括音段切分和文字註釋,標注的結果還可以獨立保存和交換。然而,Praat本身缺乏自動標注功能,只能對有聲段和靜默段進行簡單的識別,而不能對音節節拍群語流單位加以切分。[5]

其他功能
Praat還具有許多其他功能,包括:
語音實驗:嗓音分析、多重強迫選擇實驗、濾波、聲源濾波合成發音合成等。
輔助教學:前饋神經網優選論學習等。
統計分析:主成分分析多維量表判別分析等。

優點
可以免費獲得而無需購買(因為是開源軟體)。
無需安裝即可運行(但嚴格地說,還不是綠色軟體)。
支持多種作業系統平台。
支持用腳本宏命令和外掛程式(plug-in)擴展和簡化操作。
專業功能強大而完備。
高級用戶可以按需修改原始碼並重新編譯,從根本上擴充原有功能。
附有詳細的手冊文檔。

缺點
缺點分析程序採用的某些數字信號處理演算法[7]仍然不盡如人意,會不可避免地造成迷惑人的假象或產生難以解釋的結果。
不能直接訪問某些常用音頻和圖像文件格式,如WMA格式;對MP3格式的支持也僅限讀取(軟體許可證方面的原因)。
由於最初並不是在Windows平台下開發的,用戶界面的設計和某些操作習慣可能會讓Windows用戶感到不便,比如沒有滑鼠右鍵菜單,鍵盤按鍵名稱也是Macintosh機器的。
目前尚無除英語以外其他語言的版本,部分用戶可能會遇到語言障礙。
尚未全面支援Unicode。檔案名稱如果包含漢字,在Praat對象窗口中會被底線取代。在TextGrid對象中如果輸入漢字,屏幕上會顯示亂碼(但所儲存文本仍舊正常,只是顯示不出來)。標注時所使用的國際音標字型為SIL Doulos IPA 1993,而非SIL推薦的Unicode 字型[8]

影響
儘管還存在一些缺點和不足,畢竟瑕不掩瑜,Praat已成為全世界實驗語音學心理語言學語言教學語言調查自然語言處理等相關領域的高校教師、學生和其他研究人員普遍選用的專業軟體。
Praat的普及,終結了從事實驗語音學特別是聲學語音學[9]研究必須依賴價格昂貴的實驗儀器的時代,許多語音學實驗室不再使用各種陳舊的語圖儀,而僅僅配置有安裝了Praat等軟體的個人計算機和靈敏的麥克風作為必備的器材。
部分Praat高級用戶公開發布自己編寫的腳本甚至外掛程式,其中不乏實用性較高者,既擴充了軟體的功能,也擴大了影響。
在中國大陸:儘管只有英語版本可用,許多高校的教師在語音學等相關課程上用Praat進行教學演示,在研究工作中自己使用並鼓勵學生克服語言障礙學習掌握Praat的基本功能。越來越多的學術論文和專著當中可以見到用Praat生成的語圖和文字報表。不過,總體而言,了解並能夠用好這一工具的專業人士還比較少。