http://www.fon.hum.uva.nl/praat/
Praat語音學軟體,原名Praat: doing phonetics by computer,通常簡稱Praat,是一款跨平台的多功能語音學專業軟體,主要用於對數字化的語音信號進行分析、標注、處理及合成等實驗,同時生成各種語圖和文字報表。
背景概要
命名
Praat(國際音標 [praːt])在荷蘭語中是說話或交談的意思,而doing phonetics by computer即使用計算機研究語音學。作為軟體的名稱,簡便起見,不妨合起來翻譯作Praat語音學軟體。
作者
Praat的作者是荷蘭阿姆斯特丹大學人文學院語音科學研究所的主席保羅·博爾斯馬(Paul Boersma)教授和大衛·威寧克(David Weenink)助教授。
版本
Praat最早的版本發佈於1993年。起初用戶還無法自由地下載使用,但從2003年6月5日的4.1版起,作者取消了專門的授權並開放了絕大部分原始碼。進一步,從2004年3月4日的4.2版起,作者開放了全部原始碼,使Praat成為採用GNU通用公共許可證授權的開源軟體。相隔短則一天,長則月余,作者就會發布最近修訂的版本,消除舊的故障,增添新的功能。2007年12月10日發布了5.0版。[1]
Praat目前支持在多種計算機平台上運行,包括:
Macintosh
Windows[2]
Linux, FreeBSD
SGI, Solaris, HPUX
作者為以上平台的用戶提供已編譯好的目標文件。高級用戶還可以在其他作業系統平台上修改並編譯原始碼後運行Praat程序。
Praat能夠在圖形和命令行兩種用戶界面下運行,但兩種界面的目標文件(可執行文件)各自獨立,以Windows版為例,即分為praat.exe和praatcon.exe兩個可執行文件,其中後者只能通過命令行方式從控制台調用。
用途概述
Praat的主要功能是對自然語言的語音信號進行採集、分析和標注,並執行包括變換和濾波等在內的多種處理任務。作為分析結果的文字報表和語圖,不但可以輸出到個人計算機的磁碟文件中和終端的顯示器上,更能夠輸出為精緻的向量圖或點陣圖,供寫作和印刷學術論文與專著使用。
此外,Praat還可用於合成語音或聲音、統計分析語言學數據、輔助語音教學測試,等等。隨著新版本的發布,Praat的功能和用途仍在不斷擴展,但實際上多數用戶只需要用到一小部分功能。
構成與界面
Praat程序由外圍與核心兩層構成。外圍主要包括對象窗口(Object window,標題為Praat objects)、畫板窗口(Picture window,標題為Praat picture)、腳本編輯器(ScriptEditor)、按鈕編輯器(ButtonEditor)、數據編輯器(DataEditor,無固定標題)、情報窗口(Info window)和手冊(Manual)等不負責具體的信號處理任務的輔助性組件。Praat每次啟動時,自動打開對象窗口和畫板窗口。對象窗口也是Praat的主控窗口,在Praat程序的會話進程中始終打開,大部分功能也需要由此展開。腳本(script)在是Praat中執行各種操作的宏命令,能夠簡化日常操作,減少出錯,並實現大量複雜操作的自動化。按照作者的最初設想,除了Praat之外還會有其他程序使用與Praat相同的外圍程序,但多年來一直沒有實現[3]。
Praat的核心部分即具體負責語音信號處理任務的程序,包括所有的對象類型(Types of object)、動作命令(Action commands)和相應的編輯器(Editors)。對象(object)是由Praat程序所構建的數據存儲載體,有很多種類型,如聲音(Sound)、文本表格(TextGrid)、音高(Pitch)、變換(Manipulation),等等,通過執行編輯器或動態選單(Dynamic menu)中的動作命令完成對數據的查詢(數字化測量)和處理(生成新對象)任務。聲音編輯器(SoundEditor)和文本表格編輯器(TextGridEditor)是Praat中最常用的兩種編輯器,多用於涉及語音分析和標注的科學研究與課堂教學。
語音分析與標注
對語音信號的分析與標注是Praat的基本功能。在Praat中錄音或讀取音頻文件後,可以按用戶要求顯示以下多種語圖:
三維語圖(spectrogram)
頻譜切片(spectral slices)
音高(即基頻[4])曲線(pitch contour)
共振峰曲線(formant contour)
音強曲線(intensity contour)
所有的語圖都可以繪製成精緻的向量圖,也可以將相應的對象數據保存為磁碟文件。除直觀的語圖外,Praat也能通過對信號數據的計算獲得各種文字情報,比如音高、時長、第一或第二共振峰頻率的數值等,也同樣可以根據需要輸出為適當的形式。
Praat允許用戶對語音數據進行標注,包括音段切分和文字註釋,標注的結果還可以獨立保存和交換。然而,Praat本身缺乏自動標注功能,只能對有聲段和靜默段進行簡單的識別,而不能對音節、節拍群等語流單位加以切分。[5]
其他功能
Praat還具有許多其他功能,包括:
語音實驗:嗓音分析、多重強迫選擇實驗、濾波、聲源濾波合成、發音合成等。
輔助教學:前饋神經網、優選論學習等。
統計分析:主成分分析、多維量表、判別分析等。
優點
可以免費獲得而無需購買(因為是開源軟體)。
無需安裝即可運行(但嚴格地說,還不是綠色軟體)。
支持多種作業系統平台。
支持用腳本宏命令和外掛程式(plug-in)擴展和簡化操作。
專業功能強大而完備。
高級用戶可以按需修改原始碼並重新編譯,從根本上擴充原有功能。
附有詳細的手冊文檔。
缺點
缺點分析程序採用的某些數字信號處理演算法[7]仍然不盡如人意,會不可避免地造成迷惑人的假象或產生難以解釋的結果。
不能直接訪問某些常用音頻和圖像文件格式,如WMA格式;對MP3格式的支持也僅限讀取(軟體許可證方面的原因)。
由於最初並不是在Windows平台下開發的,用戶界面的設計和某些操作習慣可能會讓Windows用戶感到不便,比如沒有滑鼠右鍵菜單,鍵盤按鍵名稱也是Macintosh機器的。
目前尚無除英語以外其他語言的版本,部分用戶可能會遇到語言障礙。
尚未全面支援Unicode。檔案名稱如果包含漢字,在Praat對象窗口中會被底線取代。在TextGrid對象中如果輸入漢字,屏幕上會顯示亂碼(但所儲存文本仍舊正常,只是顯示不出來)。標注時所使用的國際音標字型為SIL Doulos IPA 1993,而非SIL推薦的Unicode 字型[8]。
影響
儘管還存在一些缺點和不足,畢竟瑕不掩瑜,Praat已成為全世界實驗語音學、心理語言學、語言教學、語言調查、自然語言處理等相關領域的高校教師、學生和其他研究人員普遍選用的專業軟體。
Praat的普及,終結了從事實驗語音學特別是聲學語音學[9]研究必須依賴價格昂貴的實驗儀器的時代,許多語音學實驗室不再使用各種陳舊的語圖儀,而僅僅配置有安裝了Praat等軟體的個人計算機和靈敏的麥克風作為必備的器材。
部分Praat高級用戶公開發布自己編寫的腳本甚至外掛程式,其中不乏實用性較高者,既擴充了軟體的功能,也擴大了影響。
在中國大陸:儘管只有英語版本可用,許多高校的教師在語音學等相關課程上用Praat進行教學演示,在研究工作中自己使用並鼓勵學生克服語言障礙學習掌握Praat的基本功能。越來越多的學術論文和專著當中可以見到用Praat生成的語圖和文字報表。不過,總體而言,了解並能夠用好這一工具的專業人士還比較少。
沒有留言:
張貼留言