Q1:誰可以申請使用臺灣客語語音資料庫?
A1: 政府機關、學術單位、企業、個人研究者皆可提出申請,但須明確說明使用目的與研究計畫。
Q2:如何申請臺灣客語語音資料庫?
A2: 提供申請文件,經主管單位審核通過後即可取得使用授權。
Q3:申請客語語音資料庫需繳費嗎?
A3: 僅收行政處理工本費。
Q4:申請客語語音資料庫的審核時間大約多久?
A4: 一般約2~4週,若文件不足或需補件,時間可能延長。
Q5:申請時需要提供什麼資料?
A5: 身份證明文件、授權使用協議書
Q6:可否申請多種客語腔調語音資料?
A6: 可以,但需於申請時明確說明需求的客語腔調,如四縣腔、海陸腔、大埔腔等。
Q7:申請人是否須具備客語語言背景?
A7: 不強制要求,但須具有語音處理相關的研究或使用經驗。
Q8:申請核准後,如何取得語音資料庫?
A8: 透過下載連結及授權專屬帳號於指定平台下載。
Q9:資料庫申請被拒絕時,可否再次申請?
A9: 可以,需修正申請計畫後重新送審。
Q10:語音資料庫的授權有效期限多久?
A10: 永久授權。
Q11:資料庫包含哪些語料類型?
A11: 常見包含朗讀語料、會話語料、句子或詞彙發音資料。
Q12:語音檔案的格式為何?
A12: 常見為WAV格式,16kHz的PCM無壓縮檔案。
Q13:是否有搭配的文字標註?
A13: 附帶對應的客語漢字或拼音(如臺灣客語羅馬拼音方案)標註。
Q14:語音資料庫中是否提供發音人背景資料?
A14: 提供基本資訊,如性別、年齡範圍、腔調類別,但不含個人隱私資訊。
Q15:可否使用語料庫進行商業應用?
A15: 可以。
Q16:語音資料庫中客語腔調如何區分?
A16: 以臺灣客語主要腔調分類:四縣(含南四縣)、海陸、大埔、饒平、詔安腔等分類。
Q17:如何確認資料庫的音質與噪音水準?
A17:會明確標註錄音環境(如專業錄音室、安靜環境或現場收錄)。
Q18:若資料庫中發現錯誤標註或語音瑕疵,如何回報?
A18: 提供回報管道向建置單位反映問題,維護單位會持續修正更新。
Q19:使用語音資料庫產出的AI模型,其著作權歸誰?
A19: AI模型著作權通常屬於申請人或單位所有,但語料版權仍屬客委會。
Q20:可否轉移語音資料庫授權予其他單位使用?
A20: 不得任意轉移,其他單位需向客委會重新提出授權轉移申請。
Q21:客語語音資料庫可用於哪些AI應用?
A21: 包括但不限於語音辨識、語音合成、語言教學、智慧客服系統等。
Q22:客語語音辨識模型訓練需要多少語料?
A22: 一般訓練語音辨識系統至少需數十小時語料,實務建議100小時以上為佳。
Q23:資料庫內是否提供情緒或語氣標註?
A23: 一般客語語音資料庫不含情緒標註。
Q24:語料庫是否適合進行語音合成(TTS)系統建置?
A24: 語料庫具備TTS訓練用資料。
Q25:客語語音辨識時,如何處理不同腔調差異?
A25: 通常採用多腔調混合訓練模型。
Q26:客語語音資料庫能否與其他語言資料庫混合使用?
A26: 可以,但須注意語音特性差異,需額外進行資料調整或正規化處理。
Q27:可否將客語語音資料庫用於語言教學與文化保存計畫?
A27: 可以且鼓勵,這類用途通常容易獲得主管單位支持與授權。