本資料庫為客語朗讀語料(reading speech),是以原生客語文本,收集來自臺灣各地不同腔調的客語語音,並同時以 8 隻麥克風進行錄製。 錄好的客語語音,經由兩次人工校正文本後,整理成可供語音辨認技術研究與開發使用之語音語料庫。目前共錄製 81 人,每位語者錄製 30 至 120 分鐘,總計 150 小時語料 (8 tracks)。
{ "音檔長度": "00:09", "漢羅客語": "會議地點在哪仔?會議地點在屏東縣高樹鄉。", "客語拼音": "fi55 ngi55 ti55 diam31 di55 nai55 e31? fi55 ngi55 ti55 diam31 di55 pin11 dung24 ien55 go24 su55 hiong24。", "華語字": "會議地點在哪裡?會議地點在屏東縣高樹鄉。", "提示卡編號": "C2010", "音檔編號": "1", "發音員編號": "F003", "性別": "女性", "年齡": "42", "身分別": "薪傳師(教師)", "現居地": "新北市汐止區", "18歲前居住地": "苗栗縣苗栗市", "教育程度": "研究所", "錄音腔調": "四縣腔", "語言背景": "", "錄音環境": "一般辦公室", "流暢度": "普通" }