
閩南話識別系統(tǒng)界面。一位女士正對著手機用閩南話進行語音輸入。
臺海網(wǎng)3月23日訊 據(jù)廈門日報報道,用閩南話對著手機語音錄入“愛拼才會贏”,語音輸入后屏幕上立即顯示“愛拼才會贏”字樣。近期,一款名叫“閩南話識別”的軟件在網(wǎng)絡上走紅。只要是日常對話的語句,不管你說的閩南話是廈門口音、泉州口音,或是漳州口音,它基本都能識別出來并翻譯成文字,識別準確率高達85%
這款軟件是廈大信息科學與技術學院副教授洪青陽、廈大人文學院中文系助理教授許彬彬帶領的科研團隊合作研發(fā)的。目前,這一軟件已經(jīng)過多階段的內部測試,并開放供廣大市民免費試用。
記者與幾位同學分別用廈門口音、泉州口音、漳州口音的閩南話,對著軟件語音輸入:“今天天氣很好。”不到2秒,系統(tǒng)翻譯出了相同的對應文字。記者又以略微不同的表達方式對著軟件語音輸入“今天天氣很好”,系統(tǒng)依舊能準確識別。
近日,記者采訪了軟件背后的科研團隊,為您揭秘軟件開發(fā)過程。
調查
采集多地語音資料 連國外也不放過
首先,該軟件背后的語音資料庫就很強大,這是基于許彬彬近10年來的研究成果。許彬彬帶領團隊借鑒、整理了大量語音資料——囊括福建省內廈、漳、泉多地的閩南方言、文本,甚至收集了國外多處講閩南話的地點的語音材料。
除了廈大的語音資料庫外,每到寒暑假,許彬彬團隊還會去各地進行田野調查。“省內的漳浦、東山等,以及菲律賓北部城市、美國的東部地區(qū),每一個地點至少要停留5天,盡可能全面地描寫該地區(qū)語音面貌。”她說。
