新一代人工智能國家科技重大專項“藏語言文字自動識別技術(shù)研發(fā)和應(yīng)用”成果介紹會29日在拉薩舉行,活動介紹了漢藏語音翻譯技術(shù)與復(fù)雜場景藏文多風(fēng)格字體識別技術(shù)兩項標(biāo)志性成果,全面呈現(xiàn)了藏語智能信息領(lǐng)域的自主創(chuàng)新與系統(tǒng)化成果。
中國工程院院士、西藏大學(xué)教授尼瑪扎西介紹,本次項目圍繞藏語言文字自動識別中的實際難題展開系統(tǒng)性攻關(guān),重點突破多方言語音識別、復(fù)雜場景文字識別等長期存在的技術(shù)瓶頸。
項目構(gòu)建了完整的漢藏(藏語多方言)語音翻譯技術(shù)體系,實現(xiàn)從語音識別、機器翻譯到語音合成的全流程覆蓋,提升了不同方言及復(fù)雜環(huán)境下的語音處理能力。同時,首次研發(fā)面向復(fù)雜場景的藏文多風(fēng)格字體識別技術(shù),可有效處理現(xiàn)代出版物、古籍文獻、社交媒體圖像和自然場景圖片等多種來源的藏文文本,解決了字體多樣、背景復(fù)雜等識別難題。
項目成果已轉(zhuǎn)化到基于智能終端的(移動操作系統(tǒng))APP、基于PC端(計算機操作系統(tǒng))的web應(yīng)用、無線藍牙漢藏語音翻譯耳機、無線藏語智能鼠標(biāo)及漢藏智能語音翻譯會議機五項核心示范產(chǎn)品。
尼瑪扎西表示,在數(shù)據(jù)資源建設(shè)方面,項目已建成規(guī)?;牟卣Z言跨模態(tài)數(shù)據(jù)資源管理系統(tǒng),包括藏漢句對1000萬個、語音語料2000小時、圖像標(biāo)注數(shù)據(jù)20000張,以及包含18000個實體與30000余條關(guān)系的知識圖譜數(shù)據(jù),為技術(shù)的持續(xù)優(yōu)化與應(yīng)用推廣奠定了基礎(chǔ)。
記者現(xiàn)場獲悉,部分成果已在政府辦公、布達拉宮古籍?dāng)?shù)字化保護等重點場景中投入應(yīng)用。其中,藏漢機器翻譯系統(tǒng)單日訪問量最高達11萬次,藏文古籍識別軟件運行穩(wěn)定,為社會提供了便捷可靠的藏語信息處理服務(wù)。
據(jù)悉,此次活動由西藏大學(xué)主辦。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。