全國首個藏文搜索引擎“云藏”上線以來 創(chuàng)新發(fā)展數(shù)據(jù)量不斷擴(kuò)大
|
“云藏”工作人員演示系統(tǒng)運(yùn)行情況(央廣網(wǎng)記者 張雷 攝) 央廣網(wǎng)西寧4月22日消息(記者張雷 通訊員先吉卓瑪 王成霞 曲田)全國首個藏文搜索引擎“云藏”在青海上線以來,不斷擴(kuò)大數(shù)據(jù)量,創(chuàng)新發(fā)展,實(shí)現(xiàn)與世界的對話。 這幾天,青海省海南藏族自治州藏文信息技術(shù)研究中心數(shù)據(jù)建設(shè)部的工作人員正在加緊錄入全國各省區(qū)市的地名,便于用戶通過“云藏”搜索引擎快速查詢相關(guān)地名信息。 海南州藏文信息技術(shù)研究中心數(shù)據(jù)建設(shè)部負(fù)責(zé)人德青措介紹:“資料來源主要就是從百度上翻譯過來,然后在云藏的前臺編輯,審核完了以后在云藏前臺發(fā)布。” 目前,“云藏”搜索在百科板塊錄入了文化、政治、經(jīng)濟(jì)、歷史等各領(lǐng)域的詞條共9萬多條,隨著編輯和錄入內(nèi)容的更新,最新的疫情信息也有所體現(xiàn)。 海南州藏文信息技術(shù)研究中心數(shù)據(jù)建設(shè)部負(fù)責(zé)人多杰仁青介紹:“疫情期間,我們及時更新疫情方面的詞條,比如鐘南山等人物都翻譯了。” 創(chuàng)新發(fā)展,技術(shù)是第一關(guān)口!霸撇亍鄙暇以來,孵化基地的工作人員成功研發(fā)藏文自動分詞與語言智能處理系統(tǒng),實(shí)現(xiàn)了藏文自動糾錯、藏文同義詞搜索、藏文拉丁轉(zhuǎn)寫搜索等功能,填補(bǔ)了藏文信息處理應(yīng)用領(lǐng)域的一大空白。 海南州藏文信息技術(shù)研究中心自然語言處理研究所負(fù)責(zé)人航尖才讓介紹:“藏文分詞是藏文信息處理技術(shù)第一項(xiàng)難關(guān),分詞語料庫規(guī)模越大,它的搜索準(zhǔn)確性越高,還有分詞的搜索結(jié)果越豐富! 云藏系統(tǒng)也是一個信息共享的平臺。與世界接軌的云藏,在提高個性化檢索能力的同時,也注重提升移動用戶端的體驗(yàn)。
“云藏”工作人員正在用搜索引擎進(jìn)行檢索(央廣網(wǎng)記者 張雷 攝) 海南州藏文信息技術(shù)研究中心網(wǎng)絡(luò)安全技術(shù)部負(fù)責(zé)人官卻多杰介紹:“目前我們技術(shù)部正在著力打造云藏系統(tǒng)新版app,目前已經(jīng)完成了60%的工作內(nèi)容,有望在今年的上半年,在蘋果的應(yīng)用市場和安卓的各大應(yīng)用市場同時發(fā)布! 隨著云藏數(shù)據(jù)量的不斷增加擴(kuò)充,“云藏”生態(tài)系統(tǒng)建設(shè)也加快步伐,形成了集創(chuàng)業(yè)、技術(shù)孵化、人才培養(yǎng)于一體的云藏藏文信息技術(shù)孵化基地。 海南州藏文信息技術(shù)研究中心綜合部主任 拉吉卓瑪表示:“在新形勢下,我們將依托云藏平臺優(yōu)勢,通過云藏孵化基地吸引信息化類小微企業(yè)入駐,抱團(tuán)發(fā)展,共同探索藏文信息化領(lǐng)域的新業(yè)態(tài),研發(fā)新功能、新產(chǎn)品,進(jìn)一步推動藏文信息化發(fā)展! |


