大西北网12月4日讯 “搜索引擎是文化与历史传承的新载体,对一国的文化安全意义重大,‘云藏’是全球首个藏文智能搜索引擎,建成后对藏文信息安全、国内外涉藏舆情监测以及重要舆情分析将提供可靠的参数和依据”。2日,青海省海南藏族自治州藏语委办主任、“云藏”引擎开发负责人才洛告诉记者。
“云藏”一词是藏文的音译词,有两层含义,其一为“上师”或“老师”,意为有求必应、有问必答;其二是将其分为单字,有“全面抓取、提取”之意。“云藏”搜索引擎是青海省少数民族事业“十二五”规划中藏文信息化建设的重要组成部分,于2013年4月启动系统平台项目建设,研发团队现有100余名工作人员,由藏文信息录入组、分词标注组和技术组3个小组组成,团队中藏族比例达84%,该搜索引擎预计将于2015年年底建设完成,2016年7月正式开通。
“目前,中国国内如百度、搜狗等主要的搜索引擎中没有藏文搜索功能,但国外搜索引擎反而支持藏文的简单搜索,如谷歌英文版、中文版,雅虎英文版、中文版以及微软的bing搜索引擎等”,才洛说,“由于数据索引库在国外,检索到的信息准确性和内容有受制性,对应出自国内的真实和有效的信息不能被及时检索,提供的有关藏文化知识准确度不高、信息量不够”。
据了解,“云藏”藏文搜索引擎系统平台建设项目,是一个集搜索引擎、藏文百科、自动问答为一体的大型藏文门户系统工程,将开辟新闻、网页、图片、视频、百科、文库、知道7个板块,“任何搜索引擎中,数据库的建设是最为繁琐艰巨的工作。尤其对于藏文搜索引擎来说是一项从零开始的浩大工程”。才洛介绍,“云藏”搜索引擎覆盖了文化、卫生、教育、科技、宗教、人物等诸多方面,截至目前,已录入历史、文学、宗教、医学、自然以及各类词典等25类资料,共录入12.7万条词条,字数达1197.7万字。
“‘云藏’建成后,该系统的藏文搜索正确识别率将达95%,不仅能满足藏文网民个性化的检索需求,还将推动藏文信息全方位融入互联网世界。”才洛说,“未来使用藏文的网民输入一个词汇,就会有对应的百科知识,如果词条内容空缺,系统会提示网民自主添加,后台审核通过即可录入数据库,这种方式,将使数据库不断地丰富、扩充”。
目前已知的藏文网页超过6700万个,初步估算,“云藏”运行初期,青、藏、甘、川、滇五省区的藏文用户数量约为120万,随着搜索引擎产品的推广和宣传,用户量将达200万。
http://ent.chinanews.com/cul/2014/12-02/6837768.shtml