当前位置: 主页 > 行业新闻 > 有道汉藏词典的建设
 

有道汉藏词典的建设

【论文时间: 2017-01-04 14:17
  栉风沐雨、薪火相传。2017年就要来了,希望有道汉藏词典的伙伴们越来越多。
  引言
  文化自觉的当代价值何在?理论界有自己的学术轨迹,年轻的互联网领域,也有着从自发到自觉的田野实践。
  分明记得,费孝通先生在晚年多次表达了两个遗憾,一是关于计算机,一是关于西藏。西藏,因为身体原因,医生一直不让他去,他非常关注。至于计算机,他曾不无羡慕甚至嫉妒地表示,“我自己在这方面就不行。你们可以坐在计算机前,利用键盘写文章,直接输入到微机里边去,我的文章还得一个字一个字地写。这说明我落后了一个时代。没有进入到电子时代当中来。当然人是进来了,可是脑筋、技能没有进来。”
  我的田野在互联网。
  从2014年开始,我推动了有道汉藏词典的建设,并将它送到了藏区。费先生的这两个遗憾,我都有交集之处。2015年1月,“有道汉藏词典”推出了试用版,4月15日正式上线,三天内在有道客户端的头图点击量为160万,分享到社交媒体超过5万次。在“4·25”尼泊尔地震中,词典将地震救助信息放置于首页,受众浏览超过1000万人次。截止到2016年12月,超过350万用户下载过有道汉藏词典的数据包,累计查词次数近800万次,平均每天的用户数近3000人。《西藏日报》以《有道汉藏词典成藏汉语学习窗口》为题报道;对口支援办的同事说,这是文化援藏的新途径;中国佛教协会会长学诚法师给这件事写下了“促进汉藏文化交流交融”的题字。
  筚路蓝缕、玉汝于成。本文记录了有道汉藏词典在研发、推广过程中的奔波,这是一款民间发愿,在互联网管理部门和行业组织推动下,传统的出版行业与互联网企业深度互动,共同打造的移动互联网应用产品,直接服务于汉藏文翻译需求,促进了汉藏文化的交流交融,探索了网络空间命运共同体与中华民族共同体融通共建的新路径。期间,民间与官方、传统与现代、技术与文化、草根与精英,均以无心插柳开始连接,在不谋而合中走向共识,又在神游冥想中砥砺前行。
  文中多次出现的“我”,并非个体,而是“有道汉藏词典和他的伙伴们”。
  一
  发愿于民间的无心插柳
  丁磊,他是网易公司的创始人和CEO,公司内部叫他丁老板,年纪相仿,认识多年,我习惯叫他老丁。
  2014年5月,我们见面邀请他参加当年的北京网络媒体红色故土行时,他说,刚刚从藏区回来,而且,还颇有感受。他发现,藏区苹果手机的持有率非常高,这让他产生了疑问,是不是藏区的人都很有钱呢?但随即,他也得到了答案,苹果手机自带藏文支持系统,而其他的系统,则无此功能或者不好用。在拉萨,他还被一位活佛问到了一个问题,手机上有没有好用的汉藏翻译软件。这个问题,让他这个老资格的互联网人坐不住了,答案是“还没有”,活佛问他能不能做,他说“能”,这引发了此后的故事。2014年5月,有道汉藏词典项目在内部立项,老丁抽调了20名技术骨干组成研发团队,自主投入200余万专项经费。
  此后的日子里,我总想从他口中听到些宏大叙事,可我多次听到的,就是“藏区需要一个好用的臧汉文翻译软件”、“我想让藏区的孩子能免费用上”,如此而已。项目手册上的丁老板说,“我去过西藏很多次,非常感慨于现在市面上没有一个权威的网络词典,能免费给藏区的孩子们用,这个词典应该是便于携带、随时可访问的,内容应该是权威准确的,有道词典有责任站出来,为藏区的朋友们做点力所能及的事。”
  周枫,网易有道公司CEO,也是个在公众场合找不到的互联网界名人。唯一和他的见面是沟通这款产品,他也基本没说话,而只是认真听我们的方方面面想法。依然是在项目册上,他表示“开发互联网藏语词典,对有道来说是一种社会责任,藏文化源远流长,是先民智慧的传承,现在我们做了藏汉互译,希望以后能上线更多的民族语种,让更多的人了解并爱上我们的民族文化”。
  这个产品到底有什么特点呢?一是数据权威,词条量大。藏语词库来自于民族出版社编著的《汉藏对照词典》。编纂组1991年9月的《前言》中说,“本词典收词八万余条,以现代汉语为主,词条除一般词语外,还收有一些常用的文言词语、成语、谚语、名言警句、方言词以及各学科的常用词汇。上述词语,相当一部分出自藏文的翻译出版物,译文具有一定的实践基础和群众基础。”根据民族出版社官方网站的介绍,“本书是建国以来最为完整,词条最丰富的一部汉藏对照词典,目前在全国汉藏翻译界都以此为标准。”
  二是自动识别,联想查词。可以自动检测输入语言,不需选择藏——汉或者汉——藏,即可实现智能互译。用户只需输入首字,词典即会自动展示多个智能匹配词语,提供人性化服务。
  2015年8月24日上午,我们在拉萨召开了首都互联网协会2015年度第19次新闻评议会(总第103次)暨网易有道汉藏词典建设座谈会,来自西藏自治区党委宣传部、区党委网信办、区党委宣传部藏文办、西藏日报社、西藏自治区编译局、西藏大学信息化研究所、民族出版社、北京市网信办、首都互联网协会、网易有道公司等单位的同事们参会。项目建设得到了各方的充分认可,专家们提出,要进一步加强藏语文信息关键技术研发和应用服务,提高藏语文信息资源开发利用水平,壮大藏语文信息产业实力,为促进西藏经济社会发展、促进民族文化交往交流交融、构筑中华民族共同体作出应有贡献。
  有道汉藏词典和他的伙伴们,使得通过移动互联网进行汉藏文的互译成为可能,它的研发、推广过程,绝非只是一款技术产品的市场经历,而恰好诠释了在互联网时代,在全球化的背景下,因地域遥远、文化多元而产生的距离,可以在“指尖”化解。传统意义上的“边疆”概念,正在因为互联网的出现而被解构,并在网络空间命运共同体中的语境中,被重新建构。
  老丁和西藏的缘分,也通过这词典在延伸。某天,突然接到他在易信上喊话,“哎,你说说,安卓系统上的汉藏词典该怎么做,怎么没人开发安卓的藏文支持系统呢”,我一时不只如何回答,而他的问询,也象是在自言自语。
  二
  推动于“伙伴们”的不谋而合
  老丁也给我派了任务,有没有办法在安卓系统里解决藏文字库的问题,苹果系统里有的。我欣然领命,但也很快意识到了,这活儿没那么简单。几次进藏,在西藏的寺院里,我见到过有“佛教熊猫”之称的贝叶经,那是一种有着2500多年的历史,用铁笔在树叶刻写的佛教经文。记得当时想,这“文物”在当代除了考古价值之外,是否还能承担起文化传承的使用功能。
  目前,在我国使用的少数民族语言有120余种,使用人口超过6000万。这些少数民族语言的集中使用地区大多经济相对落后,语言互联网化处于科研和部分产品的试运行阶段。以藏语为例,目前西藏地区97%的中小学已经实现双语教学,同时大约有800万人在使用藏语,但专业翻译工具却十分匮乏。西藏大学现代教育技术中心主任尼玛扎西20多年间一直领衔西藏藏文信息化研究队伍,“藏文信息化也是近20年来才出现的新现象,从简单输入法到各项标准的制定,从字处理到句处理、段处理,是一种社会需求的表现、技术发展的必然。”
  老丁给我出了个大题目。
  好在,“伙伴们”从各处来了。
  罗杰,民族出版社信息中心主任。又是中央单位,又是民族出版机构,日常和我们这北京市的互联网管理部门没啥联系,也从没打过交道。后来才知道,他这单位大名鼎鼎。成立于1953年,是我国唯一的国家级综合性民族出版机构,出的东西都很权威,就是不太好买,2015年,当我自己想在北京买一本的时候,发现书店里没有,想网购,也总是处于缺货状态。我手里的一本是西藏网信办的同事从拉萨买来寄到北京的,而且,据说这本词典在整个拉萨地区的新华书店库存量仅有几十本。认识了罗杰之后,从民族出版社的门市部总算买到了。
  现在回想起来,仍然觉得冒昧,拿着单位的介绍信,带着有道的同学,通过114和网上搜来的电话,还有从民委、宗教局辗转问来的名字,我们几个就像推销商似的上了门,撞进了人家的办公室。自我介绍,说西藏之行的感受,说老丁的心愿,说网信办的职责,本以为会被质疑一阵子,会有很多个为什么在等着我们。但他,还有藏文编译室的达多老师,老友相见般听我们说着,我甚至感觉他们已经等了我们很久了,等待着这样一件事的发生,而这种感觉的源头,就在那片雪域高原。之后的若干次商谈,大家都没有谈过这事该不该做,而是在商量,这事该怎么做得更好。罗杰在为拉萨召开的评议会提供的书面发言中表示,“作为传统纸质内容资源供应者,如何在新技术环境中继续发挥团队优势、内容资源优势,引领少数民族文化数字传播,向民族文字数字世界提供更为便捷的内容服务是民族出版社近年来一直思索和努力转型的重点。在北京市网信办的诚意推动下,也有感于网易深厚的社会责任感,并基于其在业界的卓越性,民族出版社总编辑张若璞和副社长才让加亲自指导,信息中心和藏文编辑室合力推进,先后在版权使用、电子数据、编码转换、数据格式、技术实现、数据审核、视觉设计、产品测试等方面与网易有道协作,最终完成产品上线。”在赴藏区考察的全程当中,海拔越高,他的状态越好,我们头疼眼肿,高反不已时,他则东跑西颠地拍照,访谈。他是出生在云南的藏族,怪不得。
  2015年4月的某天,我和网易有道的同学到民族出版社拜访藏文编译室的主任达多老师,他的办公室里堆满了书,几乎无处落脚,那天,他颇为兴奋指着桌上的高高一摞书说,这个马上就要正式出版了,很不容易,素材是从尼泊尔找回来的,这个人的年代比莲花生大师还早。我随手翻了下书,一个字也不认识;达多老师说了一个名字,我也没能听懂,就请他在纸上写了下来:“伯东班钦”。不久后,看到相关报道才知道这个人和这件事情有多大。伯东班钦(1376——1451),全名伯东班钦·乔列南贝尔杰哇,出生于今西藏日喀则地区定日县玉古地方,是藏族历史上的佛学大师、著名学者和大翻译家,为古今藏传佛教各教派公认和尊崇的一代宗师。据其传记和相关文献记载,伯东班钦的著作约为180部(一说160部),现存140余部。《藏族古籍经典系列丛书》之《伯东班钦全集》是民族出版社承担的全国少数民族古籍“十二五”重点出版项目,目前已出版的95卷本《伯东班钦全集》,“是目前仅存的、以本世纪中叶流失国外的140余部手写版孤本作为母本编辑整理的。全书共4000余万字,内容以佛学为主,兼具其他,涵盖了藏族传统文化十明学科,是一部藏族传统文化和藏传佛教百科全书式图书。”看到这则报道,回想起当时的感受,我在想,这位大翻译家如果生活在当今时代,他该如何做呢。他可能会编辑一个叫“词典”的东西吧,还得是在移动端的。
  “伙伴们”一直在努力。目前,在用的和在开发中的汉藏互译软件还有深圳市的援藏项目“汉藏语言桥”互译互学语言工具;西藏大学研发的阳光藏汉机器翻译系统和中国电信西藏公司、西藏大学、华为技术有限公司联合研发的天翼首款定制藏汉双语智能手机,都是由政府大力支持,国有力量主导,在不同领域均有重大突破,但同时也存在市场占有率不高,没有市场化互联网资源的进入,缺少移动端产品等的不足。
  看来,有道汉藏词典生而逢时,其发力点也恰好与相关产品的研发与应用有着不谋而合的互补。
  三
  行走在天边的神游冥想
  2015年9月,阿里,1500余公里的奔波,“我”和罗杰,还有一路陪同我们的西藏网信办的多吉,三个人象游商般,见到每个人,都要凑上去,看看人家用的什么手机,装没装有道词典,汉文、藏文、身体语言都用上了。我的微信上也多了两个阿里的僧人朋友,他们是有道汉藏词典的新用户。
  如费孝通先生1936年6月3日在《桂行通讯尾声》中表述的“我们所要贡献的,是什么观点呢?简单来说,就是我们认为文化组织中各部分之间,具有微妙的搭配,在这搭配中的各部分并没有价值,只有在这搭配里才有它的功能。所以要批评文化的任何部分不能不先清理这个网络,认识它们所有相对的功能,然后才能拾得要处。”费先生文中的“网络”,显然不是指互联网,但当下的互联网,确又实实在在发挥着这种“搭配”的作用。
  扎西丹巴,科迦寺的小僧人。公元996年,仁钦桑布创建了科迦寺,位于西藏自治区阿里地区普兰县科迦村。仁钦桑布,是一个藏传佛教人物,据史料记载,他一生三次往返印地、西藏,翻译、校订显教经典17部、论33部、密教经典108部,把他们收录在了藏文大藏经甘珠尔与丹珠尔之中。人们将他之后编译的密乘称为“新密,而此前的称为“旧密”。 由于仁钦桑布的成就,后人给了他“大译师”的尊称,初看到“大译师”这三个字时,我的高反迅速加重,呼吸都有些急促了,跨越千年,我们竟然做着同一件事,文化的互通,只是载体不再是经书,而是互联网。8月25日,我们与科迦寺的小僧人扎西丹巴进行了交流。他今年18岁,初中三年级毕业,刚进寺院学佛3个月,用苹果手机,但是不知道有道汉藏词典,他平时用翻译桥;我们帮他下载了有道汉藏词典,并加了微信,他随后发来了自己试用的截屏图,他输入了“希望”,得到了翻译结果,他说“很好用,谢谢”。科迦,在藏中是“定居”的意思。通过交谈了解到,这个寺院有13个僧人,他是年龄最小的一个。我们与寺院主持欧珠嘉措进行了交流,他表示,僧人中用苹果手机的居多数,对汉藏文互译的需求很大。
  扎西,托林寺的僧人。托林寺坐落于阿里地区扎达县城西北的象泉河畔,始建于北宋时期,是古格王国(公元10——17世纪)在阿里地区建造的第一座佛寺,古格国王在托林寺为仁钦桑布建立了专门的译经场所。8月26日,我们在托林寺与僧人扎西进行了交流,他用苹果手机,也下载了有道词典,但是没有更新软件系统,因而没有增加汉藏功能,我们现场帮助他下载了新系统,他也通过微信发来了使用情况的截屏图,他输入了“您好”,得到了翻译结果,他说“很好用,谢谢”。他还提出了问题,为什么安卓系统的没有这项功能?我们也进行了解答,目前只能在苹果系统中用。
  这种远在天边又近在眼前的感觉,让我和罗杰、多吉都产生了某种异常的兴奋。我们能有一个机会,把自己创造的文化产品,送到了最终用户手中,而这个用户,是我们跨越了万水千山才得以见到的。那天,我们兴奋地聊到了很晚,关于产品,虽然我们到了阿里,也见证了这款软件是很有需求的,是否能够以西藏为中心,将词典的推广围扩大到四川、云南、甘肃、青海四省藏区呢;可否在民族大学、西藏中学等教育机构进行推广呢;可否建立联合实验室,从编码规范、词量丰富、界面优化等方面入手,提高用户满意度呢;可否在现有苹果系统版本的基础上,开发安卓系统的适用版本呢。这些问题,让我们兴奋地讨论到很晚,我们还还相约,要把这件事,用自己的方式记下来,写出来。
  在阿里期间,我们还与扎达县网信办的同事索南加措进行了交流,他用苹果手机,也下载了有道词典,但不知道有道词典中已经有了汉藏翻译功能,我们给他演示了如何使用,他表示非常好用,也会向同事们推广。他平时用阳光藏汉机器翻译系统。因为工作原因,索南加措每年要跑很多次古格王朝遗址,他可以成为世界上最好的古格王朝遗址摄影师,我建议他不妨开个公号给大家分享,因为,他实在是离得太近了;而阿里,又实在是离我们太远了。现在,因为想看阿里的风光,我已经订阅了“网信扎达”的公号,那里面的很多绝美照片,我想是出自他手的。
  命运共同体是否能够形成,取决于文化是否具有包容性,费孝通将其作为实现文化自觉的一个入口,他曾说:文化的包容性就是吸收其他文化的能力和态度。以语言这个文化要素为例,一个人能说多种语言或多种方言,就表明他的文化包容性比较大,或是说他在语言上能包容多种语言或方言。他虽然没有到过西藏,他虽然自认为对互联网是门外汉,但无疑,他的文化自觉理念,在西藏,在汉藏有道词典这样一个互联网产品上,正在得到践行。
  阿里,远在天边,那里的藏民也在用手机,上微信,在这个意义上,我们并不遥远。可是,微信上的小僧人,和我当面与之交谈的是否是一个人,其实很难判断。此后,也再未有交谈,但我知道,他在线,因为有了这个词典,他正在和外面的更大的世界建立连接。
  结语
  2015年,是费孝通先生大瑶山调查80周年。4月的某天,小雨中,我辗转来到了位于江苏省苏州市吴江区七都镇开弦弓村南村的费孝通江村调查纪念馆。村口竖着高大的广告牌“纪念费孝通先生诞辰100周年”,显然是2010年立的,彩色的画布已经变得灰白了。到了门口,没见看门人,进院,迎面一块大石头上刻着“费孝通江村纪念馆”几个字,费先生的全身坐像立在池旁,笑容可掬,馆里没开灯,借着室外的光线,头贴展窗,模糊地看了一遍,展品的时间显然和村口的大广告牌一样,也停在了2010年。另有一间展室,铁将军把门,未得进入,绕着观景池走了一圈,粉墙黛瓦,荷花静开;直到出来,也未见看门人。一墙之隔,就是开弦弓村委会。真是安静呀,我把这个感受分享给了几位熟悉的老师,他们也颇为感慨。
  我想,总算没有空手来。2016年是费孝通先生江村调查80周年,至少,有道汉藏词典和他的伙伴们,可以为这个题目提供些新的田野实践。无论是贝叶经、伯东班钦、仁钦桑布、“我”,还是《汉藏对照词典》,或是有道汉藏词典,都是在为不同文化形态之间的互通与共享,不同民族之间的交往、交流、交融架桥铺路,而这座桥、这条路的力所能及之处,也就是传统意义上的有形的“边疆”所到之处。
  本文讲了很多故事,故事是属于昨天的。2016年11月30日,习近平同志在中国文学艺术界联合会第十次全国代表大会、中国作家协会第九次全国代表大会开幕式上说,坚定文化自信,离不开对中华民族历史的认知和运用。历史是一面镜子,从历史中,我们能够更好看清世界、参透生活、认识自己;历史也是一位智者,同历史对话,我们能够更好认识过去、把握当下、面向未来。

最新文章
热门文章