站內搜索

彝學研究 Yi Study

當前位置: 首頁 > 彝學研究 > 彝學研究論文精選

論貴州古彝文編碼字符集構建

作者:吳勰 祿玉萍 王明貴 發布時間:2023-07-16 原出處:《中文信息學報》2014年4期 點贊+(
摘要:依托彝文古籍文獻開展古彝文字符整理和規范研究,建立古彝文編碼字符集有很高的要求和極大的工作量。這項工作有助于實現古彝文規范化應用,為古彝文信息技術開發提供基礎保障。實現這一構想:需要最大限度地搜集整理古彝文字符,廣泛聽取彝文專家建議和意見,經過充分的科學論證,對搜集的古彝文字符進行甄別、查重、篩選和擇定,剔除大量古彝文異體字形,在此基礎上規范古彝文的字量、字形、字音和字序,實現計算機技術處理古彝文字符信息的規范化。
關鍵詞:古彝文;編碼字符集;彝文信息處理
古老的彝族,還能有多少東西能在時代大潮中存留下來,也許不會有明確的答案,但我們可以盡力去為她留存一些有價值的文化,這就是彝 族 人 網的價值所在。

image.png8na彝族人網(彝人網)- 彝族文化網絡博物館

1 必要性

彝族是貴州世居少數民族,擁有自己的傳統語言文字即古彝文,它是自成體系的成熟文字符號系統。我國彝文分為古彝文(或傳統彝文)和規范彝文兩種,彝語分為東部、南部、東南部、西部、中部和北部6大方言區,主要在云南、四川、貴州、廣西、重慶5個省區市等民族地區使用。古彝文是在彝族內部世代流傳使用的超方言表意文字;規范彝文是1980年經國務院批準并頒布的《規范彝文方案》,該方案規定了彝語用北部方言區的圣乍方言為基礎方言, 以喜德語音為標準音。在民間搜集的上萬個彝文中選擇規范出了819個基礎字符和代次高調符號的345 個字, 加上一個替音符號一共1 165 個彝文字符。規范后的彝文為表音的音節文字, 不論其詞義有何不同, 只要讀音相同, 均用一個字表示[1]。規范彝文在四川涼山彝族自治州北部方言區推行使用至今已有30多年,得到了廣泛普及應用, 對民族地區各項事業的發展起到了積極的促進作用。由于該套文字是表音文字,與傳統的表意古彝文差異較大,無法在其它方言區使用。貴州是古彝文發祥地,在貴州范圍內使用的彝文屬東部方言,是世代流傳的古彝文字。8na彝族人網(彝人網)- 彝族文化網絡博物館

彝族先民們用古彝文創作了數以萬計的古籍文獻,貴州擁有的傳世彝文古籍文獻是全國數量最多、質量最好的優質文獻。彝文文獻記錄的內容包羅萬象,富藏著大量的民族歷史文化信息,涉及文獻學、歷史學、語言學、文字學、文學、天文學、醫學等多個學科,其中彝文是古籍文獻的主要載體,同時也是彝文古籍文獻的主要內容之一。隨著現代信息技術的飛速發展,各種文字信息技術產品日新月異。而當下貴州古彝文的交流和應用仍停留在“筆書于紙”的傳統媒介之上,與現代數字化電子信息傳送方式接不上軌,遠遠落后于現代信息社會的時代步伐。這種窘困現狀與快速發展的現代信息技術局面格格不入,明顯不利于古彝文自身內在發展需求,不僅滿足不了彝語文在學習、應用、研究、傳承等方面的實際應用需求,更是把彝語文推向瀕危語種境地。信息時代背景下的貴州彝族語言文字保護、傳承面臨前所未有的巨大挑戰,同時也賦予其新的時代內容和任務。據此,開展古彝文信息化建設不僅是信息時代的新任務,更是現代社會對彝語文學科建設和發展提出的客觀要求?,F階段,開展古彝文字符整理和規范研究工作,建立信息交換用的古彝文編碼字符集將為貴州古彝文信息化建設奠定基礎。8na彝族人網(彝人網)- 彝族文化網絡博物館

目前,基于貴州古彝文信息處理的實際需求,依托彝文古籍文獻,進行全面、系統的古彝文字符整理和規范化研究工作,建立科學、合理、標準、規范的貴州古彝文編碼字符集,為古彝文信息技術開發提供基礎保障,成為目前貴州古彝文信息化建設的首要工作。首先需明確“字符集”和“編碼”兩個概念,任何文字或圖形符號必須經過編碼才能被信息處理設備識別并處理,編碼字符集標準是一切文字信息處理的基礎[2]。本文中“古彝文字符集”指在貴州境內使用的古彝文字、標點符號、圖形符號、數字符號等古彝文信息交換所需的多個字符的集合;古彝文字符集采用國際標準ISO/IEC 10646編碼,它支持現今世界上各種不同語言的書面文本的交換、處理及顯示,開展古彝文ISO/IEC 10646國際編碼字符集建設以滿足古彝文在跨語言、跨平臺上與其它文種進行同臺文本轉換、處理的要求。本文就信息交換用古彝文編碼字符集所需的古彝文字符進行全面整理和規范,以滿足古彝文信息技術開發的需求,為古彝文信息化建設奠定基礎。8na彝族人網(彝人網)- 彝族文化網絡博物館

2 整理古彝文字符

新中國成立以后,隨著貴州彝文古籍文獻的整理、翻譯和研究工作的推進,彝語文工作者深感對文獻里的古彝文字符進行整理十分緊迫和非常必要。經過學界多年以來的艱苦努力,古彝文字符搜集、整理工作取得斐然成績,這一驕人成果主要體現在《彝文字典》(增訂本)的編纂和彝文字集的規范整理上。在彝語文前期整理和研究成果基礎上,最大限度地搜集整理古彝文字符,廣泛聽取彝文專家建議和意見,經過充分的科學論證,對搜集的古彝文字符進行甄別、查重、篩選和擇定。8na彝族人網(彝人網)- 彝族文化網絡博物館

2.1 選字范疇

2.1.1 字源藍本8na彝族人網(彝人網)- 彝族文化網絡博物館

《簡明彝漢字典》(貴州本)由貴州省彝學研究會、貴州省民族事務委員會少數民族語文辦公室、貴州民族學院彝文文獻研究所、貴州省畢節市彝文翻譯研究中心(原畢節地區彝文翻譯組)等多家彝學研究機構聯合編寫而成,共搜集、整理出民族地區常用古彝文正體字2 194個、異體字3 923個,標注了貴州境內四個有代表性的參考音點[3]。從1991年出版以來,該字典里的常用彝文字符(正體字)已被貴州各地彝族同胞所接受,異體字也成為彝文專家進行文獻翻譯時參考、選用較多的字符,目前該字典成為彝語文教學、文獻翻譯和研究的常用工具書。古彝文規范整理以該字典為基礎字源藍本,既符合古彝文的實際應用需求,也符合古彝文進一步規范整理的必要需求。此外,《彝文字釋》一書,是根據貴州省赫章縣阿侯布摩世家相傳的《同音字典》注音、剖析、釋讀集成的,共6 815個單字,300個音節,以國際音標注音,由彝文字義轉換為漢文字義。該書選擇列舉1 456個單字,說明先人創造彝文字的構思理念和方法,同時把同音字列于各個音節之后[4]。該書為近幾年貴州彝語文最新研究成果,形象生動、科學合理地講解了古彝文的象形、指事、會意、形聲等造字方法,以及同音假借用字情況,且列舉的單字為基本常用字形,以該書為選字補充藍本是科學可行的。8na彝族人網(彝人網)- 彝族文化網絡博物館

2.1.2 選字范本8na彝族人網(彝人網)- 彝族文化網絡博物館

目前,貴州已整理翻譯出的傳世彝文文獻無論是數量還是質量均走在全國之列,翻譯整理出版的傳世經典文獻影響深遠,例如,《西南彝志》、《彝族源流》、《宇宙人文論》、《土魯竇紀》等,不僅為民族歷史、傳統文化等研究提供重要的文獻資料,同時古彝文作為古籍文獻的主要載體,也是彝文古籍文獻的重要內容。因此,依據傳世彝文古籍文獻開展古彝文字符整理成為建立古彝文字符集的基本要求?!兜岽ㄇ鹨臀淖旨べF州卷》是由滇川黔桂彝文協作組抽調貴州各土語區的彝語文專家,廣泛搜集貴州范圍內彝文古籍文獻中的單字,按音位系統和同音字分組排列,注明其義項匯編而成,共搜集整理古彝文字符達17 650個[5]。這部字集對彝文字符搜集整理是空前的,列出了彝文古籍文獻資料中所用的絕大部分字符,這為全方位開展彝文異體字的整理工作提供了十分珍貴的選字范本。8na彝族人網(彝人網)- 彝族文化網絡博物館

2.1.3 增補字符8na彝族人網(彝人網)- 彝族文化網絡博物館

據估計,貴州境內彝文古籍文獻所用的古彝文字符包括異體字上萬個,目前還有部分未系統整理,這部分字符由長期從事彝文文獻翻譯研究的資深彝文翻譯專家所掌握,這些字符在彝文文獻整理、翻譯工作中時常用到,因此完全有必要把這部分字符也列入字符集的規范整理范圍,使古彝文選字工作向古籍文獻的廣度和深度拓展,這樣方能確保古彝文字符集所收字符的完整性和全面性。8na彝族人網(彝人網)- 彝族文化網絡博物館

2.2 整理常用字符

image.png8na彝族人網(彝人網)- 彝族文化網絡博物館

隨著古彝文字符應用領域擴展和彝文文獻整理翻譯工作的深入開展,《簡明彝漢字典》里的2 149個古彝文常用字符,已不能滿足各行業、各領域對彝文用字的需求。在基本常用字符基礎之上,增加一定數量的常用字符已是大勢所趨。8na彝族人網(彝人網)- 彝族文化網絡博物館

常用字符整理需在已有彝語文研究成果基礎之上進行,不能盲目隨意添加字符。近年貴州彝文字符整理最有價值、最新的研究成果就是《彝文字釋》,該書編著者王子國先生從事彝文文獻整理翻譯研究多年,該書所例舉的1 456個彝文單字不僅闡述先人創造古彝文字的構思理念和方法,也是彝文從遠古創制時期至今一直使用的傳統字符,是最基本的常用字符。因此,這本書是制定貴州古彝文字符集不可缺少的范本,其重要性不可忽視。需要指出的是并不是全部把該書里羅列的常用字符全部收入,其中有一部分與《簡明彝漢字典》里的字符相重復,需要甄別、剔出重復的字符。此外,該書里舉例用字里的字符也不是一味不采用,需根據文字的字形、字義等屬性內容,選擇性地列入常用字符的整理范疇。8na彝族人網(彝人網)- 彝族文化網絡博物館

在上述兩本常用字符藍本基礎之上,開展古彝文常用字符整理工作。在對常用字符進行全面、規范整理時,需對沒有涉及的常用字符適當進行增補。通過古彝文常用字符整理工作,建立科學、完善的古彝文常用字符集以滿足彝文日常應用的需求,成為我們目前的工作重心,這關系到古彝文信息技術開發有無質量保證的大局。8na彝族人網(彝人網)- 彝族文化網絡博物館

2.3 整理異體字符

西南各地區使用的古彝文原本是統一的,在千百年的流傳中形成不同的方言,各方言區又形成不同土語區。貴州境內流傳使用的彝語演化為黔西北次方言和盤縣次方言,分為水西土語、烏撒土語、盤縣土語,土語區下又分化為黔西次土語、畢節次土語、大定次土語、威寧次土語、赫章次土語、恨可次土語、盤南次土語、盤北次土語等多個次土語區[6]。由于貴州境內多個土語區的彝文差異較大,造成了貴州境內擁有上萬個古彝文字符,古彝文異體字繁多的現狀一直以來都是制約古彝文統一規范使用的困境,也是實現古彝文信息化的瓶頸。我們不可能把所有的字符均收錄到編碼字符集中來,這樣就有違對古彝字符進行規范整理的初衷,是不可行的。只有經過嚴格規范整理的異體字才能進入編碼字符集,這樣才能真正整理出符合古彝文信息處理需要的字符。8na彝族人網(彝人網)- 彝族文化網絡博物館

2.3.1 整理原則8na彝族人網(彝人網)- 彝族文化網絡博物館

(1) 最大限度剔除異體字數量8na彝族人網(彝人網)- 彝族文化網絡博物館

在彝文異體、異形字中每組異體字數基本在2個以上,字數在10個以上的比比皆是,有的甚至多達50多個。彝語文長期應用實踐證明,龐大的彝文異體字數極大地擾亂古彝文的用字規范,不僅增加彝語文學習難度,更不利于彝文的傳承和弘揚。因此,異體字整理的首要任務和工作內容就是盡可能剔除龐大的異體字數,這樣才能盡可能保證古彝文用字的規范化。8na彝族人網(彝人網)- 彝族文化網絡博物館

(2) 選擇使用頻率高的字形8na彝族人網(彝人網)- 彝族文化網絡博物館

在同組異體字形中,選擇在日常應用中使用頻率高的字形,同時兼顧“字形美觀、便于書寫、符合用字規律”等具體因素,高頻率字形規范后便于學習,不會增加學習彝文的記憶量。8na彝族人網(彝人網)- 彝族文化網絡博物館

(3) 充分遵循古彝文的構字規律,選擇結構合理,筆畫簡易的字形。8na彝族人網(彝人網)- 彝族文化網絡博物館

在異體字形整理中根據古彝文的構字規律,盡量選擇字形結構合理、筆畫線段簡單易寫的字形,適當放棄字形中有曲筆和弧形筆畫的字形,使整理出的彝文字形結構間架方正,達到規范整理的要求。8na彝族人網(彝人網)- 彝族文化網絡博物館

image.png

圖 1

對增加筆形、筆畫的異體字形組,該類異體字形組的讀音和義項相同,僅是小范圍個別筆形筆畫的增減,字形結構沒有改動,對這類異體字形盡量選擇筆畫簡易的字形(見圖1)。8na彝族人網(彝人網)- 彝族文化網絡博物館

上例異體字形現象較為單純,整理也不復雜,直接明了。但此種情形在異形字中屬于少數。通常在異體字形中字形結構復雜,多彎曲、扭翹筆形筆畫情形較為普遍,也是字形整理的重點和難點。鑒于古彝文異體字形繁多、不規則筆形、筆畫使用混亂的狀況,為便于書寫、學習和應用的用字需要,通常放棄扭翹、多彎曲的筆形筆畫,使用簡潔、規范的筆形筆畫和字型結構合理的字形,以確保古彝文用字的規范化,達到字形整理的目標和要求。8na彝族人網(彝人網)- 彝族文化網絡博物館

2.3.2 整理方法8na彝族人網(彝人網)- 彝族文化網絡博物館

在異體字整理中需采取一套科學合理的整理方法來完成這項工作,首先對比各土語區的異體、異形字,把各土語區間的異體字進行分組,剔出同組異體、異形字和大量的同音異寫字形,接著對字形進行甄別、查重、篩選,最后擇定字形。然后對選定字形基本屬性進行仔細梳理,固定每個字符的字義、字音。8na彝族人網(彝人網)- 彝族文化網絡博物館

3 建立古彝文標準字形

古彝文字形規范是古彝文規范化研究的一個重要方面,同時是《古彝文字符集》研制的一項主要內容,也是我們面對計算機處理古彝文信息的現實問題。它是指計算機用字的古彝文印刷字形規范,就是要確定每個古彝文的標準印刷字形,具體包括古彝文的筆畫、部件、結構、筆順和整字的形體等。8na彝族人網(彝人網)- 彝族文化網絡博物館

建立古彝文標準字形需在古彝文手寫字體特征基礎之上,借鑒漢字印刷字形規范整理的具體做法: (1)注重整字的穩定性和系統性;(2)筆畫、部件的確立要科學;(3)不同的筆畫、部件間要保持足夠的區別度;(4)保持同筆畫和部件要高度統一[7]。8na彝族人網(彝人網)- 彝族文化網絡博物館

首先,在古彝文發展歷史演變中,文字不穩定因素一直伴隨,有些文字的形體出現了嚴重訛化,要克服字形中的變異性因素,注重保持整個字形的穩定性和系統性,以確保印刷字形與傳統字形的一致性,不能出現歧異字形,這是建立古彝文標準字形的根本要求。8na彝族人網(彝人網)- 彝族文化網絡博物館

其次,按照“利于構字、便于書寫和符合古彝文的書體審美”標準來規范古彝文基本筆畫,針對古彝文字形中大量的曲形、彎形、弧形及其他不規則筆形,按照“彎曲有度、過渡自然、線條流暢”書寫標準來規范,務必保證確立筆畫是科學的。同時構字部件的確立也要有理有據,做到符合古彝文表意功能的基本要求。此外,筆畫和部件是構字的基本因素,不同筆畫、不同部件間要有足夠的區別度,否則就會降低筆畫、部件構字的基本功能,甚至還會混淆不同的字形,難以辨認和識讀。8na彝族人網(彝人網)- 彝族文化網絡博物館

第三,同筆畫的筆形和同部件的形體高度統一,是確保建立古彝文字形標準規范的前提和基本保證,若不同字形中同筆畫的筆形和部件的形體不一致,那它們構成的字形就無法實現統一規范化和標準化。8na彝族人網(彝人網)- 彝族文化網絡博物館

最后,古彝文的基本字形結構、書寫筆順以及構字筆畫、部件間的距離是制約字形規范的重要因素,要保證字形的基本結構和傳統書寫筆順的正確性,以及字形中筆畫、部件構字要件之間的距離要準確,正確處理好字形中的細微差別,才能確保古彝文字形在計算機交際中傳遞信息的準確性。8na彝族人網(彝人網)- 彝族文化網絡博物館

4 規范古彝文字符

古彝文現代化須通過字符的規范化來實現,即規范古彝文字符系統,也就是通常所說的文字四定(定量、定形、定音、定序),對擇定的字符進行科學合理的規范化整理,實現計算機技術處理古彝文字符信息的規范化。8na彝族人網(彝人網)- 彝族文化網絡博物館

(一) 字量。目前整理出5 000多個古彝文字符,其中常用字3 000余個,其余為整理彝文文獻所需的異體字形,經資深彝文專家評估能滿足古彝文信息處理的基本需求。8na彝族人網(彝人網)- 彝族文化網絡博物館

(二) 字形。根據古彝文字體特征,在充分尊重和滿足古彝文字形使用習慣的前提下,按照“平、正、圓、直、均”原則規范古彝文標準印刷字形,真正做到字有定形來規范古彝文的應用。8na彝族人網(彝人網)- 彝族文化網絡博物館

(三) 字音。貴州各土語區的方音差異較大,只能尊重各土語區的讀音,采用各土語各按方音念讀,同時采用國際音標來準確記錄古彝文讀音。8na彝族人網(彝人網)- 彝族文化網絡博物館

(四) 字序。為滿足古彝文信息技術開發需求,古彝文字符采用筆畫和讀音兩種方式來排列字符,根據字形的起筆筆畫來歸類,再按筆畫數從少至多依次排序;音序是按照古彝文國際音標音位系統進行排序,便于查閱和使用。8na彝族人網(彝人網)- 彝族文化網絡博物館

image.png

圖2 古彝文字符集樣例: 以部彝文字筆畫排序為例

5 價值與意義

目前,鑒于貴州彝語文信息化建沒有基本標準的現狀,開展古彝文編碼字符集標準研制工作是實現貴州彝語文信息化的基礎性工作,該項工作對發展貴州彝語文信息化產業具有顯著的實際應用價值和長遠的社會意義:8na彝族人網(彝人網)- 彝族文化網絡博物館

首先,為貴州彝語文信息化產業的發展提供科學、實用的基礎標準,也將填補貴州古彝文信息技術的基礎標準空白,為彝語文信息化產業的規范化和標準化建設奠定堅實基礎。古彝文字符集標準制定不僅將成為貴州古彝文信息技術開發的基礎標準,更是發展古彝文信息產業的基本保證,同時整個彝文信息技術應用產品也將在該標準基礎上開發出來。8na彝族人網(彝人網)- 彝族文化網絡博物館

其次,該字符集將用于古彝文信息處理系統的開發,這將改變古彝文“筆書于紙”的手工傳承方式,將歷史性實現古彝文字符的數字化應用,使彝語文獲得新興的應用和傳承方式,也將為保護彝文古籍文獻提供更加科學的技術支撐,特別是對彝文古籍文獻的整理出版提供方便快捷的工具,及時滿足學習和傳承民族文化的需求,取得經濟效益的同時獲得更多的社會效益,為科學發展和構建和諧社會探索了新路子。8na彝族人網(彝人網)- 彝族文化網絡博物館

最后,隨著古彝文編碼字符集的普及和推廣應用,必將對民族地區社會經濟建設和民族文化產業發展產生積極推動作用,并將帶來顯著的經濟價值和社會效益,對促進民族地區現代化和信息化建設進程具有重大的現實意義。8na彝族人網(彝人網)- 彝族文化網絡博物館

6 結語

貴州古彝文信息化工作起步較晚,同時由于貴州古彝文字符龐雜,字符整理工作難度大,又受工作經驗、人員調配、經費投入等客觀因素的綜合影響,現階段只能完成《信息技術 古彝文編碼字符集·基本集》的研制工作,以期能滿足古彝文數字化日常應用的需要?!顿F州古彝文編碼字符集·基本集》將作為我國研制古彝文編碼字符集一部分,與云南、四川、廣西、重慶等省區市的古彝文字符共同構成古彝文編碼字符集,并形成申請國際標準ISO/IEC 10646的正式提案,提交國際標準化組織ISO,實現古彝文編碼的國際標準化。8na彝族人網(彝人網)- 彝族文化網絡博物館

此外,今后隨著貴州彝文古籍文獻數字化工作的全面推進,需在現階段完成的基本字符集基礎之上,深入開展古彝文編碼擴展集建設工作,完成整理彝文文獻的計算機大量用字需求,這將是我們下階段的工作重點和奮斗目標。8na彝族人網(彝人網)- 彝族文化網絡博物館

古老的彝族,還能有多少東西能在時代大潮中存留下來,也許不會有明確的答案,但我們可以盡力去為她留存一些有價值的文化,這就是彝 族 人 網的價值所在。

參考文獻:
[1] 沙馬拉毅.《規范彝文方案》推行30年實踐效果述評[J]. 西南民族大學學報·人文社科版,2010(8): 29.
[2] 代紅,陳壯.中文信息技術的基礎標準與中文編碼字符集的國際標準化[J].信息技術與標準化,2008(7): 37.
[3] 貴州省彝學研究會,貴州省民族事務委員會民族語文辦公室,貴州民族學院彝文文獻研究所,貴州省畢節地區彝文翻譯組編.《簡明彝漢字典》(貴州本)[M].貴陽: 貴州民族出版社,1995: 1-4.
[4] 王子國.《彝文字釋》[M].貴陽: 貴州民族出版社,2009: 1-2.
[5] 滇川黔桂彝文協作組編.《滇川黔桂彝文字集》[M].昆明: 云南民族出版社,2004: 891.
[6] 朱文緒.《彝語方言學》[M].北京: 中央民族大學出版社,2001: 45-46.
[7] 連登崗.漢字字形系統與印刷字形規范[C]//厲兵 主編.《漢字字形研究》.北京: 商務印書館,2004: 52-55.

原載:《中文信息學報》2014年4期;文字來源:參考網。
作者單位:畢節學院彝學研究院,貴州 畢節 551700。

【聲明】本文轉自公開互聯網平臺,并經彝族人網排版發布,旨在公益宣傳彝族文化和彝區發展。文章僅代表作者觀點,不代表本網完全贊同或者證明其信息真實性。文章版權歸屬作者和原媒體,如著作權人不愿意在本網發表或文章有問題,請聯系我們進行刪除或修改。特此向作者和原媒體致以敬意和感謝!  (了解更多…)

所屬專題:

彝族學者王明貴
台湾佬?偷拍?娱乐?中文网