第 84 期 2006年04月號 CBETA 發行

CBETA首頁 電子報首頁 +電子報信箱



編者的話

各位親愛的讀者,您好:

CBETA 除了不斷新增經文資料,目前也配合相關單位在進行「古經錄及現藏目錄」專案。由於該專案日前密集趕工,導致本期電子報延後出刊,敬請見諒。

本期「一步一腳印——CBETA 經驗分享」即是敘述此一專案所遭遇到的「千字文」問題,以及提出我們所構想的「千字文資料庫」。

祝 吉祥如意!

電子報編輯 敬上


各組最新進度

◎輸校組

  • 卍續藏常錯字檢查:X14-15
  • 卍續藏簡單標記Ⅰ:X12-13
  • 卍續藏簡單標記Ⅱ:X12-13
  • 卍續藏句讀:X57n0969.txt
  • 網路校對發出:B11, B13
  • X61n1165 SM、X2R
  • 產生〈CBETA 經文更新列表 2006/03/06-2006/03/31〉
  • X34-X41 AB比對

◎研發組

  • sm=>xml:X09, X10, X61, X13, X12
  • 整理歷年成果表。
  • 大正藏 XML 針對 <p>, <lg>, <item> 三種 element 全面加上 id, 修改 add_id.bat,寫比對程式 comp.py。
  • 簡單標記 轉 XML 程式 basicx.bat 修改,簡單標記新增 <K> 標記,轉成 XML <mulu type="科判">。

◎標記組

  • 大正藏
  1. 修訂經文用字、XML標記、新式標點(咒語小注)
  2. 修訂悉曇字 T18-21,T46,T54
  3. 標記 p, lg, item 加 id 屬性,lem 加 wit 屬性
  4. CBETA2006-04光碟作業:toc目錄比對、normal版比對、介面檢測等
  • 卍續藏
  1. 處理 X11n0268「楞嚴經集註」科文項目簡單標記。
  2. CBETA2006-04光碟作業:normal 版比對、介面、光碟檢測。
  3. X56, X58 校勘條目輸入。
  4. 缺字 unicode 檢查完成,共計 7800 筆。
  5. X61n1655、X11、X13 XML 標記作業完成。

◎文字組

  •  修訂缺字資料庫 unicode 問題。

◎網資組

  • 整理經錄資料
  • 整理千字文
  • 試寫經錄程式,用 Perl + MySQL
  • 寫 CBETA 電話客服系統
  • 小改 cbreader 版本
  • 產生新版光碟的 toc 目錄

 ◎新標專案

  • 個人新標認領開放進度
    • 網頁個人認領開始:4月24日
    • 「志工登記表網頁」已修訂
    • 準備說明文件,提供網頁下載離線使用。
  • 作業狀況
    • 志工團體或個人:21
    • 已認領:503部,3212卷,18289
    • 收回:37部,98卷,556
    • 完成:14部,16卷,70



一步一腳印 -- CBETA 經驗分享

■千字文資料庫

《千字文》是古時候的童蒙讀本,具有普遍性;又當中一千字不重複,具有獨特性。因此前人在整理浩瀚佛典時,千字文經常被用來做為一種計數及排序的單位,也就是今天在許多藏經目錄中所記錄的「千字文函號」。

 
比如我們在《高麗藏》目錄看到以下記載:

】函入十卷 入紙十一牒九張
8 小品般若波羅蜜經(後秦龜茲國三藏鳩摩羅什譯)

與目錄對應的內文在每卷開頭標題之下均會標上所屬的「千字文函號」,如:

小品經序  釋僧叡  

可以把「函」想像成一個固定容量的書箱,一函一般可以容納十卷經文,若是短小的單卷經就有可能塞進十數卷。也就是說,一千函至少可以裝一萬卷,一萬卷的容量也的確夠了。《高麗藏》從 天~務,用了 653 函;《龍藏》從 天~機,用了 724 函。
 
在我們實際接觸《千字文》時,本以為真的有固定的一千字,也以為真的這一千字絕不重複,但卻發現事實並非如此簡單。一篇文字在歷史上長時期的被抄寫、印刷,累積到現在的《千字文》資料,其用字不一定一致,甚至還常發現重複用字。

之所以如此,主要原因在於「異體字」及「簡化漢字」,次要原因在於對千文含義有不同理解而改字,也有為了避諱而改字,也有可能是莫名其妙的寫錯。等於說,我們現在面對的不單純是一千個固定形狀的用字,而是一千組「異體字」以及其它各種可能的變化。

在電腦應用上,如果我們想提供一個「千字文函號」的查詢界面,那麼將底下這樣的資料建立成「千字文資料庫」是不錯的點子:

 

天地玄(𤣥)() 宇宙洪荒 日月盈昃(𣅳) 辰宿列張 
寒來
()暑往() 秋收()冬藏() 閏()()成歲(𡻕) 律呂(𠮥)調陽 
雲騰致雨 露結為
()霜 金生麗水 玉出崑(昆崐)() 
()()巨闕(𨷂) 珠稱()夜光 果()()李柰() 菜重芥薑() 
海鹹
(咸醎)河淡() 鱗潛(潜濳[-+(*)])羽翔

龍師()火帝 鳥官人皇 始制()()字 乃服衣裳 
推位讓國
() 有虞陶唐 弔()民伐罪 周發()()湯 
(𡋑)朝問道 垂(𡸁)拱平章 愛育黎()首 臣伏戎羌(𦍑) 
遐邇
()()(軆体) 率賓()歸王 鳴鳳在樹() 白駒食場() 
化被草
()木 賴(頼頰)及萬()

()此身髮(𩬊) 四大五常 恭惟鞠養 豈敢毀傷 
女慕貞
()(潔烈[-+((*)/)] 男效()才良 知過必改 得能莫忘 
()談彼短 靡恃己長 信使可覆() 器()欲難量 
墨悲絲染
(𣑱) 詩讚(讃贊)羔羊

()行維賢 剋(尅克)念作聖 德()建名立 形端表正 
空谷傳
()() 虛(虚虗)堂習聽() 禍(𥚟)()(𢙣)積 福緣()善慶 
尺璧非寶
(寳宝) 寸陰()是競(𥪰) 資父事君 曰嚴與敬 
孝當竭力 忠則盡命 臨深履薄 夙興溫
()() 
似蘭斯馨 如松之盛 川流
(𣴑)不息 淵澄()取映() 
容止若思 言辭
()安定 篤()初誠()() 慎終宜()令 
榮業所基 籍
()甚無竟() 學優登仕 攝職()()政 
存以甘棠 去而益詠

樂殊貴賤 禮別尊卑 上和下睦 夫唱婦隨() 
外受傅訓 入奉母儀 諸姑伯叔
(𠦑) 猶子比兒() 
孔懷兄弟 同氣連枝 交友投分 切磨箴
()() 
仁慈隱惻 造次弗離 節
()義廉()退 顛沛匪虧([*(-+)]) 
性靜情逸
(𨓜) 心動神疲 守真()()滿(𣼛) 逐物意移 
堅持雅操
() 好爵自縻

都邑華夏 東西二京() 背()()()洛 浮渭據(𢴃)涇 
()殿盤()() 樓觀飛驚 圖()寫禽(𠎘)獸 畫([-+(-+)])()()靈 
丙舍
()()(啓唘[(*)/]) 甲帳對楹 肆筵()設席 鼓()瑟吹笙() 
()階納陛 弁轉疑星 右通廣內 左達承明 
()集墳典 亦聚群()英  杜稿(稾槀藁藳)()(𥻳) 漆(𣸡)()書壁經(𦀇) 
府羅將相 路俠
(侠夹)槐卿() 戶()封八縣() 家給千兵 
()冠陪()輦 驅()轂振纓 世祿()侈富 車駕肥(𦘺)() 
()()茂實 勒碑刻銘

磻溪伊尹 佐()時阿衡 奄宅曲阜(𢍀) 微旦孰營 
()公匡()合 濟弱扶傾 綺(𦂶)(廻回)漢惠() 說()感武丁 
()(刈義入)密勿() 多士寔(實是𥦽)寧 晉(𣈆)楚更霸(𧟳) 趙魏困橫 
()途滅()() 踐土會盟 何遵約法 韓弊煩刑 
起翦
()頗牧 用軍最()精 宣威沙漠 馳譽丹青

九州()禹跡(迹蹟) 百郡秦(𥘿)并 嶽()宗恒(恆泰怛)([/]) 禪主云()(𠅘) 
(鴈鷹)門紫塞 雞()田赤城 昆池碣石 鉅()野洞庭 
曠遠
()綿()(𨗿𨓅) 巖()([/])()(𡨋)

治本()於農 務茲()稼穡 俶載南畝 我藝(蓻蓺)(𥞫)稷 
稅熟貢新 勸賞黜陟 孟軻
()敦素 史魚秉直 
庶幾
()中庸 勞謙謹敕(𠡠)([*]) 聆音察理 鑑()(貇䫉皃)()色 
貽厥嘉猷 勉其祗
(𥘡)植 省躬譏誡() 寵()增抗()極 
殆辱近恥
() 林皋(睾睪臯)幸即 兩疏(䟽踈)見機 解()組誰逼()

索居閑()處 沉()默寂(𡨜)() 求古尋論 散慮逍()() 
欣奏累
()遣 慼(慽戚感蹙)謝歡招 渠()()()() 園莽抽條() 
枇杷晚翠 梧桐早
()() 陳根委翳 落葉飄颻(搖颯) 
()(鵾鯤)獨運 淩()摩絳霄

耽讀翫()市 寓目囊箱() 易輶攸畏 屬()耳垣(桓圍)(𡒅) 
具膳
()(湌飡)() 適口充腸() 飽飫(𩚿)()宰 飢()()糟糠 
親戚故舊 老少異糧
() 妾御績紡 侍巾帷()房 
()扇圓(員貟)() 銀燭煒(瑋熒)煌 晝眠夕寐(𥧌) 藍()(笋筠)象床() 
()歌酒讌(宴燕) 接杯()舉觴 矯手()頓足 悅()()且康 
嫡後嗣續 祭
()祀烝()() 稽顙()再拜 悚懼()(𢙢)() 
(箋棧)()(蕑蕳)要 顧()()審詳 骸垢()想浴 執熱願(𩔊)涼 
驢騾犢特 駭躍
()超驤 誅斬()賊盜() 捕獲叛亡

布射()()() 嵇()琴阮嘯 恬筆()倫紙() 鈞巧任釣 
(𥼶)紛利俗 並()皆佳妙 毛施淑()姿 工嚬(顰頻)()(咲㗛) 
年矢每催 曦
()暉朗()(耀燿) 璇(旋璿琁𢭀)璣懸斡() 晦魄環(𤨔)照 
(𢫾)薪修()祜 永綏吉劭() 矩()(𡵯)引領 俯(俛頫)仰廊廟 
束帶矜
()(㽵庄) 徘(俳裵)(佪回)瞻眺() 孤陋寡(𡪍)聞 愚蒙等()誚 
謂語助者 焉哉乎也

 

 
例如「女慕貞」、「女慕貞」、「女慕貞」都是可能的千文內容,當有人依自己對千文的認知習慣要查「烈」函時,程式依據資料庫可以做更適切的回應及處理。
 
產生於西元六世紀初的《千字文》,其原貌到底如何,至今恐已不可考, 最具參考價值的是智永留下的千字文書帖。所以上述資料是先以智永關中本楷書為基準,將當中某些古奧異體字改採現代用字,並參酌各家版本修訂成 BIG5 編碼千字文;括號內的是其它可能用字,列示所留意到的各版千字文不同用字(當中有採用 Unicode Ext-B 字形),一時找不到 Unicode 字元者暫以組字式記錄。
 
本次作業參考書目如下: 
  • 智永關中本千字文(二玄社出版 1990)
  • 智永真草千字文(長安崔氏藏本)
  • 趙孟頫真草千文(香港商務印書館 2003)
  • 懷素書臨帖(選自《千字文與閨訓千字文》——翟理斯譯 黃秉煒編選 臺中市晨星 2004)
  • 《鑑韻幼學詩帖》(選自《千字文與閨訓千字文》——翟理斯譯 黃秉煒編選 臺中市晨星 2004)
  • 《千字文字典》(飯島太千雄編 東京堂出版 昭和63)
  • 《千字文釋義》(汪嘯尹纂輯 孫謙益參注 上海老校經山房校印)
  • 《新譯增廣賢文、千字文》(馬自毅注譯 李清筠校閱 臺北市三民 2002)
  • 《千字文讀本》(施沛林註譯 臺南市大正 2001)
  • 《千字文書法之研究》(蔡翔宇 2005)
  • 《景印高麗大藏經》(新文豐出版 1982)
  • 《乾隆大藏經》(傳正有限公司承印 2002)
更詳細的《千字文》相關介紹,可以逛逛以下網頁:



回覆讀者來函

讀者來函:

有關『般舟三昧經』之網頁及其 PDF 檔內, 是否能將繪圖字體或 [颱-台+(犮-乂+又)] 等字, 改以字輸入正確 『颰』字替代之, 以便十方大眾查找閱讀,謝謝,感恩。

P.S. 例如CBETA資料庫:
http://www.cbeta.org/result/normal/T13/0417_001.htm http://www.cbeta.org/result/normal/T13/0418_001.htm http://buddhism.lib.ntu.edu.tw/BDLM/sutra/chi_pdf/sutra8/T13n0417.pdf http://www.suttaworld.org/Collection_of_Buddhist/Taisho_Tripitaka/pdf/t13/T13n0418.pdf

CBETA 回覆:

這件事有二個層面要分開討論。

第一, 在一般 Big5 格式的經文中, 我們一律以組字式來呈現. 這是為了考量到沒有安裝 unicode 的朋友也能順利讀取經文. 您舉的二個例子即是此種情況.

http://www.cbeta.org/result/normal/T13/0417_001.htm http://www.cbeta.org/result/normal/T13/0418_001.htm

第二, 針對 Unicode 的使用者, 我們也提供了各種 unicode 的版本供下載, 包括您提及的 PDF 版. 然而並不是所有的字都有 unicode 字型, 而您舉的例子正好是有爭議的字. 此字在過去細明體的字形和您用的 Arial 並不相同

細明體:颰
Arial:颰

其圖如下:

您可以發現它們是有一點差別的,因此這類的字我們也不敢冒然用 unicode 取代, 這有待更有專業的判斷,因此我們只能暫時保持組字式的情況,也就是[颱-台+(犮-乂+又)] , 我們也歡迎並期待這方面的專家給予我們更多的建議與指教。


讀者來函:

幾個CBETA鏡像點下載的都是英文版的《CBETA電子佛典集成光盤》,請求給一個中文版的下載地址,要求連安裝程序也是中文版的。

CBETA 回覆:

電子佛典集成並不是英文版, 若是在 big5 的環境執行, 預設是繁體中文版, 非 big5 的環境, 則預設為英文版.

如果您已安裝完成, 只要執行選單中的 "Setup" -> "Language", 就可以選擇您需要的語文.

如下圖所示.

至於安裝程式, 只有繁體中文與英文二種版本, 它會偵測您的環境而顯示.

如果您看到英文的畫面卻不甚了解, 可參考底下的網址的畫面來進行安裝.

http://www.cbeta.org/cd/install.htm


讀者來函:

(雜卷五)一 ○ 九經

疑問: 標點方式導致無法解讀經義

世尊今日善說池譬。所以者何?聖弟子具足見諦,得無間等果,若凡俗邪見 、身見、根本身見、集身見、生身見起;謂憂慼隱覆,慶吉保惜、說我、說眾生、說奇特矜舉。如是眾邪悉皆除滅, 斷除根本,如折多羅樹,於未來世更不復生。

修正:

世尊今日善說池譬。所以者何?聖弟子具足見諦,得無間等果,若凡俗邪見 身見根本,身見集、身見生、身見起,謂:憂慼隱覆、慶吉保惜,說我、說眾生、說奇特矜舉,如是眾邪,悉皆除滅,斷除根本,如折多羅樹,於未來世更不復生。

如此分段的理由:

具足見諦,得無間等果的聖弟子,已經斷了邪見。

凡夫邪見,是以身見為根本,源於身見的集起、產生、顯現,對於憂慼苦惱之事則隱覆不欲人知、認為是吉祥之事則愛惜保有,妄說我、妄說眾生、認為我的見解最奇特而驕傲;具足見諦的聖弟子,已經徹底斷了這些邪見的根本,就像砍斷多羅樹

CBETA 回覆:

根據同仁們的討論,此段經文的標點

T02n0099_p0034b04║爾時。世尊說是法已。入室坐禪。時。尊者舍
T02n0099_p0034b05║利弗於眾中坐。世尊入室去後。告諸比
T02n0099_p0034b06║丘。未曾所聞。世尊今日善說池譬。所以者
T02n0099_p0034b07║何。聖弟子具足見諦。得無間等果。若凡俗邪
T02n0099_p0034b08║見
.身見.根本身見.集身見.生身見起。謂憂慼
T02n0099_p0034b09║隱覆
慶吉保惜.說我.說眾生.說奇特矜舉。
T02n0099_p0034b10║如是眾邪悉皆除滅。斷除根本。如折多羅
T02n0099_p0034b11║樹。於未來世更不復生。 諸比丘。何等為見


可以修訂如下:

T02n0099_p0034b07║何。聖弟子具足見諦。得無間等果。若凡俗邪
T02n0099_p0034b08║見
。身見根本.身見集.身見生.身見起。謂憂慼
T02n0099_p0034b09║隱覆
慶吉保惜說我.說眾生.說奇特矜舉。
T02n0099_p0034b10║如是眾邪
悉皆除滅。斷除根本。如折多羅


可參考後面的570小經,有類似的經文:

T02n0099_p0151a17║彼長者所問。 諸上座言。善能答者答。 時。長
T02n0099_p0151a18║者即問梨犀達多。尊者。凡世間所見。何本.
T02n0099_p0151a19║何集.何生.何轉。 尊者梨犀達多答言。長者。
T02n0099_p0151a20║凡世間所見。或言有我。或說眾生。或說
T02n0099_p0151a21║壽命。或說世間吉凶。斯等諸見。一切皆[4]以
T02n0099_p0151a22║[5]
身見為本。身見集.身見生.身見轉。 復問。尊
T02n0099_p0151a23║者。云何為身見。 答言。長者。愚癡無聞凡夫
T02n0099_p0151a24║見[6]色是我.色異我.色中我.我中色。受.想.行.
T02n0099_p0151a25║識見是我.[7]識異我.我中識.識中我。長者。是
T02n0099_p0151a26║名身見。 復問。尊者。云何得無此身見。 答言。

非常感謝您的來函指教。


讀者來函:

後學在閱讀 卍新纂續藏經 第六十一冊 No. 1160《西方願文》
發現一點小問題

X61n1160_p0514b21(60)║又以業重福輕障深慧淺染心易熾淨德難成今於佛前翹勤五體披瀝一心投誠懺悔我及眾生曠劫至今本淨心縱貪瞋痴染穢三業無量無邊所作罪垢無量邊所結冤業願悉消滅。

依前後文及對照 卍新纂續藏經 第六十一冊 No. 1161《西方發願文註》

X61n1161_p0519a24(02)║曠劫至今。本淨心。縱貪嗔癡。染穢三業。

"" 似乎是 ""

此外,《西方發願文註》有些句逗似乎有點小問題

X61n1161_p0518c21(00)║弟子(某甲)普為四恩三 有法界眾生。求於諸佛。
X61n1161_p0518c21(00)║弟子(某甲)普為四恩三有 。 法界眾生。求於諸佛。

X61n1161_p0518c22(02)║一乘無上菩提道故。專心持念阿彌 陀佛。萬德洪名。
X61n1161_p0518c22(02)║一乘無上菩提道故。專心持念阿彌陀佛。萬德洪名。

X61n1161_p0521a20(02)║ 皆得見佛。若不觀想。則見佛為難。問觀 中見佛。
X61n1161_p0521a20(02)║ 皆得見佛。若不觀想。則見佛為難。問 。 觀中見佛

煩請核對,謝謝

CBETA 回覆:

卍續藏原書即為 "述本淨心", 但參考諸經, 皆為 "迷本淨心"

X61n1160_p0515c07║ 時堪忍度眾生刻刻西方入正定也還得淨心者
X61n1160_p0515c08║ 上言迷本淨心此言昔迷今悟如久失方得得其
----------
X59n1077_p0227b02║ 難成。今念佛前。翹勤五體。披瀝一心。投誠懺悔。我
X59n1077_p0227b03║ 及眾生。曠劫至今。迷本淨心。縱貪嗔癡染穢三業。
X59n1077_p0227b04║ 無量無邊所作罪垢。無量無邊所結冤業。願悉消

----------
X61n1162_p0562c20║ 我及眾生。曠劫至今。迷本淨心。縱貪嗔癡。染穢三
X61n1162_p0562c21║ 業。無量無邊所作罪垢。無量無邊所結冤業。願悉
----------
X62n1193_p0527a18║ 成。今於佛前。翹勤五體。披瀝一心。投誠懺悔。我及
X62n1193_p0527a19║ 眾生。曠劫以來。迷本淨心。縱貪瞋癡。染穢三業。無

故我們會將此字修訂成 "迷本淨心"。

此外您建議的《西方發願文註》的確比原來的好,我們已參考使用。
在未來的版本即會看到您建議的標點。

感謝您的來函指教。


讀者來函:

我想請問貴站 有沒有收集 十小咒 心經 及普門品
藥師經 等等 短篇的經文 的文字檔案呢

CBETA 回覆:

我們站上有一些您提及的經典:

http://www.cbeta.org/result/T14.htm

No. 449《佛說藥師如來本願經》
No. 450《藥師琉璃光如來本願功德經》
No. 451《藥師琉璃光七佛本願功德經》

一般說的普門品則在妙法蓮華經第七卷
http://www.cbeta.org/result/T09/T09n0262.htm

心經有很多版本
http://www.cbeta.org/result/T08.htm

No.249 之後皆是心經的不同譯本, 最常看到的則是 No.251 玄奘譯的版本

至於十小咒, 那應該是後人整理出來的, 這可能要參考其它的網站,
我們沒有這種整理.


讀者來函:

Just recently I noticed a little typing error in the CBETA edition and wanted to draw your attention to this, so that it can be rectified in future editions:

《增壹阿含經》卷3:「謂[16]大迦葉比丘是」(CBETA, T02, no. 125, p. 557, b9)
[16][>大迦葉]~Mahā-Kaccāna.。

《增壹阿含經》卷3:「所謂[22]大迦旃延比丘」(CBETA, T02, no. 125, p. 557, b15)
[22][>大迦旃延]~Mahā-Kassapa.。

The two footnotes are the opposite of what they should be, the first (16) should refer to Mahaakassapa, the second (22) to Mahaakaccaana.

I do not have the printed Taishoo edition myself, but a friend of mine checked it and told me that in the printed edition the footnotes are correct.

CBETA 回覆:

Your information is correct, we had fixed it and you will see it at next version.

Thank you very much.

 


交流園地
  歡迎建議與指教!來函請寄至這裡

本會電子報之文章著作權均歸原著作者所有,轉載時請全文照登,謝謝。
website: http://www.cbeta.org/      email: service@cbeta.org
11246 台北市北投區光明路276號4樓
TEL:(02)28932133 FAX:(02)28930043