全文検索 (新字体)
検索対象 1 :「大正新脩大藏經」 巻1〜55
「大正新脩大藏經」 阿含部 巻1〜2、本縁部 巻3〜4、般若部 巻5〜8、法華部・華嚴部 巻9〜10、寶積部・涅槃部 巻11〜12、大集部 巻13、經集部 巻14〜21 「大正新脩大藏經」 律部 巻22〜24 「大正新脩大藏經」 釋經論部 巻25〜26、毘曇部 巻26〜29、中觀部・瑜伽部 巻30〜31、論集部 巻32、經疏部 巻33〜39、律疏部・論疏部 巻40〜44、諸宗部 巻44〜48、史傳部 巻49〜52、事彙部・外教部・目録部 巻53〜55
検索対象 2 :「大正新脩大藏經」
古逸部・疑似部 巻85、
その他の巻(その巻の一部)は CBATA 以外から入手したテキスト。
検索対象 3 :「卍新纂續藏經」
巻78〜87
検索対象 4 :
伝教大師最澄、日蓮聖人遺文、鎌倉仏教など代表的な典籍で、入力者の許可
あるいは掲載が可能なもの。
★障害情報
・現在、仏教典籍に特化した自作の KAKASI 辞書によるインデックスが壊れている。
・namazu の設定で、大きなファイルサイズのテキストを検索対象からはずれている。
・上記二点について2006.02.14現在復旧ならびに改善作業中。
この全文検索システムについて
・仏教典籍検索システムの特徴
新字体で検索ができる (經→経)
全文検索ができる
大正新脩大藏經1〜55、85巻を網羅している
grep に比べて格段に早い検索 (Namazu
を使用)
index 作成にあたってはKAKASI に仏教用語追加辞書を追加した。
・旧字体を新字体に変換した理由
(1)検索時に旧字体を入力する手間を省くため。(cf
恋→戀、経→經)
(2)異体字によりヒットしないことを回避するため。(cf
辨・辯・辧・辯→弁)
(3)検索対象テキスト群に旧字体と新字体が混じっていると検索しにくい
(4)複数のテキストを比較し入力ミスや底本による違いを発見することを容易にするための一手段。
(5)旧字体に慣れない方への理解を容易ならしめるため。
・大正新脩大藏經・卍新纂續藏經のテキストについて
台湾のCBATA中華電子仏典協会よりダウロードした
Big5 テキスト・データをKCTRANSにて日本語のパソコン環境でも読める
Shift-JIS
に変換し、更に自作のプログラムでAPP化を行い、そして旧字体から新字体へと変換をした。
APP化とは、句読点が行末に来るように加工して、全文検索が確実にできるようにしたもの。
CBATA
データそのものの入力ミス、日本語JISに存在しても台湾 Big5
に存在しない漢字の置換や、台湾 Big5 から日本語 Shift-JIS への変換時の系統的な誤差、APP化にともなう系統的なエラーが考えられる。
また、一般に流布している経本と大正新脩大藏經には字句に差異があることが少なくない。これは誤植ではない。検索にはそのことも注意しなくてはならない。
Shift-JIS に無いと思われる漢字や Big-5
から変換できなかった漢字は「〓」に変換した。
・日本仏教のテキストについて
これらのテキストは入力者本人から誤字脱字などが十分検証されていないという注意を受けている。あくまで参考程度にして、学術的な作業など精確さが必要なときは御注意願いたい。
・全文検索エンジン
この全文検索システムは Namazu
によって構築されている。
・免責、著作権
検索して得られたテキストを転載して著作権上の問題が生じた場合は転載者がその責任を負うものとする。当方は故意に著作権を侵害するつもりはない。この検索エンジンによって著作権上の問題が生じる場合はお知らせ願いたい。
|