ファイル名:HR130.DOC (このファイルは 1600行弱、1ページ 86行でも 19ページあります。できれば プリンタに出して、紙の上でゆっくりとお読みください。なお、Mac、Windowsで は等幅フォントを使ってください) =========================================================================== KSHR, KOAHR, TAROHR, HRKS, HRKOA, HRTARO, HRHT, HRBAN, HRSS 共通 ユーザ・マニュアル A Common Manual for Hangeul-Roman Translation Utils, ed 1.30 =========================================================================== 目次 O. Edition History I. 一般事項 (0) パッケージの説明 (1) 一般的な使い方 (2) HRローマ字を介した異なるハングル・コード系の相互変換 (3) 漢字コードの変換について (4) 著作権など II. HRツール群 詳細マニュアル 文法: コマンド行オプション: -? または //? help this and exit デフォルトの設定 テキスト中でのオプション指定 //capon output UpperCase as delimitor //capoff use delimitor instead for UpperCase default //delim[=] use for roman delimiter. default '-' //hron[=] specify 'HR-on' mark. default "]" //hroff[=] specify 'HR-off' mark. default "[" //nath[=] //trans translate input default //notrans do not translate input //optthru pass //options thru to output, default //optrm remove //options out of output 一部のツールにのみ有効なオプション HRジェネレータにのみ意味のあるオプション //vvoice "hak-kyo ga-seo gong-bu-han-da" //nvoice "hak-kyo ka-seo kong-bu-han-da" default //norm "hak-kyo ka-seo kong-pu-han-ta" KSHR/HRKSにのみ有効なオプション //kw handles Shifted-KS code //jh handles Mac JH, Shifted-KS hangul-only //an handles Shifted-KS FWORLT expression //jhon[=] specify Shifted-KS on trigger string //jhoff[=] specify Shifted-KS off trigger string 漢字コードの変換が介在する場合にのみ有効なオプション //dump dump code in Hex if untranslatable //quiet, //q suppress warning messages KSHRの漢字コード変換にのみ有効なオプション //jnew output S/JIS new-style kanji //jold output S/JIS old-style kanji, default KOAHR/HRKOA, KSHR/HRKS (//kw) にのみ有効なオプション //seox handles Seo Sang-Gyu 188 mid-age Hangul TAROHR/HRTAROにのみ有効なオプション //dosvtaro handles DOS/V-ver TARO-4 Gaiji code HRBANにのみ有効なオプション //banw[=] //banc[=] 意味を失ったオプション //vtrig //ntrig デフォルト設定しか使えない HRツールへの対処方法 III. HRローマ字の簡単な説明 (1) 現代ハングルのローマ字表現 (2) 例文 (3) 区切り記号の省略 付録1:ハングル単独字母の表現 付録2:徐尚揆 188古文字セットとフォント 付録3:Mac J-Hangulと Korean Writerの文字コードの相違点 IV. HRツール群の配布とサポート拠点について ============================================================================ Edition History: 日付 特記事項 ---------- ------------------------------------------------------------ 1994/04 KSHR beta-1 水野 1994/09 KSHR ver 1.00 水野 - KS漢字 -> JIS漢字変換表に森保生校閲を反映 1994/12/08 KSHR ver 1.12 水野 12/15 KOAHR ver 1.12 - 単独字母の表現のうち、「アレア」は @ 1995/02/26 ver 1.20 統合セット - HRツール群を単一ソース・コード セットに再編、マニュアル共通化 HRKW/KWHR //seox 188古文字表現 水野、牧尾、徐尚揆 KW-KS-SJIS漢字コード変換 牧尾 HRKOA/KOAHR //seox 188古文字表現 水野、村田、徐尚揆 HRKS/KSHR KS-SJIS漢字コード変換 水野、森保生 HRJH/HRHT/HRBAN verのみ更新 水野、平塚 1995/10/14 edition 1.30 統合セット HRKS/KSHR, HRKW/KWHR, HRJH/JHHR を KSHR/HRKSに統合 FWORLDT-アンニョンクラブ「KS」表現を KSHR/HRKSに統合サポート 上田太郎 HRTARO/TAROHR を追加 水野、上田 笹本ハングル HRSS プログラム/水野 10/14 [AGORA ハングル工房ライブラリ ed 1.30セット] 10/28 [AGORA ハングル工房ライブラリ このマニュアル] ============================================================================ I. 一般事項 (0) パッケージの説明 このプログラム群はいわゆる「フィルタ・プログラム」で、 韓国の KS完成型テキストを (KSHR) 高電社 Koarean Writerまたはその互換コードで書かれたテキストを (KSHR //kw) Mac PDS J-Hangul (KT-Hangul)で書かれたテキストを (KSHR //jh) FWORLDT アンニョンクラブの表現で書かれたテキストを (KSHR //an) 高電社 98 TechnoMateで作られた(KOA)テキストを (KOAHR) 一太郎4、上田外字セットで書かれたテキストを (TAROHR) 以上それぞれのハングル部を HRローマ字に変換して出力するものと、 逆に、このローマ字テキストを KS完成型に (HRKS) KW(Shift-KS)テキストに (HRKS //kw) Mac PDS J-Hangul (KT-Hangul)に (HRKS //jh) FWORLDT アンニョンクラブの表現に (HRKS //an) TechoMate(KOA)テキストに (HRKOA) 一太郎4、上田外字セットに (HRTARO) この他に PCVAN PDS HT.COMのコード・ローマ字に (HRHT) 花文字に (HRBAN) 笹本ハングルに (HRSS) それぞれ変換するものです。もちろん、入力する場合のローマ字は手書きであっ てもかまいません。 その際、漢字コードの変換が必要な場合は、各ツール内で変換が行なわれます ので、「ハングル(ローマ字)漢字混じり文」も通すことができます。 アップロード、ダウンロードの都合を考えて、ライブラリは次のセットに分割 してあります: HRKS/KSHR HRKOA/KOAHR HRTARO/TAROHR HRHT HRBAN HRSS このマニュアルは、これらすべてについて共通です。 ---------------------------------------------------------------------- (1) 一般的な使い方 以下では、MSDOSのプロンプトに対してコマンドを与えることを前提として説明 します。説明の都合で KSHR, HRKSで例を示しますが、他のものについては「KS」 を「KOA」「TARO」などに読みかえてください。 いま、KSテキスト・ファイルの名前が「fileks.txt」だとします。このとき DOSのプロンプトが出ている状態で A> KSHR TYPE fileks.txt | KSHR というコマンドを与えると、画面には、ハングル部分はローマ字で、漢字はやは り漢字のまま、ファイルの内容が表示されます(漢字コードの変換が必要なケー スでは、ここで漢字コードが Shift-JISに変換されます)。 同様に A> KSHR filehr.txt または A> TYPE fileks.txt | KSHR >filehr.txt とタイプすると、画面に表示されていた内容が、今度はファイル「filehr.txt」 に取れます。 ---------------------------------------------------------------------- KSHR/HRKSについては、扱う「KS完成型」ハングル・コードのバリエーション によって、次の3つのオプションを指定することができます: //kw 高電社 Korean Writerとその互換セット //jh Mac 漢字Talkの J-Hangul (KT-Hangul) //an FWORLDTアンニョンクラブ会議室の表現 この3つは、いずれも Shift-KS、つまり「JIS漢字を Shift-JISにして扱うの と同じ論理で、KSコードを Shiftした」文字系コードの場合です。 韓国のパソコンで使われている(主流の)ハングル・コードは8ビットx2バ イト構成、日本では unixで使われる eucコード系の別セットだと考えることがで きます。この文字コードは、ここで引用すると文字化けの嵐になるので引用しま せん。 一方、Macの J-Hangul (KT-Hangul) と、Windowsの高電社 Korean Writerの場 合は、ハングルを主として日本語と混在させる必要があったため、「日本語文字 系と同じコーディング・システム、つまり Shift-JISに合わせて」ハングルを実 現する必要があったのです。従って、これらのハングルは、韓国のKS完成型の クローンでありながら、日本語環境の「フォントの選択」でハングルが表示され ます。そのかわり、韓国製のパソコン・システムとの間では、互いに直接は読め ない関係です(これは、同じ日本語のファイルが、MS-DOSと unixの間では互いに 直接は読めない関係にあたります)。 さて、この Shift-KSは、日本語の Shift-JISと同じ論理で構成されているので、 「日本語しか読めない」パソコンではハングルには見えませんが、しかし文字化 けせずに日本語パソコンの間で流通できます。例えば: file sample.kw: 戚 採歳精 廃越稽 昇嬢閃 赤陥. 蟹澗 嘲i煕戚陥 は、文字化けしているのではなく、KWのテキストがたまたま日本語フォントで表示 されているだけです。このファイルを「KSHR //kw」に通すと: A>KSHR //kw KSHR //jh KSHR //an KSHR とやると、プログラムは黙ってしまいますが、これはキーボードからの入力を待 っているのです。KSHRの場合、韓国製の ハングル版 DOS上で、キーボードから適 当なハングルを与えてやると、改行ごとに変換結果がローマ字で表示されます。 ^Z それに続いて「改行」を入力するとプログラムは終了します。 この逆向きツールを単に A>HRKS と起動すると、プログラムは同様に黙ってしまいます。このとき、キーボードか ら適当なローマ字を与えてやると、改行ごとに KS完成型のハングルが画面に表示 されますが、ただしこれは韓国製ハングル版 DOSでなければ、読める文字には見 えません。同様に ^Z を入れると終了します。 これはいわゆる「フィルタ・プログラム」ですので、パイプとリダイレクトを 組み合わせて、どのような使い方でもできます。 例えば、高電社 TechnoMateで書かれたハングルのテキスト・ファイル phyeonji.koaがあるとして、これを次のコマンドにかけると、 A>KOAHR phyeonji.ks ファイル phyeonji.ks が韓国製のワープロで読めるようになります。同様に A>KSHR phyeonji.kw とやれば、やはり高電社 Korean Writerまたはその互換システムで読めます。こ の他、 A>KSHR phyeonji.ht のケースでは、PCVANで開発された有名な HT.COMで読めるファイルができます。 この組合せ方は融通ムゲですので、結局 これらのいずれかのハングル・テキスト ファイルがあれば、これを一度 ローマ字に変換し、それをさらに他のハングル・コードに変換する ことができます。 以上の各「変換」それ自体は、プログラムを実行する環境がどのような DOSで あっても動作します。変換した結果が正しく読めるかどうかは、その環境により ます。 ---------------------------------------------------------------------- このツール・セットの中で、2つだけ「仲間外れ」のものがあります。 HRBAN と HRSS はある種の描画プログラムで、次のようなコマンドを受け付け ます: A>HRBAN an-nyeong-ha-se-yo @@ @@ @@ @ @@@ @ @@ @ @@@ @ @ @ @ @ @ @ @@@ @ @ @ @ @@@@ @ @ @ @ @ @@@@@ @ @ @ @ @ @ @ @ @@@ @ @@@ @ @ @@@@ @ @ @ @@@ @ @@@@ @ @@@ @@@ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @@@@ @ @ @ @ @ @ @ @ @@ @@@@ @@@ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @ @@@@@@@@@@@ @@@@@@ @@@@ @ @ A>HRSS eom-ma-ya na-neun wae kap-ja-gi po-go siph-ji! _ ○-l 口ト ○l= レト L ○ フト スト フ| 廿 丿 人| ス| ! 口 匸 亠H 廿 亠 亠 立 ただしこれらのプログラムでも A>KSHR KSHR KSHR phyeonji.ban A>KSHR phyeonji.ss とやれば、その絵文字がファイルにとれます。 ------------------------------------------------------------------------- (2) HRローマ字を介した異なるハングル・コード系の相互変換 作者は、HRローマ字を中間コードとした、各文字系の間でのハングルの相互交 換ルートを作りたいと考えました。例えば、韓国の BBSでは KS完成型が主流です が、この文字コードは日本でもアメリカでも、しばしば「読めない」文字でしか ありません。日本では意外にユーザの多い高電社システムのハングルは、日本で も機種間、製品間の不一致がみられ、まして韓国、アメリカでは絶望的です。 そこで、これをいったん「ローマ字」という中間コードに変換して流通できな いか。ローマ字であれば CompuServeにも乗せられるし、世界中のほとんどすべて のコンピュータで解読でき、仮に人間が目でみても、どうにか判読できます。 そこで、「ローマ字」を中間において、その発信側、受信側では、それぞれ自 分のハングル・コード系との変換ツールを用意する。相手側が自分とは異なるコ ード系だと思われる場合、あるいは通信のメディアが英文字しか通さない場合に は、通信回線上ではローマ字を使用する。これをハングルに復元するかどうかは 相手次第である − という具合です。 この HRローマ字系は、たくさんの方の協力をいただいて、現在、上に述べた 段階まで達しました。まだいくつかのツールが欠けていますが、これは需要次第 で対応・作成して行きます。 また、HRローマ字を入力・解釈して、結果を直接画面に表示するプログラムも 開発されつつあり(QZC04612 平野さんの HRV)、これを使えば、 A>KSHR で、介在しな いものを ---> で示します: KS ===> HR ===> KS (漢字を含む euc型 KSコード) KW ===> HR ===> KW (高電社、漢字を含む Shift-KS) JH ---> HR ---> JH (ハングルだけの Shift-KS) AN ===> HR ---> AN (左辺でのみ漢字を Shift-JISに) KOA ---> HR ---> KOA (Shift-JIS拡張 広義の 98外字) HR ---> HT HR ---> BAN HR ---> SS 漢字コードの変換が介在するケースでは、入力テキストのハングル部をローマ 字に(ローマ字をハングルに)、漢字(コード)は可能な限りそれに対応する相 手側漢字(コード)に、それぞれ変換します。その際、日・韓の漢字コードが互 いに矛盾する場合には、次のような方針をとりました。(ここでは JISと SJISを、 また KSと Shift-KSを同一視します): (A) 韓国側が新旧字体を区別していない場合は、KS->JIS変換は原則とし て JIS 旧字体を選択するが、ユーザの指定がある場合は新字体を選 択する(例:「經:経」、「關:関」) (A') JIS->KS変換では、日本側の新旧字体にかかわらず、韓国側は「旧 字体」になる(例:「学」も「學」も KSでは「學」) (B) ただし、JISの新旧に対応する2字体が、韓国側 KSでも別の文字と して定義されている場合は、ユーザの指定にかかわらず原 KSに対応 する JISコードを選択する(例:「臺:台」、「萬:万」) (B') JIS->KSでは、「正しい」字体が何かにかかわらず、韓国側に対応 する字体があればそれを選択する(例えば「台湾」は、KS変換後に も「台灣」である。その結果韓国人は tae-manでなく thae-manと読 んで「これはまちがっている」と言うが、変換ツールはそれに関知 しないぞ) (C) 「KSにあるが JISにない漢字」は、ユーザの指定があれば、原 KSコ ードの十六進の値を ASCIIテキストとして出力する(例:「竹」カ ンムリに「均」は ) (C')「JISにはあるが KSにない漢字」は、同様に指定があれば十六進 ASCIIテキストとして出力する(例:「込」は ) これらの十六進表現は、さらに逆向き変換の際に、もとの文字コー ドに復元される。 (D) KSでは2重、3重に定義されている漢字が JISにはひとつしかない 場合、KS->JIS ではそれを選択する。JIS->KSでは、それに対応す る漢字の「最初のもの」が選択される(例:日本側「李」は、韓国 側では ri, iの2ヶ所で定義されているので、JIS->KSでは対応する 「最初のもの」つまり「李(ri)」が選択される) が、例えば韓国側には「楽」「樂」の新旧字体の区別がなく、しかも4種類の 「音」 nak rak ak yo でこの文字が定義されているので、JIS:KS で 2:4 に対応 するなど、話題と頭痛の種は尽きません。興味のある方は、適当なサポート拠点 で話題にしてくださると、プログラムの立場からも有益です。 なお、 JISの内部問題である「新JIS、旧JIS」問題は、まったく考慮していま せん。校閲段階では MS版 DOS/Vと 漢字Talk 6, 7を使いましたので、基本的には 新 JISです。 韓国側 KS漢字コードの検証は、KS完成型の公式規格書、商品版ワープロ HWP, HWPC(いわゆる「アレ・ア・ハングル」)、Macの「ハングルTalk」関係ツールを 使用し、数人の方の協力を得て行ないました。 ------------------------------------------------------------------------- (4) 著作権など (4-1) 歴史のはじまり まず、Macの J-Hangulの作者 PDF01301 平塚潔さんの功績を挙げなければなり ません。 HR関連ツールは、その当初、彼の一連の変換ツールの中から、KS完成型のハン グル 2350文字に対応するローマ字表現を切り出して作成しました。このローマ字 表を現在の HRに書き直したものが、HR変換ツール群の seed「種」になりました。 このマニュアルが対象とするすべての HR関連ツールは、この平塚変換表の末裔 を使っています。 平塚氏の J-Hangulは、内実において「KS完成型 2350文字のハングル(だけ) を、Shift-JISと同様の原則に従ってシフトしたもの」でした。このコード系は、 後の高電社の Windowsの商品 Korean Writerにも影響を与えたと思われます。 また、HRBANの 12ドット・フォントは、Mac「丸漢」J-Hangul 12ドット・フォ ントそのものを流用しています。 (4-2) 漢字コード変換表と校閲者 KSHR/HRKSが内部に持っている漢字変換表は、下記の PDSに源泉があります。 源泉:PCVANで配布された、KS -> SJIS 漢字コード対照表 最初この表は友人から届いたので、念のため元の配布者に問い合わせた ところ、自由に修正して使ってよい、元の配布者の名前を明らかにする 必要もない、という回答を得ました。そこで、この表を先の方針で加工 して使用しています。 (PCVANでは、この変換表をもとに HCCという名前の各(ハングル・漢字 を含む)コード変換ツールが、複数の参加者の手で完成され配布されて います) この変換表を、より高い精度で校閲しツールの品質を高めるのに貢献してくだ さったのは、Nifty GBG00234 森 保生さんです。もちろん、漢字という大物が相 手ですので、今後ともリファインを重ねて行く必要はありますが、現状でも精度 ・品質は大幅に改善されたものとなっています。 (4-3) KOAコードの変換表 KOAHR/HRKOAは、東京外国語大学 朝鮮語学科に在籍中(95/02現在)の村田寛氏 の好意で可能になったものです。 もともと、コンピュータ上でのハングル処理に熱心な、筑波大学(95/02現在) の徐尚揆博士が、乱立するハングル・コード間での変換プログラムのサンプルを 用意され、これに村田氏が KOAコードの変換表とその変換ルーチンを追加したも のがありました。 KOAHR/HRKOAは、この村田変換テーブルから KOAハングル 2864文字のコード表 を切り出し、それを HRローマ字との対照表に書き直して作成されたプログラムで す。この本来の表は村田氏の労力と著作権にかかるものです。 (4-4) 徐尚揆 188古文字表現とそのフォント 上記の徐尚揆氏は、基本的には 98 KOAシステムを使用しつつ、さらに中期朝鮮 語の研究に必要ないくつかの外字セットを作っていました。 KOAHR/HRKOA, KSHR/HRKS (//kw) は、この徐尚揆先生が研究の必要から作成し ていらっしゃった 188文字の基本的な「外字」表現を認識・生成します。これら のツール群は、 ・基本 188外字をローマ字に ・そのローマ字表現を外字に それぞれ変換するオプション //seox を含んでいます。 徐尚揆 188古文字セットとそのローマ字表現、それに先生ご自身の制作による KOA 188外字フォントについては、このマニュアルの「付録2」を参照してくださ い。 (4-5) KSHR/HRKSの //kwオプションと、徐尚揆 188外字の KW移植 KSHR/HRKSの //kwプロパーな部分、つまり Shift-KSと KSとの変換部は、 Nifty HGD01064 牧尾清さんによるものです。 それに、やはり牧尾さんの手によって、徐尚揆 188外字相当文字コード部、さ らにこの 188外字フォント本体が KWに移植されています。これについては、やは り「付録2」を参照してください。 (4-6) 以上の基本部と統合 これらのプログラムの基本部分のコーディング、およびソース・コードの統合 にあたったのが私(水野)です。これらのプログラム群の著作権はこの集団にあ り、私はこの集団を代表して配布していると考えます。上記の各部分については、 原権利がそのオリジナル作者にあり、プログラム・コードの基本部が私の責任に 属します。ただしこの責任とは、プログラムを使用する方の民法上の権利を意味 するものではありません。つまり、プログラムにミスがあれば善意をもって対処 しますが、おカネを請求されても知らん・という意味です。 このプログラムは、オブジェクト、ソース・コード、ドキュメントにわたって、 いわゆるフリー・ソフトであり、使用・再配布にあたって著作権者の承認を得る 必要はありません。ただし、配布は営利目的でないことが条件です。個人レベル での使い方は制限しません。営業マンが、営業のついでに「個人的に」配布する のはかまいませんが、組織的に使用するまたはそれを検討する、あるいは商取引 の一部に含む場合には、必ず関係する作者のいずれかにご相談くださるようお願 い申し上げます。 いずれの場合にも、配布する際は必ず、付属するドキュメント類も同時に配布 してください。 /* end of part I. */ ========================================================================== II. HRツール群 詳細マニュアル 以下では、ツール・セットを代表させて KSHRの例を示します。他のツールでは、 これを xxHR、または HRxx( xx は KOA, TARO, BAN, SS など )に読み替えてく ださい。KSHR/HRKSの場合、変換の対象となる「KS完成型」文字コードが Shift- KSであることがあり、その場合は特にオプション //kw, //jh, //an のいずれか を指定しなければなりません。 ---------------------------------------------------------------------- 文法: syntax: KSHR []  標準入力および標準出力しか使いませんので、ファイル名などを直接指定する ことはできません。ファイルを読む、あるいはファイルに出力する場合には、適 当に OSのリダイレクト機能を使ってください: 例: KSHR jsfile.txt ただし HRBAN, HRSSは HRBAN han-geul phyo-hyeon HRSS han-geul phyo-hyeon のように、コマンド(動詞)に目的語を指定でき、この目的語が絵文字になりま す。目的語をつけない場合の文法は、KSHRと同様です。 コマンド行オプション: -? または //? help this and exit 簡単なヘルプ・メッセージが表示されます この他のオプションは、後に述べるテキスト中オプション指定と、まっ たく同一です。ただし、テキスト中に埋めこむ書式は //xxx ですが、コ マンド行中では -xxx と表現することができます。//xxx と書いた場合 と -xxx と書いた場合の意味のちがいはありません。 例: KSHR //capon //norm file.hr (できたファイル file.hr には、//caponの指定が埋めこまれているの で、このファイルを再び処理するときはオプションを指定する必要は ない) //に続くオプション名それ自体は、大文字でも小文字でもかまいません。同一 または対立する指示が、テキスト中に何度現われてもかまいません。ただし、こ れらは、空白を除いて「その」行の先頭になければなりません。また、この指定 が先頭にある行は、「変換」の対象とならず透過出力されます。従って、意味の あるテキストはその行内には書けません。なお「空白」とは半角のスペースおよ びタブです。全角スペースは空白とみなされません。 個別のオプションの説明 //capon output UpperCase as delimitor KSHR, KOAHR, TAROHR(以下「HRジェネレータ」と呼ぶ)は、デ フォルトでハングルをすべて小文字のローマ字に変換します。 が、このオプションを指定すると、ハングルの活字単位で文字 の先頭に大文字を使用し、また「区切り記号」を生成しなくな ります。例えば同一のハングル入力に対して、次の2種類のロ ーマ字出力を選択できます: tae-han-min-guk jo-seon-min-ju-ju-eui-in-min-gong-hwa-guk na-neun hak-kyo-e kan-da //capon TaeHanMinGuk JoSeonMinJuJuEuiInMinGongHwaGuk NaNeun HakKyoE KanDa HRKS, HRKOA, HRTARO, HRHT, HRBAN, HRSS(以下「HRスキャナ」 と呼ぶ)では、デフォルトで次の入力をすべて正しいものとし て受け入れます。つまり、「大文字は次のハングル1文字の始 まり」とみなします: tae-han-min-guk jo-seon-min-ju-ju-eui-in-min-gong-hwa-guk TaeHanMinGuk JoSeonMinJuJuEuiInMinGongHwaGuk TaeHan-MinGuk JoSeon-MinJuJuEui-InMin-KongHwaGuk //capoff use delimitor instead for UpperCase default HRジェネレータでは //caponの指定の逆、つまり小文字のロー マ字と「区切り文字」を出力します。 HRスキャナでは、このオプションに出会うと、ローマ字の大文 字・小文字の区別を無視するようになります。全文が大文字で 書かれているローマ字を入力するときは、このオプションを指 定しなければなりません。 注意:このとき大小が区別されないので、例えば次のローマ字 は誤読されます: (入力) Han ManhEun I SeSang YaSokHan NimA (誤読) han man-heun i se-sang ya-so-khan ni-ma (正解) han manh-eun i se-sang ya-sok-han nim-a //delim[=] use for roman delimiter. default '-' HRジェネレータでは、ハングルをローマ字に変換する際に、デ フォルトでは文字単位に区切り記号「-」を挿入します。このオ プションを指定すると、「区切り記号」に指定した文字 を 使用します。 例: //delim ' 区切り記号に「'」を使用する han manh'eun i se'sang ya'sok'han nim'a //delim = / 「/」を使用する han manh/eun i se/sang ya/sok/han nim/a //delim = _ 「_」を使用する han manh_eun i se_sang ya_sok_han nim_a HRスキャナは、解釈に支障のない限り「区切り記号」の省略を 認めますが、一般的には文字間にこの記号があることを期待し ています。このオプションが指定されると、スキャナは を 区切り記号とみなします。 には、半角文字だけを指定できます。半角であれば何でもか まいませんが、ハングル字母に対応するローマ字と同じものを 指定してはいけません。また半角カナなど、ASCIIコード 128字 の英文字・記号の範囲外の文字を使うのも、例えば CompuServeにのせることを考えると勧められません。 特殊な場合として、に何の文字も指定しないと、半角スペー スが区切り記号として使われます。ただしこれを使うと、人間 の見た目に誤解しやすくなるので、これも勧めません。(意味 のあるスペースと、区切り記号として生成されたスペースが混 同される): //delim han manh eun i se sang ya sok han nim a //hron[=] specify 'HR-on' mark. default "]" //hroff[=] specify 'HR-off' mark. default "[" HRジェネレータはデフォルトで、入力テキストの中に半角の文 字(ASCII文字)、特に英文字を発見すると、HRスキャナのため に「ここから横文字はハングルのローマ字ではないよ」という 意味の(1文字だけの)文字列 "[" を出力します。この後、再 びハングルに出会うと、「ここからはハングルのローマ字だよ」 という意味で文字列 "]" を出力します。 例: yeo-gi-neun han-geul, [but this is not Hangul-Roman.] HRスキャナは、"["に出会うとそこから英文字の解釈を中断して 透過させ、再び "]"に出会うと、またハングルのローマ字とし て解釈をはじめます。この場合、[ ... ] の中に漢字や記号が 含まれていてもかまいません。 例: cham-go mun-heon ["Hangeul-Lab Agora #16 会議室 .."] しかし、入力テキスト(ハングル原テキスト)に "[]"が使われ ている場合には、この記号を避けなければなりません。このよ うな場合、例えば: //hron >> //hroff << と指定しておくと、次のような出力が得られます: yeo-gi-neun han-geul, <> この指定は、この指定をするコマンド行とともにローマ字解釈 プログラムに渡されて行きますので、解釈時にも正しく処理さ れます。 指定する文字列 の長さは、最大(半角で)19文字。大 文字・小文字、半角・全角はすべて区別されます。ただし、文 字系の異なる世界への転送が目的なので、全角文字(ハングル そのものや漢字、全角記号)、特殊記号(半角カナ、IBM-PCや Macの特殊文字、モザイク文字など)を指定してはいけません。 ed 1.30での追記: ed 1.30の HRジェネレータは、ハングル文脈中に混在する英文 字の中に ローマ字/英文の区切り記号と一致するものを発見し た場合、次のような出力をして来ます: 条件:デフォルトで //hroff = [ //hron = ] のまま、 次のようなハングル英文字混在があるとき: [巷充 奄紫] 神潅精 13析 榎推析 これを KSHR //kw にかけると次の出力が得られる: [[]mu-seun ki-sa] o-neul-eun 13il keum-yo-il これは、ed 1.20までの HRxxで正しく原文に復元できます。 //nath[=] ハングルの単独字母の表現については、「付録1」を参照して ください。 HRジェネレータは、入力テキスト中の単独字母に出会うと、単 独字母を意味するデフォルトのプレフィクス * を出力し、HRス キャナもこれを同様に解釈します。 このオプションで、このプレフィクスを変更できます。 例: *s-*a-*r-*a-*ng = sa-rang (デフォルト) //nath % %s-%a-%r-%a-%ng = sa-rang //trans translate input default //notrans do not translate input HRジェネレータ、HRスキャナともに、デフォルトでは入力をハ ングルまたはそのローマ字として変換を、また必要なら漢字コ ードの変換をしようとします。特に漢字コードの変換は、たと え英文脈の中でも行なわれます。 //notrans を指定すると、その時点で一切の「変換」を中止し て、入力テキストを単に透過出力します。 //trans を指定すると、その時点で再び変換を開始します。 このオプションは、同一の入力ファイル内に、ある文字コード 系と、他の文字コード系が混在しているときに使います。 例えば「日本のパソ通に入って、そこのゲートウェイから韓国 のパソ通にアクセスしたが、その間ずっとログを取りつづけて いた」ファイルを KSHRに入力する場合。 この場合、このファイルの先頭、またはプログラム起動時のコ マンド行で //notrans を指定します。 テキスト上では、韓国の BBSに切り替わる直前に //trans を挿 入します。 この指定を随時くりかえせば、出力は「ASCII, JIS漢字および HRローマ字」のファイルとなって、日本語環境で読めるように なります。 この他、ハングル英文混在のテキストで英語部分が長いとき、 英文の前の行に //notrans, 英文の終わった次の行に //trans を指定すると、出力のハングル on/offマークの頻出を避けられ ます。 //optthru pass //options thru to output, default //optrm remove //options out of output デフォルトで、オプション一般は透過して出力にコピーされま す。 これが目障りな場合は、//optrmを指定すると、出力側には出な くなります。 //optrmを指定した時のプログラムの動作は、「すべてのオプシ ョンの指示に従い(動作して)、かつそのオプション行自体は 出力しない」です。 一部のツールにのみ有効なオプション HRジェネレータにのみ意味のあるオプション 以下のオプションは、HRジェネレータでのみ意味を持ちます。 他のプログラムはこれらのオプションを認識し副作用は起こしませんが、 動作にも変化はありません。 //vvoice "hak-kyo ga-seo gong-bu-han-da" //nvoice "hak-kyo ka-seo kong-bu-han-da" default //norm "hak-kyo ka-seo kong-pu-han-ta" 朝鮮語/韓国語の特徴のひとつに、無声音と有声音の交替、いわ ゆる清音と濁音の交替があります。 HRジェネレータへのこの3つのオプションで、生成されるロー マ字のこの交替の程度を選択できます: //vvoice hak-kyo ga-seo su-hag-eul gong-bu-han-da //nvoice (default) hak-kyo ka-seo su-hag-eul kong-bu-han-da //norm hak-kyo ka-seo su-hak-eul kong-pu-han-ta このうち //normは、プログラムが内部的に使用している「規範 表現」です。これは機械的な意味での原始表現であり、人間が 「読む」ことは考えていません。特殊な場合(例えば、KS完成 型の 全文字のローマ字リストを作るなど)にしか使うことはな いと思いますし、またすすめません。 ただし、ローマ字による出力を他のツールで検索するような場 合、kong-bu-han-da の bu と pu-san の pu が別の表現では困 る、という場合があります。この場合には、ローマ字に変換す る時点で //norm を与えておけば、一貫した pu という表現が 得られます。 なお、hak-gyoや hag-gyoと出力するオプションはありません。 HRジェネレータは、「有声音に挟まれるものは g, d, b, それ 以外では k, t, p」を生成します。 ただし、hak-gyoや hag-gyoも、HRスキャナでは正しく解釈され ます。 KSHR/HRKSにのみ有効なオプション KSHR/HRKSは、デフォルトでは韓国のパソコン型(日本の euc型)8ビッ トx2バイトの文字系を認識・生成します。 が、日本のパソコンで日本語とハングルを混在させる場合には、ハング ルはしばしば Shift-KSであることがあります。その典型的なケースが Mac J-Hangul, 商品では高電社 Windows用 Korean Writerです。 以下3つのオプションは、Shift-KSファイルの扱い方を選択するもので す。 //kw handles Shifted-KS code KSHRの入力テキスト全文が Korean Writerつまり Shift-KSであ ることになります。 HRKSの出力テキスト全文が Shift-KSになります。 //jh handles Mac JH, Shifted-KS hangul-only KSHRの入力テキストのハングル部だけが Mac J-Hangul文字コー ドである場合。 この場合、デフォルトではハングル部は 半角の { } で囲まれて いなければなりません。他の部分は透過します。 HRKSの出力テキストのハングル部だけを Mac J-Hangulにする場 合。 この場合、出力されるハングル部は デフォルトで 半角 { } で 囲まれます。他の部分は透過します。 //an handles Shifted-KS FWORLT expression KSHRの入力テキストのハングル部だけが Shift-KS(漢字含む) である場合。 この場合、デフォルトでは Shift-KS部は [: :] で囲まれてい なければなりません。他の部分は透過します。 HRKSの出力テキストのハングル部だけを Shift-KSにする場合。 この場合、出力されるハングル部は デフォルトで [: :] で 囲まれます。他の部分は透過します。 //jhon[=] specify Shifted-KS on trigger string //jh, //an が指定された時の、「ここからハングルだよ」記号 を指定します。デフォルトでは、 //an が指定されたとき [: //jh が指定されたとき { になっています。 //jhoff[=] specify Shifted-KS off trigger string //jh, //an が指定された時の、「ここからハングルではないよ」 記号を指定します。デフォルトでは、 //an が指定されたとき :] //jh が指定されたとき } になっています。 なお、同じ Shift-KSでありながら Korean Writerの文字コードと、J- Hangulの文字コードには、一部分不一致があります。これらが Macと Windowsでそれぞれ FWORLDTの表現に持ち込まれて、KSHR //an で処理さ れるとき、矛盾が生じる可能性があります。この詳細と対策を「付録3」 で説明していますので、ご参照ください。 漢字コードの変換が介在する場合にのみ有効なオプション 以下のオプションは、漢字コードの変換の介在するプログラム (KSHR, HRKS)でのみ意味を持ちます。漢字コードを変換しない他の場合はこれら のオプションを認識し副作用は起こしませんが、動作にも変化はありま せん。 //dump dump code in Hex if untranslatable プログラムはデフォルトで、変換不能な文字コード(韓国側に あるが日本側にない、またはその逆)に出会ったとき、"nq"と いう文字列を出力します。また、明らかに「異常な」文字コー ドに出会ったときは "xx"という文字列を出力します。 こうして「変換不能」で文字バケをおこしたものは、再び機械 的な方法でもとにもどすことはできません。 そこで、変換はしたが将来ふたたび復元する必要がある場合に は、このオプションを指定してください。このときプログラム は、変換不能文字に出会うと、その文字の十六進数を といった形式で出力します。この文字列は、対応する逆向き変 換の際、もとの文字コードに復元されます(その際、特にオプ ションを指定する必要はありません)。 //quiet, //q suppress warning messages プログラムは、上記の「変換不能」な文字に出会うと、饒舌な 警告メッセージを表示してきます。この警告は、変換不能な文 字1つについて1行表示されるので、場合によっては画面は警 告ばかりで読めなくなります。 このオプションを指定すると、警告メッセージが表示されなく なります。 (なお、警告メッセージは「標準エラー出力」に出ているので、 次の場合 KSHR allhr.txt //norm 画面にはたくさんの警告メッセージが流れて行きますが、ファ イルには変換結果がとれます。逆に、MSDOSでは、警告メッセー ジだけはファイルにとれないようです) KSHRの漢字コード変換にのみ有効なオプション 以下のオプションは、KS漢字コードから JISへの変換を行なう KSHRでの み意味を持ちます。漢字コードの変換を必要としない他のプログラムは これらのオプションを認識し副作用は起こしませんが、動作にも変化は ありません。 //jnew output S/JIS new-style kanji //jold output S/JIS old-style kanji default 入力テキストの漢字コードに出会ったときの、変換先の JIS漢 字の新・旧字体を指定します。デフォルトは //jold、つまり何 も指定しなければ、旧字体が選択されます。 //jnewを与えると、原則として新字体が選択されます。ただし、 これを指定しても、漢字は相変わらず旧字体のままであること があります。これは、韓国の KSコードが日本と同様に新旧2字 体を定義している場合です。 KOAHR/HRKOA, KSHR/HRKS (//kw) にのみ有効なオプション 以下のオプションは、KOA, KS (//kw) 関連ツールにのみ有効です。 他のプログラムはこれらのオプションを認識し副作用は起こしませんが、 動作にも変化はありません。 //seox handles Seo Sang-Gyu 188 mid-age Hangul このオプションが指定されると、プログラムは、現代ハングル の範囲を越えて、徐尚揆博士の選定による基本 188文字のハン グル外字コードとそのローマ字を認識、生成します。 このオプションはデフォルトではセットされていませんので、 特に指定しないとこの動作は起こりません。 徐尚揆 188外字・古文字については、「付録2」を参照してく ださい。 注意1:現在、このオプションの裏返し、つまり「徐尚揆 188 古文字を認識しない(この機能を停止する)」オプションはあ りません。従って、一つの変換の中で一度 //seoxオプションを 指定すると、その変換中は取り消せません。 注意2://seoxオプションが有効になっているときは、古文字 綴りが優先されるので、区切り記号が省略されたローマ字の解 釈では次のような不都合が生じることがあります: 現代綴り //seox -------- -------- yeopseo yeop-seo yeo-pseo (なお、この字体は 188外字 に含まれないので 変換不能) TAROHR/HRTAROにのみ有効なオプション 以下のオプションは、TAROHR/HRTAROにのみ有効です。 他のプログラムはこれらのオプションを認識し副作用は起こしませんが、 動作にも変化はありません。 この2つのツールは、HRと一太郎(4)外字との間での相互変換を行なうも のです。ただし、一太郎(4)は、同じ一太郎(4) の同じ外字コードであっ ても、「テキスト形式」でセーブしたファイルには、98版と DOS/V版の 間で、異なる文字コードが出力されています。そんなバカな話があるか とお思いでしょうが、本当です。詳細は、ソース・コード セットを参照 ください。 //dosvtaro handles DOS/V-ver TARO-4 Gaiji code デフォルトでは、TAROHR/HRTAROは、98 一太郎 ver 4 外字コー ドの「テキスト形式」ファイルを認識/生成します。 このオプションを与えると、TAROHR/HRTAROは、DOS/V版 一太郎 ver 4 外字コードを認識/生成するようになります。 例えば、98版外字セットのハングルで書いた文書を DOS/V版 一 太郎に持ち込むときは、次の操作が必要です: TAROHR <98hangul.txt | HRTARO //dosvtaro >dosvhan.txt HRBANにのみ有効なオプション 以下のオプションは、HRBANにのみ有効です。 他のプログラムはこれらのオプションを認識しません。他のプログラム にこれらのオプションを、コマンド行中で指定すると動作拒否し、テキ スト中で指定すると無視します。 //banw[=] HRBANは、12ドットの花文字でハングルを描画しますが、その際、 画面の幅をデフォルト 80桁と仮定して、勝手に改行を挿入して きます。 このオプションを指定するとこの画面幅を変更できます。 例えばプリンタに 160桁出力できれば、次のように 160桁をフ ルに使えます: A>HRBAN han-manh-eun i sesang ya-sok-han nim-a //banw=160 >PRN プリンタの印字ピッチをつめ、//banw=N の N を適当に調整し てください。上限は 256です。 //banc[=] HRBANは、デフォルトで花文字のドットに '@' を使います。 このオプションで、任意の1文字 を指定できます。 例: A>HRBAN han-geul //banc=e eee ee eeeeee e e eeeee e e eee e e e e eee eee e eeeeeeeeeee e e eeeeee ee e e eeeeee e e eeeeee eeeeee に指定できるのは半角文字だけです。もし全角文字を与え ると、表示結果が文字バケします。 意味を失ったオプション 次のオプションは、既に意味を持っていません。プログラムは、過去の バッチ・ファイル等との互換性のためこのオプションを認識しますが、 動作には変化がありません。 //vtrig //ntrig ---------------------------------------------------------------------- デフォルト設定しか使えない HRツールへの対処方法 HR基本ツール・セットの中では、オプションの内容、文法など以上のように統 一されています。が、今後 HR関連ツールは、現在までの作者らとは別のところで 開発される可能性があります。現に 1.20セットの公開以後、このローマ字を読ん で画面にハングルを描画するツール HRV(QZC04612 平野さん、98用および DOS/ V用)が発表されています。 これら、基本セットを越えたツール、あるいは今後出現するツール群では、以 上のオプションがすべてサポートされるとは限りません。多くの場合、基本的な デフォルト・セットで動作すると思われます。 そこで私(水野)自身は、「HRローマ字のバリエーションを標準的な綴りに変 換するツール」HRHRを構想中ですが、これもフリー・ソフトの常で、いつになる かはわかりません。 例えば HRVに、既存のローマ字ファイルを与えてハングル表示させたい場合、 そのファイルの内容が次のようなものであったらどうするか? //delim _ ha_neul_gwa pa_ram_gwa pyeol_gwa si (序詩) Yun Dong Ju juk_neun nal_kka_ji ha_neul_eul u_reo_reo han jeom pu_kkeu_reom_i eops_ki_reul, iph_sae_e i_neun pa_ram_e_do na_neun koe_ro_wa_haess_ta. この場合(このファイル名を haneul.optとします)次のように、一度いずれか のハングル・コードに変換した後に、再びローマ字に変換してください: A>HRKS //optrm HRKS //optrm haneul.std A>HRKS //optrm > 追記:ver 1.20以後の追加仕様 ハングルの単独字母は、 ・単独字母の前には、デフォルトで記号 * を置く 例: *k, *n, *a, *h ・この記号は、ユーザの指定で他の記号に置き換えることができる。こ の方法は、具体的なプログラムのマニュアルに従う。 ・(単独字母一覧はこの付録1を参照) (2) 例文  以下に、例文を示します: Na-bo-gi-ga yeok-kyeo-wo Ka-sil ttae-e-neun Mal-eops-i koi Po-nae deu-ri-u-ri-da  NIFTYの旧外国語フォーラム2番会議室での議論('93/9)以後、音節(ハングル 活字単位)の区切り記号はデフォルトで上記のようになりました。ただし、ユー ザが自分でも指定できる約束ですので、次のような指示と表現ができます: //delim ' Na'bo'gi'ga yeok'kyeo'wo Ka'sil ttae'e'neun Mal'eops'i koi Po'nae deu'ri'u'ri'da //delim _ Na_bo_gi_ga yeok_kyeo_wo Ka_sil ttae_e_neun Mal_eops_i koi Po_nae deu_ri_u_ri_da (3) 区切り記号の省略  人間の「読み書き」に耐えるローマ字という要求から、「書く」立場からは適 当に省略ができなければなりません: //delim - Nabogiga yeok-kyeowo Kasil ttaeeneun Mal-eops-i koi Bonae deuriurida  これは、機械が読み違えない限界まで省略できますが、やりすぎると今度は読 みにくくなります。  「機械が読み違えない限界」とは、「機械に判断できる限界」であり、ローマ 字がハングルの2ボル式キーボードと矛盾する点、つまりハングルでは単独の字 母だがローマ字では表現しない文字(初声のイウン)や、ハングルでは単独字母 だがローマ字では複数文字で表現している場合です。これを要約すると次のよう になります:  ・母音の直前の子音は、(区切らない限り)初声になる 例: jiban ---> (ji)(ban) (誤) jib-an ---> (jib)(an)  ・[kk, tt, pp, ss, jj, kh, th, ph]は、(区切らない限り)絶対に離れない 例: hakkyo ---> (ha)(kkyo) (誤) hak-kyo ---> (hak)(kyo) sokhanda ---> (so)(khan)(da) (誤) sok-han-da ---> (sok)(han)(da)  ・2重母音も、(区切らない限り)くっつきたがる 例: padae kanda ---> (pa)(dae).. (誤) pada-e kanda ---> (pa)(da)(e)..  この3点を念頭に、「大丈夫かな」と思うところには区切り記号を積極的に挿 入した方が安全です。 HRジェネレータでは、ハングルの文字単位で必ず区切り記号を出力します。 「最小限の区切り記号を生成する」オプションはありません。 ------------------------------------------------------------------------- 付録1:ハングル単独字母の表現 KS完成型の定義している以下のものを生成、認識する。完成した字体を構成す るときと同様、toen-sori, kheo-sen-sori以外は k/g, t/d, p/b, r/l の交替は 任意。ただしローマ字生成時は以下のものを生成する。 現代子音: *k *kk *ks *n *nj *nh *t *tt *r *rk *rm *rp *rs *rth *rph *rh *m *p *pp*ps *s *ss *0(*ng) *j *jj *ch *kh *th *ph *h 注意: *0は初声, *ngは終声。ただし KS完成型では同一なので、ロー マ字生成時は *0 を選択。 現代母音: *a *ae *ya *yae *eo *e *yeo *ye *o *wa *wae *oe *yo *u *wo *we *wi *yu *eu *eui *i 古子音: *nn *nt *ns *nz *rks *rt *rps *rz *rq *mp *ms *mz *mng *pk *pt *psk *pst *pj *pth *png *ppng *sk *sn *st *sp *sj *z *00 (*ngng) *gn *ngs *ngz *phng *hh (*qq) *q 注意: *mng 長方形にマル *png 軽唇音、p+マル(いわゆる[β]) *ppng その並書 *gn 爆弾(マルの上につまみ) *00 (*ngng) マルまたは爆弾の並書 *q マルの上に横線(*hのナベブタにつまみがない) *hh (*qq) *h または *q の並書。生成するのは *hh 古母音: *yoya *yoyae *yoi *yuyeo *yuye *yui *@ *@i 注意: *@ はアレア ------------------------------------------------------------------------- 付録2: 徐尚揆 188古文字セットとそのフォント 徐尚揆 188古文字セットは、同先生が PC98 高電社 TechnoMateシステム(KOA コード)上で作成されたユーザ外字セットに起源があります。このシステムでの 外字は使用するプリンタと密接な関係にあり、その理由で外字総数が 188に制限 されていました。この厳しい制限の中で、同先生のライフ・ワークの一部である 「老乞大」刊本6種、「朴通事」1種のテキストが入力、表示、さらにデータ・ ベース処理され、DTPでの出版が行なわれて、これが日本時代の同先生の業績の主 要部分を占めています。 従って、この外字セットは、16世紀以後のハングルの宝庫といえるこれら出版 物のテキストを表現するのに「充分ではないが必要最低限」を満たすものです。 15世紀、訓民正音のテキストを表現するにはまだ多くのものが不足しますが、16 世紀から 20世紀初頭までの文献を扱うには、文字どおり「必要最低限」なセット です。 この外字セットのフォントは KOA TechnoMate用のものをまず徐先生が作成され、 次に、牧尾清さんの尽力によって、やはり高電社 Korean Writerで使える日本語 Windows外字セットに、さらに DOS版である FONTX外字セットに移植されました。 この KOAおよび KWの外字フォント・セットは牧尾さんから、別途公開されています。 HRツール・セットもこれに対応し、KOA, KWツール群では //seoxオプションを 指定することで、この外字コードとそのローマ字表現を、双方向で変換処理でき ます。 このセットは (1) もっとも基本的で頻出する古文字の字体、およびその特殊部品 (2) 稀な文字の中でも出現頻度が比較的高く、徐先生の出版に従って取捨選択 されたもの の2つの部分から構成されています。 (1) のうち「特殊部品」とは、古文字に特有な skV, stV, spV, sjV, .. の冒 頭の s や、pskV, pstV, .. の ps を、既存の現代文字体と組合せて表現するも のと、同様に終声のそれを表現するための部品で、この仕掛けによって、188文字 という制限が大きく緩和されます。 (2) の外字には、(1) の特殊部品で表現できるが単独フォントにすることによ ってより美しい字体が得られるもの(stoなど)、それに (1) の基本セットには 漏れたが、稀に出現するもの(th@lなど)が含まれます。 以下に、徐尚揆 188外字セットに対応するローマ字表現を示します。なお、こ こではおおむね ka-na-da順に並べましたが、変換後の外字コードは必ずしもこの 順ではありませんのでご注意ください。 正確な外字コードの一覧表は、ツール群のソース・ファイル セットにあります。 (1) 第1のグループ:基本的なもの (1-1) 頻出文字 k@ k@n k@t k@l k@m k@s k@i n@ n@n n@l n@m n@s n@i t@ t@n t@t t@l t@m t@s t@i r@ r@n r@l r@m r@s r@i m@ m@n m@t m@l m@s m@i m@in m@ing p@ p@l p@i p@ik s@ s@n s@l s@m s@s s@i s@ing z@ z@l z@m za zae zeo zeu zi zin zil @ @l @m @i j@ j@k j@n j@m j@s j@i ch@ ch@n ch@l ch@m ch@s ch@i kh@ th@ th@n th@s th@i ph@ ph@n ph@l ph@i h@ h@k h@n h@l h@m h@i h@ing (1-2) 複合子音の構成要素 初声の prefixに使うもの4種 *_p *_s *_ps *_sp 終声の suffixに使うもの3種 *k_ *p_ *s_ (2) 第2のグループ:補遺 kams kolp keuin keuns sk@ n@ls nyeons t@in t@ing t@is t@k t@lk t@lp t@ls tans tyangs tyes teuis st@ st@n sto r@ing reums m@ik m@ip m@is mans mals meuls p@n p@lk p@in p@is peuis sp@l s@lm s@lp s@p s@ik s@in sans swang syoi ss@ ps@ ps@l pseu z@n z@ms z@p z@i zaes zeom zyeo zyeon zo zom zu zyuk zeun zeul zeum zeui zim zis @n @p @ik @is ans wat wols uls euns gni (*gn + *i) j@p j@in j@is jeulk ch@ls ch@ik chyui chyul kh@s kh@i th@l th@is thyeos thyuk ph@ls h@lk h@in h@is これらのローマ字表現は、 A>HRKOA //seox sample.koa TechnoMateで読める A>HRKS //kw //seox HRKS //kw //seox sample.kw ファイルに のように、古ハングルに復元されます。 なお、古文字ではない現代文字だが、しかし「古文献にしか現われない」類型 というものがあります(例えば heuis など)。KOA TechnoMateでこの種の文字を 使って擬古文を作成し、この文書を KOA->HR->KWの変換経路を通した場合、しば しば「KOA標準文字セットにはあるが KW(KS完成型)文字セットにはない」ハング ル字体として、ローマ字のまま残ることがあります。 これに該当するハングル字体は、計数的には560文字にのぼり、残念ながら現在 は解決の方法はありません。 ------------------------------------------------------------------------- 付録3:Mac J-Hangulと Korean Writerの文字コードの相違点 高電社 Korean Writerの文字コードは、韓国の「KS完成型」文字コードの完全 な写象で、ただし文字の値を「日本の Shift-JISと同じ論理で Shift」してある 点だけが異なります。これには、漢字、記号、単独字母も、韓国の KS完成型と正 確に同じものが並んでいます。 一方 Macの J-Hangul (KT-Hangul) は、同様に Shift-KSでありながら、次の2 点が Korean Writerとは異なります: (1) J-Hangulは、KSのハングル以外のものを考慮していない。 このコード系では漢字を日本語システムに依存します。また、テン、マ ル、カッコ、びっくりマークなど、ごく普通の文章上の記号も、日本語 フォントに依存します。従って、HRKS //jh の変換では、ローマ字部分 だけがハングルに変換され、その他は「すべて」日本語文字として透過 します。 逆向きの変換でも同様です。 (2) J-Hangulの単独字母は、Korean Writerの単独字母(KS)とは別の位置に ある。(つまり文字コードがちがう) このため、単独字母を含む文章を FWORLDTの表現 [: ... :] で扱う場合、 以下の注意に従ってください。 単独字母の //an, //jh の扱いのちがいについて -------------------------------------------- 例:HR表現でいくつかの単独字母の表現: *k *kk *n *t *tt *r *m *p *pp *s *ss Korean Writerではこうなります: ぁ あ い ぇ え ぉ け げ こ さ ざ (日本語では全角ひらがなに見えるのが正常) これを FWORLDTアンニョンクラブの表現に持ち込む、つまり [: :] で囲 むと、HRKS //an で [: :] の中だけが HRに変換されます: [:ぁ あ い ぇ え ぉ け げ こ さ ざ:] ところで、これらの単独字母に対応する J-Hangulの文字は、Korean Writerと異なり、次のようになります: {鼻 柊 匹 彦 膝 菱 姫 媛 紐 謬 俵} Macユーザの中には、当然ながら { } を [: :] に置き換えて BBS上にア ップする人が出て来ます: [:鼻 柊 匹 彦 膝 菱 姫 媛 紐 謬 俵:] (!) これは、当然ながら KRHS //an では誤変換されます(実際には Shift- KSの漢字コードとみなされて、ほとんどが変換不能文字になります)。 そこで、(!) のファイルを HRに変換するときは、こうしてください: KSHR