ハングル工房 東京綾瀬 − internet上のハングル

Hangeul-Lab Ayase, Tokyo
Ken Mizuno

ハングル工房 綾瀬店 ホームへ
パソコン・ノート 全体目次へ
Mail to home master: Ken Mizuno



internet/Webサイト(ホーム・ページ)上のハングル

課題は、 だとします。もちろんその延長上には、 があります。

この要約では、Macが排除されます − Macでは、「KLKを買って来なさい、それで すべての課題が解決される」からです。言い換えると、internet上のハングルが目的で、会社や友人たち(の Windows)との直接ファイル交換が問題にならない人は、この章を読む必要はありません。もちろん、「ただそれだけ」の理由で Macに乗り換えることも、充分に正当な乗り換え理由です。


どうしたらハングルが出るの?

(1) MS-IE 3

1999.04.28 現在で、MicroSoftは IE-3 (internet Explorer ver.3) への配慮をやめてしまったようです。無料配布の「IE 3 用」ハングルのフォントを求めて、
http://www.microsoft.com/
に行き、その Downloads ボタン以下を探してみたのですが、発見できません。

もし それでも 「私は IE-3でやりたいのだ」という方は、仕方がない; 韓国版 Windowsで使われているハングル・フォントを 「何らかの方法で」 「この(日本版)Windowsに」持ち込むしかないでしょう。また、下の IE4 用のハングル・フォントも、IE 3 で使えます(ただし、入力装置は使えません)。

もしあなたが「腕」に覚えのある人なら、韓国版 Windowsについているハングル入力装置までコピーしてくると、日本版 Windowsでもハングルが入力できるそうですが、一般的には勧めません。

(2) MS-IE 4

次のところで、ハングルの表示フォントと入力装置が 一挙に手に入ります:
http://www.microsoft.com/windows/ie_intl/ja/ime.htm
これをダウンロードすると、IE-4では、ハングルの表示・入力とも快適です。ただし、動くまでに2つほど注意点: なかなか「排外的」です。
でも、それを気にしなければ、少なくとも MicroSoft IE 4 のもとでは、快適にハングルの表示と入力が可能です。
(なお、MicroSoftに私は何の義理もありませんが、「internetからソフトをダウンロードするとウィルスが怖い!」という俗説も、気にする必要はありません; 仮に MicroSoftのサイトからダウンロードしたものに(MicroSoftの意図による)ウィルスが混入していたら、MicroSoft王国はみずから崩壊を招くだけです; MicroSoftって、それほどバカな集団ではありません)
一般論としては:
  1. 新しい Windows機を買った場合、MS-IE 4 が既に動くようになっているでしょう
  2. これを使って、まず internetへのつなぎ方と、ブラウザ (IE 4) の使い方を覚えること
  3. ブラウザで「ファイルのダウンロード」など一連の操作を理解したら、MicroSoftのサイト http://www.microsoft.com/windows/ie_intl/...(上記) から ハングルの表示・入力装置などをダウンロードする
という手順になるでしょう。高速ネットワークにつながった大学などに機械を持ち込めるなら、そこでダウンロードするのが効率的。

(3) Netscapeの場合

MicroSoftがきらいだ、MS-IEなんか使いたくない、という人はおおよそ Netscapeを使うことになると思いますが、その場合は「自分で適切なフォント(と入力装置)を」用意しなければなりません。

一般論として、「N語の正しいフォントがその Windowsに装備されていれば」、Netscapeでは正しく「N語で書かれたホーム・ページ」を閲覧できます。
この「正しいフォント」には、次のものが含まれます:
  1. MicroSoftが(IE-3、IE-4 用に)配布している KS完成型フォント、韓国版 Windowsに付属するハングルのフォント・セット
  2. 日本で売っている高電社の Korean Writerや、CGSという会社の製品 WINK9x などに「おまけ」として付いている、「純然たる KS完成型」用フォント。
    (以上は正統 韓国 KS完成型)
  3. 日本で売っている Korean Writerや WIN9x の、基本的なハングル・フォント(Shift-JIS日本語環境用のハングル・フォントであり、韓国の KS完成型クローン)
    一見、これでは「正しく」出ないような気がしますが、ブラウザの設定メニューで適切な指示を出せば、この操作で「出る」のは事実です。
ご参考までに、僕自身の環境は次のようになっています: 以上の「入力手段 用意せず」は、ダウンロードが面倒で放置しているものです。一方 「入力手段なし」の部分が問題で、これが「ハングルのメール送受信」問題にからんできます。

この他、東京の大学で僕が関与した機械の場合として、次のケースがあります:
上記のケースは、MS-IE 4 を使いながら、ハングルの入力装置だけがサード・パーティの製品である点が特徴です。これは、次の「メール」のところで説明します。

追記: Macで KLKを使わない場合

Macで、KLKを購入しない場合でも、上と同じようにフリーのフォントと入力装置が使えます。
Macで MS-IE 4 を使う場合、同じような多国語化キットが MicroSoftのサイトからダウンロードできます。
Macで Netscapeの場合にも、KLK発売以前にも第3のグループから、ハングル(KS完成型)フォントと、一部では入力器も配布されていました。
ただし、一般的な解決はあくまで KLKです。KLK以外のセットでは、いずれ面倒な手順が避けられません。


どうしたらハングルを入力できるの?

(1) MS-IE 3

結論的に言って、MS-IE 3 では、ハングルの入力はできません; より正確に言うと、「不可能ではないが使いものにならない」です。
今でも MS-IE 3 のままの人は「今からでも遅くない」です。IE 4 に乗せかえましょう。ご自分のブラウザのバージョンがわからない人は、次の2点をチェックしなさい: (2) MS-IE 4

「入力」以前の「表示」に書いたように、次のところでハングル・フォントとその入力装置が一気に手に入ります; 無料です; 「一風呂あびて帰ってくる」くらいの時間がかかることを覚悟しましょう; MicroSoft純正 無料サービスからダウンロードするにあたって「ウィルス」の心配をするのはバカげています:
http://www.microsoft.com/windows/ie_intl/ja/ime.htm
これで、かなり快適なハングル表示と入力が保証されます。
しかしそれでも、2つばかり注意事項があります:
  • この入力装置は、IBM互換機のアメリカ版キーボードを前提としています。日本製の機械のキーボードとは、ハングルの刻印がない点は同じですが、その他に半角記号類の位置が大きく異なります (ご参考までに、僕自身は常に英文キーボードなので、この問題に気が付くのが遅れました)
  • MS-IE 4 とこのフォント+入力装置で、ハングルのメールは「何の問題もなく」読み書き・送受信できます。ただし、そのメールは「相手方が MS-IE 4 (OutLook)ではない」場合、「読めない!」と言ってくる可能性が大です。この問題は、次項 「ハングルのメールを書く/読む/送る」で説明します。

  • (3) Netscapeの場合

    上記の MS-IE 4 用フォントと入力装置は快適に使えるものですが、困ったことに、Netscapeではこの「入力装置」が使えません。(フォントのほうは、使えます。つまり、MSのハングル・フォントがあれば Netscapeでも韓国のホームページは正しく読めますが、入力はできない)
    将来的に Netscapeが修正される可能性がないではありませんが、少なくとも Netscape バージョン 4.5x では、MicroSoftのハングル入力装置が使えません(コンピュータ上には用意してあっても、Netscapeはその存在を認識しません)。

    これは深刻な問題です。
    どうするかというと、MS-IE 3 のときと同様、Korean Writerの「おまけ」についている「KS」入力器を使います。同じものは CGSの Wink-98 にも付いています。
    この組み合せで、MS-IE 3 には「変換・確定」した瞬間に文字化けするという愚かしい問題がありましたが、Netscapeでは問題はありません。

    Netscapeの場合、付属のメール・ソフトにやや問題があって、メールについては MS-IE 4 ほど快適とは言えません。この問題は、次項で説明します。


    ハングルのメールを書く/読む/送る

    (1) MS-IE 4 からの発信と受信

    上の項からひつこく書いているように、MicroSoft自身が無料で配布しているハングルの入力装置とフォントのセットを使えば、MS-IE 4 とそのメール・ソフト OutLook Express では、何の問題もなくハングルが表示され、入力でき、またハングルでメール本文を書いて、送信でき、そして受信できます。くどいようですが、これは次で入手できます; ダウンロードに1風呂浴びて帰ってくるくらいの時間がかかるのは、やむを得ません:
    http://www.microsoft.com/windows/ie_intl/ja/ime.htm
    この組み合せで作成され送信されたメールを受け取った側は、受け取った人のソフトが同じ IE 4 (OutLook Express) であれば、「完全に自動的に」正しくハングルで表示されます。

    と、わざわざ但し書きをする理由は、「受け取った人のソフトが IE-4 ではない」場合には、ハングルがまったく表示されないことがあるからです。その実例として、相手側が Netscape(とそのメールソフト)である場合を、次項で説明します。

    (2) Netscapeからの発信と受信

    Netscapeでは、MicroSoftの無料配布によるハングル入力装置が動きません(Netscapeがこの入力装置を認識しません)(念のため、MicroSoftのハングルのフォントのほうは使えます)。
    そのため、Netscapeの付属ソフトでハングルのメール送信をするためには、他のいずれかのソフト(入力装置)を用意しなければなりません。これには、高電社の Korean Writer V4のおまけ、CGSの Wink98 のおまけが使えることは、前項で書きました。

    何らかのハングル(KS完成型)入力装置を用意して Netscapeのメール・ソフト上でメール本文を書き、送信すれば、これは正常に「どこでも」読めます。もちろん、受け取り側には、最低限 KS完成型のフォントがあり、ソフトは それを認識するものでなければなりません。端的に、Netscapeから送信したハングルのメールは、MS-IE でも Netscapeでも正確に読めますし、MS-IE は(人間が特に指示しなくても)自動的にハングルで本文を表示してくれます。
    実は、Netscapeの付属メール・ソフトには、とんでもない「バカ」があります − 人間が手操作で「これはハングルだよ」と教えてやらないと、文字化けします。このわずらわしさは使ってみると想像を越えるもので、「あ、文字化け」でとっさに「これはハングルかもしれない」と気がつく人は、少数派です; 「普通の」人は「何だかよくわからなくて」放置するので、結局メールは読まれずじまいになるでしょう。

    これが「バカ」だというのは、Netscapeのメールソフトは、Netscapeのメールソフト自身から送られたハングルのメールさえ、自動的に認識できないからです。これは、詳細ヘッダ情報の charset=iso-2022-kr を、送信時には付けるくせに受信時には認識しないという、「バカ・バグ」以外の何ものでもありません。この点、Netscapeの「バカ」具合は、ブラウザ本体とメール・ソフトの間でさえ齟齬がみられます:
    ブラウザ:euc-krを自動認識、iso-2022-kr を認識しない
    メール: euc-krを認識しない、iso-2022-kr も認識しない
    Netscapeのもう1つの問題は、MS-IE 4 (OutLook Express) + MicroSoft配布ハングル入力装置 で発信されたメールを「ぜんぜん読めない」点です。
    これは、Netscapeが悪いとは言えません。IE 4 + MicroSoftハングルIMで作成・発信されたハングルのメール本文は 「普通の KS完成型」なのに・ヘッダ情報が特殊で、Netscapeではお手上げなのです。
    実は、こうして文字化けしたものを別ファイルに取って、それを改めて「ワードパッド」で見ると、「普通の KS完成型」として読めます。しかし、そこまで して読む人は多くない; 僕自身、これに気がつくのに時間がかかりました。
    Netscapeのメール・ソフトは あくまで「メールのヘッダ」情報に頼るらしく、MicroSoftの特殊ヘッダに出会って、Netscapeは「お手上げ」状態になるのです。
    不思議なことに、MS-IE + Korean Writer付属「KS」入力装置でハングルのメールを作成すると、メール・ヘッダは通常の(伝統的な)charset="euc-kr" になりました。これだと、受信者が Netscapeであっても、手操作で正しくハングルを読めます。

    (3) じゃあ、いったいどうしろって?

    まとめましょう: 結局、「どのようなハングルのメールも確実に読める」のは、MS-IE 4 です。ただし、そこから発信したメールは、相手に読んでもらえないことがある

    発信したメールを「相手に確実に読んでもらえる」のは、Netscapeです。ただし、このソフトでは、着信メールは手動操作をしないとハングルで読めないし、主流派である (A) からの着信が読めない! で困ります。

    この両者の妥協点にあるのは、(B) です。しかし、MS-IE 4 のためのフォントと入力装置が一気にダウンロードできてしまう以上、「わざわざ そのためにサード・パーティの入力装置を使う」人がいるかどうか。東大と東京外大の院生の部屋では この設定をしてきましたが、「サード・パーティ」の入力装置が商品としていつまで生き残るかは微妙です。

    僕自身は、2台のパソコンに (A), (B), (C) のすべてを分散して用意しました: 一般的な話として、「MicroSoftがきらいなので MicroSoftの製品を使いたくない」人は、しかしその MicroSoft製品からメールを受け取った場合のために MicroSoft製品を用意しておかざるを得ない − なんと矛盾した話か; 世の中って、そんなもんかもしれません。

    MicroSoftが市場を制覇し、その覇権を維持するためにこそ、MicroSoft製品は他社との差別化を進めて行くでしょう。「MS-IE 4 によるハングル」は、その先駆けであるような気がします。Netscapeさんはこれを追いかけるのかどうか − ま、その先は、当ページの守備範囲ではありません。


    ハングル・メールの文字化け − 経路問題

    文字化けは、大別して2種類です:
    (1) メール・ソフト自身がハングル表示能力を持たない
    (2) 転送経路の途中で化ける
    (1) メール・ソフト自身がハングル表示能力を持たない

    Netscapeでは 「MS-IE 4 + MicroSoftハングル入力装置」からのメールが読めないのは、この範疇かもしれません。
    ただ、これは「Netscapeにその能力がない」というより、「MS-IE 4 の独善」と言うべきで、「メール」という公共の世界に「MicroSoft製品でしか互換性のない」仕掛けを持ち込むことの是非こそ、問題とするべきでしょう。
    しかし市場は MicroSoft圧倒優位の状態なので、これを理由に MicroSoft製品を使わざるを得ない状況は、しばらく続くかもしれません。

    これ以外のケースでは、現在のパソコン(に付いてくるメール・ソフト)に「能力がない」ことはまず考えられなくなりました。ただし、日本で買ったセットには(そのままでは)ハングルのフォントも入力装置も乗っていないので、その点を再度考えてください。これは、このページの 先頭 から再度お読みくださいな。

    (2) 転送経路の途中で化ける

    案外バカにできないのが、このケースです。
    端的には、古典的なパソコン通信 − 具体的には NIFTYSERVE − を中間で経由したハングルのメール本文は、100% 確実に文字化けして、ほぼ復元不可能です。

    (2-1)例えば、Niftyの端末ソフトからハングルのメールを送信すると、送信時点で(Niftyホストが送信メールを受け取った時点で、つまり相手側に配信される以前に)、ホスト上では既に文字化けしているので、これは絶対に相手に正しく届きません。
    この現象は、「日本の」パソコンの文字コード系が Shift-JISという特殊なものであることに由来します。ここでは詮索しないことにしますが、文字コード論が好きで・かつ・おヒマな方は、パソコンの Shift-JISと unixの eucの関係、日本のパソ通はこの両者を同時に相手にしていることを念頭に、頭の体操をなさってください。
    (2-2)internet上のどこかからハングルのメールが Niftyに届いたとき、仮に Niftyの「私」へのサービスには「私のinternetメールに転送してくれ」と設定してある場合、Niftyホストはこちらに転送してくれます; が、この転送時点で完全に文字化けし、復元も事実上不可能になります。
    これも、上と似たような理由から発生します。
    やはり詮索はしませんが、Niftyホストはハングルのメールを「半角カナ」入り日本語文だと誤認し、そして「internetでは半角カナは御法度」原則を適用したうえで「わたし」に転送してくれます。かくして、(誤って認識された)半角カナが全角に展開されて、メール本文は見るも無残な姿になってわたしには届きます。
    解決方法:

    簡単。ハングル・メールに、Niftyを使ってはいけません。
    相手のメール・アドレスが Niftyのそれだったら、英文にするか、本文は別ファイルの「添付」にするかです。ただし、伝統的なパソ通ソフトではこの「添付ファイル」は取り出せないので、あきらめがかんじんです。

    問題は、歴史と伝統を誇るパソコン通信(例えば Nifty)は、Shift-JISという特殊な・しかも大口会員を抱えていて、それが「世界のほぼすべて」であることです。
    残り少ない「パソ通」の歴史の中で、これが解決されることは まず ないと思います。

    (2-3) 韓国のパソ通 CHOLLIANでも類似の文字化けが起こる

    不思議なことに、韓国のパソ通「千里眼」を一端(送信・受信の)とするメール交換でも、同様の文字化けが確認されています。
    何が不思議かというと、韓国のパソ通と internetの間で文字コード系の矛盾はない(どちらも KS 8+8)のに、「千里眼」と internet間のメールが、確実に・互いに読めないのです。

    確認できたのは、千里眼のパソ通端末と、日本の東京にある internet端末の間です。韓国内で千里眼と internetメールの間でどうなのかは わかりません。
    いずれにしても、「千里眼」内部と外部のゲートウェイを通過するとき、あるいは国際回線との専用?ゲートを通過するときに、「パソ通」固有の事情で「何か」が起こっているのだと思います。

    (2-4) ホームページ上での無料メール・アカウント サービス

    MicroSoft、Netscape、Yahooといった有名なサイトには、「無料であなたのメール・アカウントを作れます」というサービスをやっているところがあります。
    これは、例えばこんな場合に使えます − 会社(や学校)では電子メールが使えるが、自宅にはパソコンがない。また、日中 仕事でメールを使うのはよいが、仕事のメールを私用に使うのは、社会的にもプライバシーの面でも具合が悪い。

    こういう場合、適当なサイトに行って「無料メール・アカウント」をもらうと、まったく・完全に私的なメールが使えます。使い方は、単なる「ホーム・ページ」の一種にすぎません; アクセスして、名前とパスワードを入力すると「私」の私的メール画面に至ります。パスワードで保護されるので、他人に読まれる心配もありません。

    実際、留学生で大学の研究室には機械があるが、自分で機械は持っていない、あるいは下宿の電話から internetにはつなげられないケースで、これを活用している人たちがいます。
    さて、そういう留学生が、Yahoo USAのサイトに、個人メール・アカウントを開きました。原稿を韓国に送る都合があるので、それも添付して、メール本文はハングルで書きました。念のため同じメールを、僕あてにも cc で送ってもらいました。
    送るとき、画面には正しくハングルが出ていました。送った後、「送信済み」内容確認でも、やはり正しくハングルが読めました。
    そして、僕は自宅に帰ってそのメールを読むと − 残念でした、すっかり、文字化けしていました。いや、正確には、USA YAHOOはハングルの文字コードを認識できなかったので、わざわざ「ある種」のエンコードをしたうえで送信してきたのです。
    そういうわけで、この種の「無料アカウント・サービス」に、僕は警戒的になりました。なお、現時点では Netscapeや MicroSoftの同種サービスはチェックしていません。
    (この種のメール・アカウントを使っている方へ: よろしければ、その入力画面から僕あてにハングルのメールを送ってくださらないでしょうか? 文字化けの有無を含めて、結果は報告します。こうした解析の積み重ねが、「より快適な internet空間」を作るのです)

    おまけ:文字化けしても「添付 Attachment」があるさ

    以上のすべての「文字化け」メールの場合でも、「添付」だけは正常に転送されます − だって、これは「ファイルの内容を物理的に転送する」わけですから、これが壊れたら「添付」の意味がありません。

    ただし、相手が伝統的なパソ通ソフトである場合には、この「添付」を受け取ってもらえません・・・ 「添付」というメカニズムそれ自体が、実は internetメールの機能であって、伝統的なパソ通にはなかったからです。

    (そして、「添付ファイルを開くな! ウィルスがこわい」という話もあります。世の中って、そんなもんです。「添付」では、そう、ウィルス・マクロを含む「ワード」のファイルを「厳密に、正確に、そのまま」送れるわけですから)


    ハングルのホームページの作り方

    簡単。
    作っていないものの「作り方」を解説するのは気がひけたので、作ってみました:
    サンプル・ページ:
    「作り方」は、要するに「日本語じゃなくて、ハングルで書けばいいのよ」に尽きます。ただし、日本語環境(日本版 Windows)の中でハングルを「書く」には、(MicroSoft配布のものであれ、サード・パーティのものであれ)ハングル入力装置だけでなく、「入力されたものを正しく編集できるソフト」が必要である点が、ちょっと面倒ではあります:
    1. HTML言語のファイル(つまりホームページ)を、手作業で作っている場合:
      • この場合、「手作業」で作るためのソフト、つまりエディタがハングルを正しく認識するかどうかが問題です。
      • 上のサンプル・ページは、高電社の「おまけ」KS入力器を使って、エディタも Windows日本版の「おまけ」の「ワードパッド」で作りましたが、非常に面倒でした;
      • 日本版エディタに共通して起こる問題は、それがたとえ KS完成型の表示能力を持っていても(フォント切替ができ、かつ KS完成型の入力を受け付けても)、カーソルの移動に伴って「2バイト文字」の切れ目を、必ず・どこかで・確実に読みちがうことです。その結果として、入力後の編集や、エディタ画面上での改行点では「一見」文字化けが頻繁に出てきます。
      • これは、Shift-JISと KS完成型という2つのコード系(の値の範囲)が根本的に異なるので、避けられない問題であり、一般論として「一見文字化けだらけ」なので、あまり使い物になりません。
    2. 何か特に(例えば Home Page Builderのような)ソフトでページを作成する場合:
      • この場合にも、そのソフトが「ハングル」を認識して、それをテキスト本文として入力できるかどうか、という問題があります。これは、当然ながら「ソフトごとにみんなちがう」ので、ここではどうとも言えません。
      • 仮に そこでハングルを入力できたとしても、その多くは(Shift-JISしか念頭にないので)編集の途中や改行点で「一見文字化け」を起こすだろうと思います。
    結論的には、「パソコンの日本語だけを念頭において作られたシステムでは、正しくハングルの文章を、満足に書けるという条件を満たすものは、皆無である」ことになります。

    対策または救済策:
    1. コロンブスの卵 − ハングルのホーム・ページは、韓国版 Windowsのもとで作成する。もちろん、次のどれでも可能です:
      • 韓国版のエディタ(ワードパッドその他)で HTMLをしこしこと書く。
      • 韓国版のワープロ(Wordなど)で画面設計から入力まですませてしまう; その後に「HTML形式で」保存し、これをホームページに上げる。
      • 韓国版の Home Page Builderなどのソフトを使う。
    2. 日本版のワープロ「アレア」などで作成し、「HTML形式」で保存して、これをホームページに上げる。
    3. その他、日韓共通に使えるフリーソフト、シェアウェア等を探す;
      最近この種のソフトが出はじめているようです。関係サイトをたんねんに見て回れば、情報が得られるはずです。要は「必要を感じている人が、それを発見できる人」であることを忘れずに。

    HTML 言語ヘッダについて

    以下 「HTML」は 「ホームページ」と読みかえてかまいません。

    この項は、各ホームページ作者たち・個々の意思に関係します。

    例えばある人が、あなたのページに導かれたとします; その人は、さっきまで韓国のあるページを見ていました; そこにはあなたのホームページへのリンクがあって、その人は このリンクをクリックしました; 飛んできた先のあなたのページは日本語で書かれているので、文字化けしました; そんなことは日常的なことなので、見ている人はブラウザの「言語」設定を変更してみました; ふむ、日本語になりましたね。
    しかし、その「わずらわしさ」は、避けられない。僕自身は、ある日 対策をほどこしました。

    HTML言語には、「以下は何語のどんな文字系だよ」と指定する機能があります。この「何語のどんな文字系だよ」は 「そのページ全体がその言語、つまり1言語に固定」であり、また internet関連団体で現在も改訂が続いている段階なので、まだまだ変転をくりかえすことが予想されます。が、そのうち 1990年代初期までに決定された次の2つは、MS-IE 4 でも Netscapeでも、一応・確実に動作するようです:
    画面表示を強制的にハングルにする:
    <meta http-equiv="Content-Type" content="text/html; charset=euc-kr">
    画面表示を強制的に日本語 (Shift-JIS) にする:
    <meta http-equiv="Content-Type" content="text/html; charset=x-sjis">
    悲しいことに、これ以外の (これより後にプロポーザルの出た)「言語」タグについては、MS-IE 4 と Netscape 共通に動作するものがありません。例えば "charset=ks_c-5601-1992"? だったか を MS-IE 4 は認識しますが、Netscape(のつい昨日のバージョン)は認識せず、そこでは「どんな操作をしても文字化け・読めない!」状態に陥ります(悲しいですね)。

    以上は、ホームページ(以下の各サブ・ページ)を異なる文字系で作成する人のための注意書きです。
    ホームページ作成者各位へのお願い: ねがわくば、あなたのページが何語で書かれているか、その各ページ(すべてのページ)のヘッダ部分に、上記の1行を挿入してください。ただそれだけで、閲覧者は「これは何語だろう、とりあえずハングルかもしれない」とマウスでカチカチやってみる手間が省けるのです。このわずかな配慮の差が、「あなたのページの受容範囲(読者人口、世界の広さ)」を決定するかもしれません。

    「見る・だけ」の立場からは、ホームページ側でこの設定をしてあるかどうかによって、「手操作」が必要かどうかが決まります。一方、最悪の場合 「見る」側では「どうやっても文字化けが解消できない」結果になるので、ページ作者各位は注意されたい・・・

    ホームページを 「見る」だけの場合の(再度)説明:
    HTML言語で書かれたあるページ(ホームページの、正確には「そのまた・ある」1枚のページ)は、デフォルトでは、末端のブラウザの設定によって「ある言語(文字)系」で表示されます。
    日本で動いているブラウザ設定では、それは まず 99.99%「日本語」になっていて、かつ・実は日本語の文字コード系は「Shift-JIS(パソコン)」と「EUC(Unix)」の 少なくとも2本立てなので、ほとんどの場合は「自動判別」になっています。
    この設定は「日本の」 Web端末(つまりブラウザ)では おおよそ一貫してそうなっているので、日本のホーム・ページたちの多くは、何の断りもなく(端末が日本語設定になっていることを期待して)、いきなり「日本語」のホームページ内容を送りつけてきます。

    韓国でも、事情は同じです。韓国の Web端末ブラウザのほぼ 100%は 「標準的な KS完成型」つまり「ごく普通のハングル(+漢字・記号類)」が出るようになっています。

    従って、日本の「ごく普通の」ブラウザ環境で韓国のホームページを見るとでたらめに文字化けし、逆に韓国の「ごく普通の」ブラウザ環境では日本のホームページが同様に文字化けします。

    韓国のホームページを読むためには、そのためのフォント・セットと、ブラウザにその解釈をする能力がなければいけません; 日本のホームページを読むには、同様にそのフォントと、ブラウザの能力がなければなりません。幸いなことに、現在の主流である MS-IE 4と Netscapeは、どちらもその能力を備え、その切替は「手操作」で できます。

    だから、ここまで・るる説明してきた「ハングルのフォント」を実装すると、「手操作で」 日本のパソコンでも韓国のハングルのホームページが読めるようになり、韓国のパソコンでも、日本語フォントを実装すれば、日本のホームページが正しく読めます。
    この図式をまず完成させたのは Apple/Mac でしたが、後を追って「internet環境に限って」その図式を用意したのは MicroSoftでした。その意味で、MicroSoftも決して「悪の巣窟」であるばかりではありません。
    この段階で、日本語ベースのシステム(日本版 Windowsや 日本版 Macのブラウザ)では、「韓国」のホームページへのリンクを追うと まず文字化けするが、しかし「手操作で「言語」を指定すれば正しくハングルが読める」状態が実現します。

    「その」ページが文字化けするなら、止むを得ません; 手操作で「これはハングル」あるいは 「これは日本語」と、ブラウザに指示してやるだけのことですね − それでも文字化けが直らないなら、それは ページ作成者と あなたのブラウザの「相性が悪い」のです。具体的には、あなたが MicroSoft以外のブラウザを使い、ページ作成者が MicroSoftの 製品でそのページを作っている場合です・・・ この対策として「MicroSoft製品で一貫する」方針をとるかどうかは、MicroSoftという会社への好き嫌いに落ちるしかありません。
    以上のまとめ:
    あるホームページが文字化けするなら、あなたのブラウザのフォント(文字系)の設定をチェックすること; その設定がすんでいるなら、「手操作で」ハングルか日本語かが出るようになる・はず。それをしても 相変わらず「化け」状態なら、それは ページ作者と「あなた」のブラウザとの「相性」問題である;

    最新情報:
    Netscape 4.51 では、"charset=ks_c-5601-1992"? のページが正しく読めるということです。これは僕自身のブラウザですが、たしかに「文字化け」ページに出会う頻度は低くなったような気がします。
    もっとも、日本のホームページも韓国のホームページも、「何の断りもなく自国語読者」を期待している点、当分の間は常に「手操作」で切替が必要だろうことに、あまり変化はありません。


    1枚のページ内での日韓混在は可能か?

    現在の HTML言語では、複数の文字コード系の同時混在は不可能です。この(書式整形)言語では、特定の1枚の「ページ全体の」文字コード系を指定できるが、そのページ内で、任意の位置で任意の他のコード系に切り替えることはできません。
    つまり、日本語の Shift-JISなり euc なりのページの中に、韓国の KSコードが混在することはできません。逆に、韓国の KSコードのページに、日本の文字系が混在することもできません。

    原理的に不可能なら、「実践的に」可能にしてしまえ・と考える人がいてもおかしくありません。
    (1) 日本語ページの中で Korean Writerのハングル・フォントを指定してしまえ
    (2) 閲覧側が MS-IE 4 以上であることを期待して、「部分的に Unicodeによるハングル」を使う
    (3) ページ全体を Unicode、特に UTF8 コードにしてしまえ
    (4) 韓国の KSコードにある日本語文字を使えば、擬似的に日韓2言語 混在ページが作れる
    第1の方法は、具体的には、MS-Wordで Korean Writerを使い、ファイルを 「HTML」形式でセーブすると、こういうページができます。
    この方法は、真の意味で 「2言語混在」ではありません。なぜなら、Korean Writer(やその類似品、以下同じ)のハングルは「あくまでも日本語フォント」であって、見せかけはハングルだが文字コード自体は単なる Shift-JISにすぎないからです。
    この方法を使うと、ページを作った人自身には、正しくハングルが読めます。ただし、Korean Writerの「ない」パソコン上では、ハングルがすべて文字化けします − なぜなら、HTMLが指定している(日本語=擬似ハングル)フォントが、端末(ブラウザ)側に存在しないから。
    同様に、この方法で作ったページは、韓国のパソコンでは完全に、悲惨な文字化けの嵐になるので、日韓の間でのコミュニケーションには「使いもの」にはなりません。

    第2の方法、つまり MS-IE 4 で可能になった(日本語ページの中での)部分的 Unicode混在は、「読む」側が MS-IE 4 以上であれば、確実に読んでもらえます。が、それがまず 「MS-IE 4 でなければだめ」という点で、僕自身は使いたくないし、勧める意思もありません。実際、この回路(Unicode 部分埋め込みによる日韓混在)が一般化しないのは、ただ・その理由によると思います。
    この方法の実態については、下の別項で再度説明します。

    第3の方法、つまり「ページ全体を Unicodeで、それも UTF-8 と呼ばれるコードで作成する」方法は − HTML言語は「複数文字コード系の切替」を想定していないので、 HTML言語の中では Unicodeを指定し、その Unicodeは実は内部的に「多言語」だという点を生かしたものです。これは、近い将来には期待できるかもしれないし、既に、全面的にこれを採用しているサイトが出てきています。ただし、Unicodeを表示するのはブラウザの仕事なので、現時点では次のような重大な制限が伴います:
    (1) この日韓混在ページは、MS-IE 4 以上でなければ「全体を正しく」読めません
    (2) Netscapeでは、「部分的にしか見えない」か、「混在する片方しか見えない」
    この UTF-8 による多言語混在については、下の別項で再度説明します。

    第4の方法も、現実に行われています。韓国側にも日本語のかな・カナがありますから、それで日本語らしきものが書けます。これは韓国内の日本語愛好者の間で使われる方法でもあり、また日本でも、よんどころない事情で 日韓混在文が必要な場合に、最後の手段として使われる場合があります。よい例として、次の例は 日韓混在の図書目録です:
    http://vanilla.fs.tufs.ac.jp/~noma/ref1980k01.html
    1980年代以降の日本における現代朝鮮語文法論・語彙論研究−言語事実主義の展開−:参考文献(Korean:ハングルのフォントが必要です) 08 June
    (東京外大 教授 野間秀樹氏)
    この方法は(読者側に KSフォントさえあれば)確実に読めるのは事実ですが、ページ作成側の作業はものすごく面倒です。特に日本語部分の入力は「普通の方法では不可能」なので、「作る」側の問題として一般性はないと言うべきでしょう。

    以上をまとめた結論としては、「確実に読んでもらえる、複雑な手順をとらずに作れる」両面から、現時点では日韓混在のページをあきらめることが、もっとも賢明なような気がします。

    日本語部分は日本語ページで、ハングルはハングルのページで、互いに内部リンクですませるのが確実です。どうしても日本語とハングルを混在させたい場合は、仕方がない、僕は「より字数の少ないほう」を画像ですませてきました(ハングル工房 綾瀬、朝鮮文学と語学のページたち)。

    それでも以下 数項目、現実に存在する日韓混在ページの問題を解説して行きます。動作環境(ブラウザやフォント)を整理して、「とにかく・何らかの方法でそのページを読む」方法だけは列記しておきましょう。


    Unicodeの部分埋め込みによる混在 − MS-IE 4

    これは、MS-IE 4 (またはそれ以上)という特定のブラウザ「だけ」を対象として、その「現在の」ページの文字系が何であれ、ある部分だけに Unicodeを埋め込んで、例えばそこだけハングルを表示するものです。

    実例画面の一部を示します。次の画像は、友人のホームページの中から、この機能による日韓混在を実現したものです:

    出典:http://www.geocities.co.jp/Hollywood/8908/business.html ヘバラギ氏のホームページより

    まず、MS-IE 4 で見た様子:


    上記は MS-IE 4 ですが、困ったことに Netscapeでは次のように見えてしまいます:



    ところで、Netscapeで、画面表示を Korean/韓国語(この場合 Gulimcheに設定)にしておくと、あら不思議、表示と文字化けの具合が反転します。Unicodeで KS完成型 Gulimche書体が出るのは「設定」によりますが、Netscapeが 「Unicodeを知らないわけではない」証拠にはなっています:



    さて、このページの HTMLソース・ファイルを見てみましょう:



    見れば明らかなように、この日韓混在は 「部分的に Unicode(の文字コードの値)を埋め込む」ことで実現されています。この意味を理解して 期待通りの動きをするのは MS-IE 4(+) だけであり、他のブラウザでは「???」という結果になります。

    別の言い方をすれば、この機能は internet上でも先進的であろうとする MicroSoftの、「時期の早い」実験的な機能であったように思われます; もちろん、それが汎用性を持ち、広く受け入れられるものであれば、業界他社がこれに追随する可能性もありました。が、残念ながら、追随者はないようです。「もしも」 MicroSoftのブラウザ(とそのページ作成環境)が世界の 100%を支配できれば、この機能は「世界標準」になったかもしれませんが、「まだ」 MicroSoftは 100%を支配できていません。

    なお、この「部分埋め込み Unicode」は、MicroSoftの MS-IE 4 用 ハングル・フォント/入力装置セットを使えば、ホームページ上の「掲示板(芳名録)」などでも対話的に使えます − つまり、「掲示板」でも日本語とハングルの混在入力ができます。ただしその結果は MS-IE 以外のブラウザでは読めないことを、記憶のどこかにとどめておかなければなりません。

    MicroSoftが、これ(Unicodeの部分埋め込み)を発展的に維持するかどうかは、否定的だと思います。というのは、これと並行して Unicode/UTF8 コード系が登場していて、MS-IE 4 ではこれがより本格的に使われはじめ、また Netscapeもこれを追う姿勢を示しているからです。
    「部分埋め込み」は、日本語環境のオンライン「掲示板」などで「その場限り」のハングルが必要なとき、当分は使われるかもしれません − MS-IE 以外の参加者を排除する前提で。

    Unicode/UTF8と、その際に「既存のコード系との互換性」をどう考えるかについては、次項以下で説明します。



    Unicode "utf-8" コードによる日韓混在ホームページ

    (1) Unicode "utf-8" を美しく表示する MS-IE 4

    まず、Unicode - utf8 によるページを美しく表示する MS-IE 4 の画面をみましょう。
    もし画像が不鮮明ならごかんべんを。しかし、英文字は Times-Romanで、ハングルは Gulimcheで、日本語は MS明朝と MSゴチックで、それぞれ正しく表示されている点に注目してください。また、画像中のハングルで説明されている 「Unicodeフォント」については次項以下で説明しますので、今はその文面にこだわらないでください:

    出典:http://www2d.biglobe.ne.jp/~kmlabs/ehc/unitest.html - 有名な「キョン・ア」氏のサイトより(99年8月現在)


    MS-IE 4 には、「Unicodeをどんなフォントで表示するか」という「設定」画面がありません。言い換えると、Unicodeはその文字コードの値自身が「何語だよ」という情報を内包している(暗黙のうちに指示している)ので、この暗示に従って、MS-IE は それぞれの「言語(フォント)」設定に従って、ここでは英文を Times-Romanで、ハングルを Gulimcheで、日本語を MSゴチックで、自動的に選択しつつ表示をしているのです。「何語」かが不定になる(日・韓・中簡・中繁)漢字については、OSの基本設定(ここでは「日」)が選択され、そのフォント設定の MSゴチックが使われているようです。

    (2) Unicode "utf-8" を美しく表示できない Netscape 4

    これに対して、Netscapeには「Unicodeをどのフォントで表示するか」という設定画面があります。これを英文字や日本語フォントのままにしておくと(デフォルト)、どんな操作をしても文字化けに苦しめられます。日韓混在のためには、Unicodeの表示には (ハングルもかな・カナも持っている) KS完成型フォントを指定しなければなりません。その結果として、次のような表示が得られます:



    さて。これ、なあに?
    (1) 英文字は、ハングル字体 Gulimche内の英文字で表示されます。
    (2) ハングルは、もちろん正しい Gulimcheハングルで出ています。
    (3) 日本語は、Gulimcheフォントに含まれるかな・カナ字体で表示されていますが、
    (4) 日本語に特有の「略字体」、それにテン・マルの類に異常が見られます。
    (5) (ただし、日本語部分の一部は正しく表示されているこれは、その部分だけ特に日本語フォントが指定してあるからです)。
    誰がみても 「とってもおもしろい」、かつ 「あほみたい」な表示だと思います。こんなものなら、MS-IE のほうが、よほど美しい。

    その通りなんです。この限りであれば、Netscapeなんか バカみたい。
    しかし、それだけではすまされない、ある、論理上の問題があるのです。これは、以下に追記します。


    Unicodeフォントのその後

    上記のサンプル・ページの作者 キョン・ア氏によれば、このサイトからリンクが貼ってある CybetBit という企業のホーム・ページでは、現在は無料の Unicodeフォントは削除されています。氏によれば、当初は「評価用」に無料で基本セットがダウンロードできたそうですが、現在は ありません。

    つまり、Unicodeの立ち上げ時代に華々しくフリー・フォントを配布した企業は、現在は それどころではない、と考えるのが適切ではないかというのが、僕の考えです。
    Netscapeが現在でも 「Unicodeはどのフォントで表示する」という設定画面を残しているのは、おそらく こうした「Unicodeプロパーのフォント・セット」を仮定してのことだと思います。しかし、今では − つまり 1999年9月時点で「Unicodeプロパーのフォント・セット」なんて、よほど特殊な職業的立場にある人でなければ、入手は不可能です。Netscapeでは、いま現在、Unicode/UTF-8 を「正しく、美しく」表示する手段は ありません。
    追記:情報あり、Unicodeフォントそれ自体は市販のフォント・セットがあるようです。典型的なものとして、例えば次のところで、100種にも及ぶフォント・セット(書体)を販売していて、これは秋葉原の普通のお店で買えるそうです:
    http://www.dynalab.co.jp/TT100/TT100.html - DynaLab, DynaFont Type Museum TrueType 100 (Unicodeフォント・セット2種を含む)
    しかし、困ったことに、これには(ハングルの個々の字母は含まれるのですが) ハングル字体が含まれていません (がっかり)。
    もちろん、このセットには伝統的 KS完成型 ハングル・フォントが入っていますから、それでハングルは出ますし、MS-IE 4+ なら Unicode/UTF-8 ページを表示してくれます。でも、それなら − 何もおカネを出してフォントを買う必要はなくて、MicroSoftのサイトから無料ダウンロードできるではないですか。
    いま現在、Netscapeで Unicode/UTF-8 を「正しく、美しく」表示する手段は − もしハングルを必要とするなら − 現在もありません。だからこそ、一時は Unicode に全面移行したはずの 日韓友好サイトたちも、事実上それを「取り下げ」状態にあるのです。
    「正しく、美しく」表示するだけなら、MS-IE 4 以降を使うことです。しかし − 困ったことに、これはこれで問題を含んでいるのです。(次項へ)


    フォント自動判別の何がいけないか

    MS-IE 4+ では、上で申し上げた通り、Unicodeの(文字コードの)値の範囲から、「この文字はハングル、この文字は日本語、この文字は漢字だから そのOSの基本言語系は何、故に漢字は日本漢字のフォント(あるいは韓国漢字の、台湾漢字の、北京漢字のフォント)」という選択が自動的に行われて、画面表示は実に美しく出ることは、否定できません。

    ハングルに話を限りましょう; Unicode/UTF-8 に出会ったとき、MS-IE 4+ は、ある文字がハングルであれば、それを 「既存のコード系のフォント」で表示しようとします; 「既存のコード系」とは すなわち「KS完成型」 2350文字のハングルに他なりません。つまり、Unicode/UTF-8 で表示できるハングルの文字種は、少なくとも原則的には、「KS完成型」本来の 2350字でしかありません。この範囲を越えるハングルは、少なくとも 「原則的に」出ない、文字化けする運命にあるのです。

    それにもかかわらず、IE 4+ の画面には、その「2350字」の範囲を越えるハングル − 例えば neuing とか heuis とかいったハングル字体が表示されるかもしれません。それはそれで、否定するべきことではないかもしれません; でも、それは、「Unicodeの値から判別された KS完成型の対応文字形」としては破格であって、いわば 「MicroSoftによる勝手な KS完成型 拡張文字」にすぎないのです。
    その程度の「拡張」なら、Macの KLK (Korean Language Kit) にも見られます。しかし、Macと Windowsが互いに 「勝手な拡張」をしあえばどうなるか − それは誰にも想像できる結果を招くだけです。

    ただ、MS-IE 4+ 用として配布されている Gulimche (kul-lim-che) フォントには、「KS完成型」の範囲を越えて 「組み合せ型」 1万余字の字体が含まれているのは事実のようです − 日本のホームページを ハングル・フォントで表示させたとき見える (Windows上の)すごい「文字化け」の中には、実に奇妙キテレツなハングルが含まれていることに気がついた方がいらっしゃると思いますが − あれは、Gulimche (kul-lim-che) に含まれる「組み合せ型」ハングルらしいのです。

    Unicode最新のハングル文字セットは、最終的には(公式には、定義として)「組み合せ型」と同一のものになるようです。従って、Gulimche (kul-lim-che) フォントが一早くそのセットを用意していても不思議はありません。ただ、それならそうで、もう少し早くからアナウンスしてくれたらよさそうな気もするのですが。


    (このファイル終り)