たくき よしみつ の デジタルストレスキング デジタルストレス王

2001年12月26日執筆  2002年1月15日掲載

山一女の孤独

昨年9月の米国大規模テロ事件(911事件)の後、インターネット上で、こんなデマ(というか悪戯)が広まった。ご存じのかたも多いとは思うが、念のため概要を:

WTC(世界貿易センタービル)に突っ込んだ2機のジャンボジェットのうち、1機の便名は「Q33ニューヨーク行き」だった。この「Q33NY」を、ワープロソフトなどで記述して、そのフォントを大きな(48ポイント以上の)Wingdings(Windowsに標準でついてくる絵文字フォント)に変更してみる……。
すると、飛行機が、2つ並んだビルに突っ込み、その横にはダビデの星(ユダヤのシンボル)と髑髏マークが現れる、というもの。
これが問題の……
実際には、WTCに突っ込んだジャンボは、AA11とUA175。乗っ取られた残りの2機もAA77とUA93で、Q33NYという便名の飛行機は存在していない。
また、2つ並んだビルのように見える絵文字は、本来、文字が書かれた「書類」を表すもので、それを窓が並んだビルに見立てたというわけだ。なるほどね。
この「Q33NYの衝撃」は、あっと言う間に全世界に広まった。考えついたやつはさぞかし得意だっただろうが、もちろん、趣味がいいとは言えない。

ところで、こんな悪戯ができるのも、コンピュータ上ではあらゆる文字が「コード」で表されているからだ。
私たちがキーボードから打ち込んだ文字は、コンピュータによって、0と1の組み合わせだけのコードに変換され、記憶・伝達される。そのコードにどんな文字や記号が対応しているのかは、文字コード表と、それに対応したフォントセットにより決まる。普通なら「Q」を表す文字コードに、Wingdingsというフォントセットでは飛行機のマークが割り付けてある。同様に、Nには髑髏、Yにはダビデの星が割り付けられているというわけだ。

このコラムもそうだが、書き手が書いた文書を、読み手がその通りに読むためには、共通の文字コードとフォントセットを使用していることが前提になる。言い換えれば、現代人は、文字コードとフォントセットという、一種の「暗号表」を介して文書のやりとりをしている。

完全に違う「暗号表」なら解読不能だが、微妙に違っている暗号表を持っていると、予期せぬ誤解が生じる。
WindowsとMACでは、使っているフォントセットに、同じ文字コードでありながら違う文字が割り付けられている領域がある。例えばWindowsで○付き数字の1を書いたつもりが、それをMACで見ると(日)という、日曜日を表す記号になる。
同様に「ルート記号」を書くと、MACでは○の中に「下」と書いてある記号になる。
これが、いわゆる「機種依存文字」というやつで、何かとトラブルのもとになる。例えば……

【注意事項】
(1) ゴミは朝6時前には出さないこと
(2) 必ず分別すること
(3) カラスに注意

……という文章が、

(月) ゴミは朝6時前には出さないこと
(火) 必ず分別すること
(水) カラスに注意

……となっていたら妙なものだ。月曜日以外なら6時前に出してもいいのか? とか、カラスは毎週水曜日にだけ襲撃するのか? などと悩む人が出てくるかもしれない。

きちんと書いたつもりの文書が相手に伝わらないと、送り手も受け手もストレスがたまる。
「これだからMACユーザーは困るんだよなぁ」
「冗談じゃない! Windowsではハートマークさえ書けないくせに。おまえこそ○付き数字なんか使うんじゃない!」
……なんて、喧嘩になったりする。こんなストレスは、紙に手で文字を書いていたアナログの時代にはなかったことで、まさしく「デジタルストレス」の代表症例だろう。

ああ、また、前振りが長くなってしまった。表題の「山一女の孤独」のお話に移ろう。

これ、「やまいちおんな」と読んでいただきたい。しかし、山一証券がつぶれて解雇されてしまった女子社員の悲劇ということではない。
「やまいちおんな」というのは、文字コード研究家(とでも呼べる人たち)の間では有名な「幽霊字」のひとつで、「妛」という文字のことだ。
妛……僕はIMEに「やまいちおんな」の読みで登録してあるので一発変換できるが、普通にはなかなか出せないかもしれない。しかし、れっきとしたJIS漢字(JIS=日本工業規格=が定めた漢字)である。だからこそ、このコラムの中でもこうして使うことができるわけだ。(ちなみに、ルート記号や○付き数字などは「機種依存文字」なので、そのものズバリの文字はこの原稿の中では使っていない。僕はWindowsマシンを使っているが、MACでこのサイトを見ているかたには文字化けしてしまうからだ)

はて、「妛」はなんと読むのだろう……と、漢和辞典を引いた奇特なかたがいらっしゃったら、それは徒労に終わるはずだ。なぜなら、妛という漢字は、ほとんどの漢和辞典には載っていないから。(もし載っていたとしたら、その辞書は1978年のJIS漢字制定以降に出された辞典で、JIS漢字に収録されているため、仕方なく掲載したものだ。)
漢和辞典に載っていない漢字、つまり、本来この世に存在するはずのない漢字は「幽霊字」と呼ばれている。これがJIS第一水準・第二水準合計6879文字の中に60字以上含まれているのだ。比率にすると、なんと1パーセント!
「60字以上」と曖昧な言い方になってしまうのは、俗字としては存在していると言えるかもしれない、というような微妙な幽霊字がいくつかあって、正確に限定するのが難しいからだ(一説には64字とも67字とも、いや、100字以上とも……)。

これらはほとんど、日本の地名に由来する。
最初のJIS漢字が制定されたのは1978年。そのとき、日本の地名はすべて表記できるようにするという指針があり、国土庁にあった「国土行政区画総覧」という書類から、漢和辞典には載っていない怪しげな漢字がいくつも採録された。

例えば、「啌」という字がある。秋田県にある「啌市(おそいち)」という地名に使われているらしいのだが、これも普通の漢和辞典には載っていない。
ちなみにGOOGLEで「おそいち」を検索すると、ヒットする数十件のほぼすべてが「おそいちゅーの!(遅いぞ、どあほ!……の意)」という用例で、啌市は出てこない。漢字の「啌市」で検索すると、たったひとつだけ、「秋田市農業集落排水施設条例別表1」という資料の中に「秋田市下新城岩城字啌市」という地名が出てきた。それも、今はページが NOT FOUND で、GOOGLEの誇るキャッシュで知ることができるのみ。
「啌」は幽霊字なのだろうか? そういう地名が実在する以上、幽霊字ではないと主張する人もいるし、昔から漢和辞典に載っていなかったのだから、やはり幽霊字と呼んでもいいのではないか、という人も出てくる。
ああ、幻の集落・啌市。どんな場所なのだろう……。

しかし、「妛」に関しては、この文字を使った地名も見つからない。後にJIS漢字コードの検証を行ったチームがさんざん探し回ったところ、どうやら滋賀県多賀町河内というところにある「あけんばら」という地名から採録されたのではないか、ということになったようだ。
この「あけんばら」という地名は、山の下に女と書く1文字と、原という文字の、2文字で構成されているのだが、山と女の間に「一」はない。
「あけんばら」はもともと「アケビの原」の意味だったのだろう。アケビは「山女」と書くことから、山と女をくっつけて「アケビ」という文字にして、それが定着したと考えられる(山+女という文字も、普通の漢和辞典には載っていない)。

でも、「一」はどこから?
どうも、これは単純なミスらしい。幽霊字を調査したチームの推理はこうだ。
そういう文字はないために、山と女を切り貼りして作字した。それをコピーしたときに、紙の継ぎ目が映り込んでしまい、それを「一」と見間違えたのではないか……。
なるほど、素晴らしい推理!

かくして、ただでさえ存在が怪しい「山」+「女」の「アケビ」という文字が、さらに変形され、「妛」という、絶対にありえない漢字となってJIS漢字コードに登録されてしまった。
こんな事情で登録された「幽霊字」が他にも60以上あるわけだ。

せっかくこの世に生を受け、天下の日本工業規格にも認定されているというのに、哀れな「やまいちおんな」は、一生、人々に使われることがない。(あ、この話題のために僕が今使っているか……)
ちなみに、世界中の文字をひとつの文字コードで表せるようにしましょうという発想のもと、UNICODEなるものが発明され、すでに使われ始めているが、我らが愛すべき「やまいちおんな」は、このUNICODEにもちゃんと収録されている。日本のJIS漢字コードに収録されている文字は当然すべて含めなければ、ということで、ついに世界デビューまで果たしたのだ。かたや、牛丼の吉野家の吉(下が長い「つちよし」と呼ばれる俗字)などは切り捨てられているのに……。

やまいちおんなさんは、本来存在していないにもかかわらず、UNICODEにも採用されてしまった以上、ほぼ、未来永劫、幽霊として生き続けるだろう。
つちよしくんは、日本国中あらゆるところの看板、表札、手書き文書に無数に実在しているにもかかわらず、文字コードからは「おまえはもはや死んでいる」と宣告され、デジタル文書の中に入ることを拒まれてしまった。

「つちよし」の無念、「やまいちおんな」の孤独。さて、どちらが深いのか?

 ☆文字コードの話は、拙著『テキストファイルとは何か?』(地人書館)にも詳しく書いたので、ぜひご参照を。
★WEB上でも詳しく解説しているサイトがたくさんある。GOOGLEの検索で「やまいちおんな」と入力してみると、池田証寿さんのページがヒットする。このサイトは文字コードネタの宝庫だ。飲み会などで披露すると、盛り上がる……かなぁ。

  目次へ目次へ     次のコラムへ次のコラムへ

新・狛犬学
★タヌパック音楽館は、こちら
★のぼみ~日記は、こちら
★狛犬ネットは、こちら
     目次へ戻る(takuki.com のHOMEへ)