京都大学大学院情報学研究科(2005年当時)のエンヘバヤル(Sanduijav ENKHBAYAR)氏は、モンゴル語の自然言語処理を行っている。2004年には「モンゴル語間句生成ライブラリの仕様書1.1」を発表し、自身の製作したPerl用のライブラリについて解説している。 冒頭の文章では、「作成者の私のみならず、これからモンゴル語の自然言語処理をしていく方でも使ってもらえるように書いている」とある。そこでさっそく去年の暮れ頃、本人宛てにメールを送ってお願いしたところ、ライブラリのファイルを分けていただくことができた。 仕様書を見ると、モンゴル語のキリル文字アルファベットを[大文字/小文字]、[母音字/子音字]などに分類して変数化し、さらに母音と子音をそれぞれ分類して異なる変数として表している。 母音は[基本母音字/補助母音字]という区分がされているが、言語学的には母音のみを表す文字か、いわゆる半母音と母音がペアになった文字かどうかの区別である。さらに子音は、[母音を伴わなくてもよい子音字/必ず母音を伴う子音字]を区別している。 これはモンゴル語の正書法でおなじみの、いわゆる9子音と7子音で、この子音のいずれが前後にくるかなどの非常に複雑な規則によって、接辞を伴う際に語末音節の母音が省略されるかどうかが定められる。モンゴル語の正書法を難解にしているのは、実にこの母音省略の規則だといってもよく、ネイティブでさえも綴りを間違えることは珍しくない。 こうした母音の省略(母音消失)の規則以外にも、母音の挿入、母音調和による格語尾の選択などといった規則があるが、すべてこれらを関数として表し、自動的に句生成が行えるような仕組みになっている。 自然言語処理については素人の私でも、理論的に非常によくできたものであることは一目瞭然である。ただ、難をいえば、使えるようにするためにPC環境を整えるなどの設定がやっかいで、身近にいるPerl専門のエンジニアの手を借りなければとても手に負えなかった。 このライブラリを実装したプログラムを作ることができれば、精度の高いモンゴル語スペルチェッカーなどの開発も可能なはずだ。今後の研究の進展を切に希望する次第である。 ��参考サイト>http://pine.kuee.kyoto-u.ac.jp/member/enkh/mnlp/phrase.html��参考文献>Sanduijav ENKHBAYAR, 宇津呂武仁, 佐藤理史, 「日本語・モンゴル語間の機能表現の機械翻訳」, 京都大学大学院情報学研究科.M2 Sanduijav ENKHBAYAR, 「モンゴル語間句生成ライブラリの仕様書1.1」,京都大学大学院研究科, 2004.
早稲田大学図書館の蔵書のうち、明治時代以前のものはマイクロフィッシュ化されており、オリジナルを損傷しないで済むよう、通常の閲覧はこのマイクロフィッシュが用いられている。 去年の秋頃、何か面白い資料はないかと漁っていたところ、明治時代に出版されたモンゴル語の教科書を見つけた。ひとつは三巻本のモンゴル語読本で、奥付を見ると明治四十年発行となっている。もうひとつは日本語・中国語・モンゴル語対照の会話集で、日本の参謀本部による「諸言」が付されており、明治四十三年とある。いずれも縦書きの蒙古文字で書かれたものだ。 読本の方は「喀喇沁王府」とあって、会話集の方は「東部蒙古科爾心博王府ニ聘セラレ其ノ旗学堂教習ノ任ニ在ル数年頃目斯書ヲ編シ」とあるので、それぞれ当時の東部モンゴル(現在は中国内モンゴル東北地方)に分布するハルチン方言とホルチン方言を反映したものと考えられる。特に、会話集の方は蒙古文字の右脇にカタカナでルビが振られており、当時のホルチン方言の発音を推測する上での参考にもなる。 いずれにしてもこれらは、清朝末期のモンゴル語の概要を知るための資料として、非常に貴重なものであることは間違いない。マイクロフィッシュ化された資料は申請すれば有料でコピーさせてもらえるため、やや割高だが一部をコピーして持ち帰った(うろ覚えだが、たしか一枚につき50円)。 著作権などの関係で、一度にコピーできるのは、一冊につきマイクロフィッシュに撮影された全コマ数(裏表紙などの文字の書かれていないコマなども含む)の半分以内に限られるそうだ。果たして、同一人物が別の日に訪れて残りの半分をコピーしても違法なのか、あるいは誰か別の人としめし合わせて、各人が半分ずつコピーしたらどうかしらなどと、ついくだらないことを考えてしまった。 ��参考文献>喀喇沁王府, 『蒙文読本巻一』, 大日本図書株式会社,1907(明治四十年).喀喇沁王府, 『蒙文読本巻ニ』, 大日本図書株式会社,1907(明治四十年).喀喇沁王府, 『蒙文読本巻三』, 大日本図書株式会社,1907(明治四十年).参謀本部(日本), 『日漢対照 蒙古会話』,清国駐在日本公使館(推定) , 1910(明治四十三年).
かねてから思案していたのだが、現在ここに表示されている「いたこのたわごと」を含む、私自身(いたこ)が運営しているサイト全体を引っ越すことにした。 ひとつには長年の増改築を重ねるうちにコンテンツがどんどん入り組んできて、煩雑になってきたせいもあるが、Niftyで昔から馴染んでいたサービスが軒並み廃止されて新たなサービスに切り替わりつつあり、どうせ替わるのならこれを機会にプロバイダも乗り換えてしまおうというわけだ。 私が運営中のホームページでは、将来的にCGIまわりを充実させるつもりなので、Perlの標準ライブラリ装備など、モジュール群をフルに活用できるなどの利点を考え合わせた末、プロバイダとしては「ぷらら」を利用することにすることにした。 すでに自宅での接続回線としてはぷらら光フレッツを家族名義で使用中なのだが、この際自分用に新たにIDを取得して、そちらにホームページ用のスペースを確保した。 親サイト(本館)である「いたこのたこつぼ」用に以下のURLを取得したので、今後は以下のアドレスをトップページとして、「モンゴル語の穴ぐら」、「いたこのたわごと」へのリンクを貼っていくようにする。 http://www17.plala.or.jp/itako/ さっそくクリックして見に行くような物好きな人もいると思うが、URLのみでコンテンツはまだ何もアップロードしていないので、念のため。
私が普段使用しているノートPCのキーボードには、モンゴル国で購入したモンゴル語(キリル文字)用のステッカーを貼っている。これは透明なシールに赤字でキリル文字がプリントされたもので、非常に使いやすい。キーボードのローマ字は白でプリントされているため、ステッカーの赤字と瞬時に判別でき、文字入力の際にローマ字とキリル文字を混同するといった心配がない。また、シールの色が透明なので、平仮名などの他の文字も隠れずにすむ。 こういったステッカーがなければ、キリル文字をArialなどの見やすいフォントで多少大きめに入力して、紙にプリントしたものを適当な大きさにちまちまと切って、糊でキーボードに貼り付けるという方法もある。実際に、私のデスクトップPCのキーボードはこのやり方を使っている。普段はキーボードカバーをかけて使用してるのでキリル文字の紙がずれたりはがれるすることもなく、特にお金をかけずとも十分モンゴル語用のキーボードができあがる。 実際にモンゴル本国でも、大学などの研究室においてあるパソコンのキーボードを見ると、普通の英語用キーボードにサインペンかなんかでキリル文字を書き込んだというお粗末なものだ。 この記事を読んで「な~んだ」と思った方には、以下のキーボード通販サイトをお勧めする。 http://www.language-keyboard.com/mongolian_cyrillic.htm モンゴル語だけが印刷された専用キーボードから、ローマ字とキリル文字の両方が印刷されたものなど、お好み次第だ。モンゴル語はキリル文字の他に縦書きのウイグル系モンゴル文字、パスパ文字などが揃っている。ただし、縦文字はキーボードカバーに文字が印刷されたものと、キーボードに貼るタイプのステッカーのみで、パスパ文字はステッカーしかない。以前はパスパ文字のキーボードカバーも売られていたはずだが、さすがに売れなくて製造中止になったのかもしれない。 <参考サイト>http://www.language-keyboard.com/
オープンソースとは、企業などで開発されたライセンスを必要とするソフトウェアとは違って、ソースコードを公開して技術を共有できるようにし、誰もが開発に参加できるようにした開発プロジェクトである。このオープンソースの考え方にもとづいて開発されたソフトウェアには、GNUプロジェクトによるソフトウェア群、Unix系のOSであるLinuxなどがある。デスクトップ環境としては、GNOMEというものがあり、主にUnix環境のパソコンで使用される。 このGNOMEは、すでにバージョン2以降からキリル文字表記のモンゴル語への対応を開始しており、将来的にはデスクトップ上のさまざまなメッセージ(例えば「新規作成」や「保存」といったメニューだけでなく、インストールマニュアルやヘルプ画面など)がすべてモンゴル語で表示可能になるはずだ。 おもむろにパソコンの操作をしようとして画面を覗き込んだら、全部表示がモンゴル語だった、なんて光景を想像するとちょっと愉快である。もちろん、そういったイタズラ目的ならずとも、モンゴル語の表示を見ながら操作できるようになれば、地方の小中学生など、英語が読めないモンゴル人でも、もっと気軽にパソコンに親しむことができるようになるだろう。しかもオープンソースであるから、ライセンス費用をかけずに様々なソフトを利用できるなど、利点も多い。 現在モンゴルでは、優秀な翻訳チームによってGNOMEの英語メッセージからの翻訳が電光石火の勢いで進められており、少なくとも11,455のメッセージがモンゴル語に翻訳済みだという。 <参考サイト>http://japan.linux.com/opensource/03/10/08/0251214.shtml
蒙古文字(縦書きのウイグル系モンゴル文字)のユニコード対応に向けて、規格の整備や対応ソフトの開発などが着々と進められているようだ。 ユニコードのバージョン3からは、1800-18AFのコードに蒙古文字が割り当てられてるようになった。 東北大学の栗林研究室(東北アジア研究センター)に所属するオルギル氏は、蒙古文字のユニコードエディター “Mongolian UE” を開発中である。実は、すでに数ヶ月前にオルギル氏本人からこのソフトを配布いただいており、試用したこともある。蒙古文字に特有の、語頭、語末、語尾での字形変化にも対応しており、縦書きで左から右への改行も可能だ。ただし、利用できるフォントや印刷設定などに制限があり、まだ開発途上のようだ。 今後は各ワープロソフトへの互換性などを考えると、開発者同士の緊密な情報交換と連帯が切に望まれる。 なお、ユニコードのバージョン5からは、パスパ文字への対応が予定されているようだ。 <参考サイト>http://www.unicode.org/charts/ http://www.cneas.tohoku.ac.jp/
モンゴル語(キリル文字表記)はWindowsXPを使えば、IMEの設定をするだけでキーボードからの入力が簡単に行える。ただし、外出先などで、普段使っていないPC上からモンゴル語を入力する必要に迫られたときなど、オンラインでモンゴル語が入力できれば非常に便利だ。 以下はバター氏のサイトで公開されているオンラインのソフトキーボードである。 http://badaa.mngl.net/monvkb/monvkb1.htm 試しに使用してみたところ、画面上のキーボードを一つずつクリックして入力することも、画面のキー配列を見ながら直接キー入力してモンゴル語を入力することも可能だ。上記プログラムは英語キーボード用だが、ドイツ語キーボード用のプログラムなども同氏のサイトに公開されている。 (注:ただしFirefoxなどのいくつかのブラウザで試したところ、動作状況は芳しくない。どうやら対応ブラウザはIEのみのようだ。Unix機やMac機をお使いの方で、「この環境でならできた」などの情報をお寄せいただけると幸いです。) <参考サイト>http://badaa.mngl.net/index.php