ここ半年ほど、Twitterに毎日平均3語の割合でБяцхан толь(豆辞書)と称してモンゴル語と日本語対訳の単語または句を投稿してきた。従来のモンゴル語辞書にあまり収録されていない語句で、しかも頻用されるものを選んで投稿している。つまり、専門的すぎる語は避け、なるべく基礎語彙に近いものを優先させる方針だ。

一日平均3語なので、月に約90語、一年で約千余語、十年でやっと一万余語となる計算だ。亀のような歩みだが、これにはいくつかの理由がある。

まず、基礎語彙以上、専門用語未満ということなので、語彙選別にもそれなりに時間がかかる。日々、モンゴル語のニュースサイト、モンゴル語書籍などに目を通し、インターネットで視聴可能なモンゴル国のテレビ放送などからも、これはと思った語句は直ちに書き留めておく。

その場でぴったりとした訳語が浮かぶ場合もあるし、意味を調べなければならない場合もある。意味はわかっていも、日本語としてうまい表現がうかばない場合には、類義語辞書などを利用して検討する。Googleで検索をかけて、見出し語となるモンゴル語の用例にもできるだけ多く当たるようにしている。

そんなわけで、語彙選別から訳語の決定と自己チェックに至るまで、それなりに時間を要するので、あまり多くの語句はこなせない。また、毎日必ず投稿というのを自己課題としているので、どんなに忙しい日でも無理なくこなせる量として、やはり3語あたりが適当なのである。

さらに、投稿した語句は、Twitter経由でfacebook, mixiなどのSNSサイトに自動投稿するようにしている。できるだけ多くの日本語を解するモンゴル人、モンゴル語を解する日本人の目に触れることで、チェック機能を働かせるというわけだ。現にこれまで、多くの善意の読者から、折に触れて適切なご助言とご批判をいただいている。

特定の誰かに校正を依頼するというのでは、負担が大きすぎるだろうが、SNSならば基本的に時間に余裕があるときにログインするものなので、ニュースのチェックやコミュニケーションのついでに皆が目を通してくれるはずだ。

読者側の心理的負担という意味でも、チェックによる校正精度を上げるという意味でも、一日の投稿数はあまり多すぎないほうがよいだろう。

さて、この半年で溜まった豆辞書をTwitterからCSV形式で取り出してみた。TwitterのRSSから直接取り出すのは文字化けなどの問題もあってなかなか難しいので、Twilogというサイトを利用した。自分のTwitterのIDを登録しておくと、Twitterの投稿をまとめたブログを自動生成してくれるサービスで、ログインした状態でCSVまたはXML形式でログをまとめてダウンロードすることができる。

UTF-8のCSV形式で取り出したデータを表計算ソフトで加工する。これにはExcelよりもモンゴル語版のOpenOfficeを使った方が文字化けなどの心配もなくて具合がよい。

もちろん、取り出したデータにはTwitterのツイートがすべて含まれているので、ソートをかけてБяцхан тольで始まる投稿だけを抜き出しておく。さらにエディターで整形して、検索用のラベルもつけておく。本来ならばPerlなどでスクリプトを書いて一発で整形すればよいのだろうが、エディター上で正規表現を使って様子を見ながらちまちまと整形した。

こうして出来上がったデータにBlogger用のXMLタグを書き足す。各行がブログのひとつの投稿となるようにする。見出し語と訳語とラベルの前後にうまい具合にタグをつけると、ブログにインポートした際に各語句がブログの記事のタイトル、その訳語がブログの記事、ラベルが該当記事のラベルとなる。

そんな感じで、Twitterに投稿してきた辞書データ約500語分をBloggerのブログに移植してみた。各見出し語のキリル文字、または訳語の平仮名の最初の一文字から検索することができる。カテゴリ別にも検索が可能だが、今のところページナビゲーションがまだ整っていない。検索フォームからも検索できるが、もっと収録語彙数が増えてからでないと機能しないだろう。
http://mongolian-dictionary.blogspot.jp/

Twitter以外にも、VIMOというSNSサイトで作りためてきた専門用語辞書がある。現時点で、約数千語になっているはずだ。これもぼちぼちと移植していく予定だが、整形などにそれなりに時間がかかるので、移植が完了するまでに1~2週間かかるだろう。