[an error occurred while processing this directive]
TopPage 残日録過去ログ PDA研究室 電子辞書 世界Marble教 NaTsuMi 足跡 Links サイト内検索 ヘッドラインセンサ 作者について リンクについて |
電子辞書 - 「英辞郎・和英辞郎・音辞郎」をEPWING形式に変換する(05/11/2003) 必要な物 英辞郎(EIJIROxx.TXT)・和英辞郎(WAEIJIxx.TXT)・音辞郎(OTOJIRO.TXT)それぞれの配布ファイル CygwinもしくはUNIX互換環境 ebutils もしくは epwutil 導入については「ebutils/epwutilの導入」をご参照下さい。 Perl + Jcode.pm (CygwinのsetupでPerlはインストールできます) FreePWING eijiro-fpw・waeijiro-fpw・otojiro-fpw EDPが編纂している英辞郎シリーズは今では語彙数においては最大の英和辞典として有名になってきました。辞書自体は独自形式ですが、テキストファイルなので扱いが容易です。英辞郎シリーズのうち英辞郎・和英辞郎・音辞郎をEPWING形式に変換するスクリプトがありましたので変換方法を纏めてみました。まあEBStudioを使えば略語郎も含めてEPWING化できますが、完全フリーじゃないしWindowsじゃないとできないので私的に却下。とか言いつつ以下の説明は基本的にCygwin環境で検証しておりますので、他の環境を使用されている方は適宜読みかえて下さい。 Cygwinをインストールしていない場合は、まずWindowsにCygwinをインストールします。上記配布サイトからsetup.exeを落として起動し、「Select Packages」まで進んだら「Category」に表示されている「+ All ○ Default」の「Default」をクリックして「Install」にします。これで配布ファイルが全てインストールされます。不要なものも沢山ありますので分かる方は適当に間引いて頂いて結構です。その後は指示に従えばCygwinのセットアップはできると思います。この時点でPerlのインストールも終了しています。 次はJcode.pmのインストールです。Jcode.pmの配布サイトからソースを落として作業ディレクトリに置き、Cygwin上で作業ディレクトリをカレントにし、
とするだけで終わりです。 ebutilsのインストールは「ebutils/epwutilの導入」の通りにやればできるはずです。 FreePWINGは
でおしまい。 英辞郎 ではまず英辞郎から。eijiro-fpwの配布ファイルを落として作業ディレクトリに置き、Cygwin上で作業ディレクトリをカレントにして
として配布ファイルを展開します。配布ファイルを展開すると「eijiro-fpwx.x」というディレクトリができているので、その中の「Makefile」を開いて、
となるように編集します。該当行は適当に探して下さい。すぐ見つかります。この後、英辞郎の配布ファイル(EIJIROxx.TXT)をこのディレクトリに置きます。それが終わったらCygwin上で「eijiro-fpwx.x」をカレントディレクトリにし、
とすれば、「eijiro-fpwx.x」下に「eijiro」というディレクトリが作成され、そこにEPWING形式に変換された英辞郎がインストールされます。 fpwmakeが途中で止まる場合 どうも、英辞郎側にデータがおかしい部分があり(問題なく変換できた時もあったので私の手元で化けた可能性があります)、eijiro-fpwが異常終了することがあるようです(英辞郎Ver.60で起きました)。原因はエラーメッセージを見れば判りますので、該当行の異常な文字を削除して再度お試し下さい。ファイルが巨大すぎてエディタで開けない場合はそれなりのエディタを用意しないといけないかもしれません。私は秀丸エディタで編集しました。CD-ROMからコピーするとReadOnly属性が付いているかもしれませんのでご注意下さい。 fpwmake catalogsが途中で止まる場合 文字コード関連でエラーが起きるみたいなんですが、catalogs.txtを漢字コードEUC、改行コードLFにしたら動きました。nkfをインストールしてオプションを利用した方が良いのかもしれません(オプションについてはreadme.sjisおよびMakefileをご参照下さい)。以前は某所からsetup.exeでnkfがインストールできたのでそれを利用していたんですが今回は何故かインストールできなかったし(setup.exeのバージョン不整合?)、コンパイルしてインストールするのも面倒だったので秀丸でコードを変換して片付けました。 それでもだめ場合 eijiro-fpw1.0b2.diffという非公式パッチが出ています。eijiro-fpwの配布サイトから落とせますので、「eijiro-fpwx.x」ディレクトリ下にこのファイルを置いて、
として下さい。これでパッチが適用されます。私のところではパッチ無しでも変換できていますが、これで変換できるようになる「かも」しれません。このファイルは改行コードがLFである必要があります。IEやNNでは改行コードを変換して保存するかもしれないので注意して下さい。 和英辞郎 まず、waeijiro-fpwの配布ファイルを落として作業ディレクトリに置き、Cygwin上で作業ディレクトリをカレントにして
として配布ファイルを展開します。配布ファイルを展開すると「waeijiro-fpw-x.x」というディレクトリができているので、その中の「Makefile」を開いて、
となるように編集します。で、英辞郎同様に和英辞郎も配布ファイル(WAEIJIxx.TXT)を「waeijiro-fpw-x.x」に置いて、これをカレントディレクトリとしてCygwin上で
とすれば「waeijiro-fpw-x.x」下に「waeijiro」というディレクトリが作成されてEPWING版和英辞郎がインストールされます。 fpwmakeが途中で止まる場合 英辞郎と同じく、データに不正な文字(というかバイナリにしかない文字…文字と呼んでいいのか分かりませんが)があって止まったりします。この場合も英辞郎同様エディタで開いてその文字を取り除いてやる必要があります。数時間かけた変換でエラー、エディタで編集して修正、を数回繰り返さないといけないかもしれません。EDPのCD-ROM郵送サービスの場合はPDIC形式は保証の範囲外と称してますので、テキストファイルは保証の範囲内のハズでしょうから文句を言えば交換してくれるかもしれません。メディアの問題でない場合は元データの問題かもしれないので、しっかりフィードバックして下さい(何行目でエラーが出たのかなど)。 音辞郎 音辞郎の場合は和英辞郎と同様ですが、Makefileの編集は必要ありませんでした(音辞郎の配布ファイル名にはバージョンナンバーが含まれていないため)。以下略。問い合わせがあったら書くカモ。 謝辞 eijiro-fpw、waeijiro-fpw、otojiro-fpwはそれぞれReiさん、藤原輝嘉さん、satomiさんが制作されたスクリプトです。素晴らしいスクリプトを制作・公開して下さったお三方に感謝いたします。 05/11/2003 [an error occurred while processing this directive] | ||||||||||