〜各種IME辞書のコンバート(変換)方法。〜
Win版のNAD辞書を作ってる際に気になったので
それぞれのIMEで使えるようにテキストのコンバートの仕方を
ここに書きしるしておきます♪
※私の頭はアナログ(w)ですのでアップルスクリプトとかプログラムによる変換方法などは知りません。
実際にNADがやったのは辞書からテキスト書類に出力して
それをちまちまと人力で変換する方法です。
「ことえり」同士の移動(OS9⇔OS X)
【登録形式】
「"読み","登録語句","品詞"」or「読み,登録語句,品詞」
※品詞等はすべて共通なので変更の必要は無し。
【辞書の在り処】
- OS 9(「MacintoshHD」/ 「システムフォルダ」/「初期設定」)
- OS X(「Home」/「Library」/「Dictionary」)
【実行方法】
- 【OS Xのことえり→OS 9のことえりへ】
- 【OS 9のことえり→OS Xのことえりへ】
OS9からOS Xへの辞書の移動は辞書内容をテキストに出力しなくても辞書ファイルを移動するだけで可能です。
-
「MacintoshHD/ システムフォルダ/ 初期設定」にある移動させたい辞書「○×辞書」「○×辞書-逆引」(「○×辞書」は例え)の2つを一緒にOS Xの「Home/Library/Dictionary」のフォルダに入れる。
※辞書ファイルは「dictionaries」フォルダに入れると自動でOS Xの辞書に変換させられる。
ことえりの「環境設定」で移動してきた辞書を「開く」と使用可能になる。
※OS Xの辞書に合体しない場合は、「語句の登録/削除」の「編集」タブから「OS9の辞書をコピーして使う」で指定してやるといい。
それでも使えるようにならないときはMacを再起動してみる。
-
※既存の辞書に追加登録して使う場合はOS9でテキストに出力したものを「ことえりメニュー」/「語句の登録/削除」から登録したい辞書と追加するテキストを指定して登録する。
「ATOK」⇔「ことえり」
【登録形式】
・ATOK「読み(tab)登録語句(tab)品詞」
・ことえり「"読み","登録語句","品詞"」or「読み,登録語句,品詞」
【辞書の在り処】
・ATOK(?)
・ことえり(「Home」/「Library」/「Dictionary」)
【実行方法】
ことえりメニューから「語句の登録/削除」を選び
メニューバーの「編集」/「テキストで出力」を選択、(Shift-JIS)で出力して辞書内容のテキスト書類を作成する。
ATOK辞書の「ユーティリティー」から読み込んで登録。
詳細はATOKのヘルプをみてね♪
下にある『Win向けの辞書の改造』と同じ改造が必要
※Mac同士なら改行コードの変更いらない。
※『品詞の対応表』
ATOKの辞書ファイルのWin⇔Mac間の移動はATOK12(Winは10)以降なら問題なく移動できる。
Mac版ATOKはことえりの辞書ファイルから直接読み込めるけど、一度テキストに出力してから読み込んだ方が確実だと思う
ATOKの基本辞書(システム辞書)のテキスト化は出来ないぞ、多分。
「EG Bridge」⇔「ことえり」
【登録形式】
・EG Bridge「読み(tab)登録語句(tab)品詞」
・ことえり「"読み","登録語句","品詞"」or「読み,登録語句,品詞」
【辞書の在り処】
・EG Bridge?)
・ことえり(「Home」/「Library」/「Dictionary」)
【実行方法】
- 【EG Bridge→ことえり】
最終版だとテキスト出力で「ことえり用テキスト」が選べる模様。
そのテキストをことえりで読み込めば使えるようになるはず。
(それ以前のバージョンのことは知らないw) 「ことえり用テキスト」出力が出来なかったとしても形式はATOKやMS-IMEと同じタブ区切り形式なので同じように改造すればことえりでも使えるはず。
- 【ことえり→EG Bridge】
ことえりから出力したテキスト書類を読み込ませれば多分問題ないはずw
詳細は「EG Bridge」のヘルプを見てね♪
- 持っていないので基本的に詳細は不明。
- 「かわせみ」も基本的に同じだと思う。
Win向けのテキスト書類の改造
※基本的な作業はMac上で行いました♪
※登録形式はWin版ATOK/MS-IMEともに同じタブ区切りなので特に分けては解説しません。
(タブ区切りはこんな形式→「読み(tab)登録語句(tab)品詞」)
※説明文中の「(tub)」は「タブ」キーで入力される「タブ」スペースのこと。
※必要なもの
・改行コードを変えられるエディタ(Macなら「mi」がおすすめ)
・Win⇔Mac間でのファイルの物理的な移動方法。
「ことえり」→「MS-IME(XP)/ATOK(Win)」に移動。
ことえり登録語句のテキスト書類の作成。
ことえりメニューから「語句の登録/削除」を選びメニューバーの「編集」/「テキストで出力」を選択、(Shift-JIS)で出力して 登録語句のテキスト書類を作成する。
作成した書類の品詞をそれぞれIMEに対応した物に変更。
※『品詞の対応表』
※品詞の変換時に前後の符号を一緒に検索変換すると誤変換が減るぞ。
例:「名詞」を「一般名詞」に変換する際に「名詞」だけ指定して
一括変換すると「サ変名詞」などが「サ変一般名詞」などと
変換されてしまう。
予防策は変換する品詞の前後に「"」を付けて「"名詞"」で検索して
「"一般名詞"」などと指定して変換する。符号の変換。
エディタの検索ウィンドウで「検索置換」で「","」、置換ウインドウに 「 」(tab)を入れてすべての区切りを(tab)に置換する。
※(tab)がうまくウィンドウに入れられない場合、テキストのどこかで (tab)入力してそのタブをコピーするとうまく行くぞ。余分な符号の削除
検索ウィンドウに「"」を、置換ウインドウに「」(何も入れない)で置換。
これですべての「"」が削除される。
改行コードの変換。
「mi」の場合、タイトルメニューに変換タブが表記されてるので
「CR(Mac)」を「CR+LF(Win)」に変更して保存でOK。
出来た書類をWinに移動してMS-IME/ATOKに登録。
登録できなかった語句は登録後に出力される「レポート書類(だっけ?)」で確認できる。
書類を見て品詞や語句の再設定をしながら登録出来る物はしていけばOK。
※ATOKに登録する際に「ATOK形式」を選択して登録すると書類の頭に定型文が必要になる。
その際は適当なATOK辞書の内容をテキストに出力して文頭の定型文部分をコピーするといい。
面倒な場合は最初から読み込み形式を「MS-IME」でやれば大丈夫。
※Win〜Macの移動時の注意点
- 改行コードは必ず修正する。
- 書類ファイルには「.txt」の拡張子を必ずつける。
- Win環境では(ひらがな1文字の「ヴ」)が使えない。
- ギリシャ数字が登録できない模様?。
- 基本辞書のに登録されている語句の登録はできない。
「MS-IME(XP)/ATOK(Win)」→「ことえり」に移動。
それぞれのIMEで登録語句をテキスト出力してMacに移動。
※出力するファイルは(Unicode)だと文字化けの可能性があるので選べるなら(Shift-JIS)がおすすめ。改行コードの変換。
「mi」の場合、タイトルメニューに変換タブが表記されてるので 「CR+LF(Win)」を「CR(Mac)」に変更して保存でOK。作成した書類の品詞をそれぞれことえりに対応した物に変更。
※『品詞の対応表』
※品詞の変換時に前後の符号を一緒に検索変換すると誤変換が減るぞ。
例:「名詞」を「一般名詞」に変換する際に「名詞」だけ指定して
一括変換すると「サ変名詞」などが「サ変一般名詞」などと
変換されてしまう。
予防策は変換する品詞の前後に「"」を付けて「"名詞"」で検索して
「"一般名詞"」などと指定して変換する。符号の変換。
エディタの検索ウィンドウで「検索置換」で「 」(tab)を入れて、
置換ウインドウを「,」にしてすべて置換。
※(tab)がうまくウィンドウに入れられない場合、テキストのどこかで (tab)入力してそのタブをコピーするとうまく行く。
ことえりに登録。
※ATOKから持ってきた場合最初に定型文が有るのでそれは削除しておく。
※登録語句に「,」が入っている場合この方式だとうまく登録できない。
どうしても「,」が必要な場合は一時的に別の語句(「@」や「*」など)に置換してことえり辞書に登録。
その後でテキスト出力すると登録した語句が「","」に囲まれた形式に
なっているので再度「,」に置換して登録することが出来る。
※登録語句に「"」が入っている場合
異常終了してしまうので「"」を追加して「""」にして登録。
変換時は「"」として変換されるので問題なし。
おまけ
【「"」を残して変換したい】
※ことえり→Win他に移動
テキスト変換時に「"」を残して変換したい場合「mi」などの引用符「>」が付けられるエディタが必要になります。
まず他の変換処理(「","」の変換)等を終える。
「mi」ですべての語句に引用符を付けたあとで「>"」を変換ウインドウから指定して削除。
「詞"」(品詞の最後の語句)の部分を「詞」に変換ウインドウから指定して変換。
これで不要な「"」だけ削除出来るはず。
【OS 9のATOKのシステム辞書の単語の登録の仕方】
ことえりとは関係ないです。ATOK14を使っていていつも混乱するので個人的にメモにしてるだけなので 普通の人は読まなくてOK
(ATOKメニューから「辞書ユーティリティ」/「辞書ファイル」/「辞書作成」で
システム辞書ファイルを作る
・ユーザー辞書/ユーザーシステム辞書の違いはことえりの普通辞書と指定変換辞書かな?
・辞書の「見出し」は「ATOK」の辞書ファイルの名称。
「辞書ユーティリティ」/「一括処理」/「単語一括処理」で登録する 辞書/読み込む辞書ファイルを指定して登録。
・「ATOK辞書」で「辞書設定」から「辞書ファイルの設定」タグをチェックして
辞書を指定。(指定しないとシステム辞書に登録できない)
・「単語ファイル」で辞書ファイルを指定。(どの辞書のファイルかも指定する)
・「出力ファイル」で登録出来なかった語句の確認用のファイルを作るかどうか。
えんぴつメニューから「環境設定」「辞書/学習」で辞書を登録。
品詞コンバート早見表
一応の目安としてくださいな♪
ことえり | ATOK | MS-IME |
---|---|---|
普通名詞 | 名詞 | 名詞 |
サ変名詞 | 名詞サ変 | さ変名詞 |
人名 | 固有人名 | 人名 |
地名 | 固有地名 | 地名その他 |
形容詞 | 形容詞 | 形容詞 |
形容動詞 | 形容動詞 | 形容動詞 |
数字列接尾語 | 助数詞 | 助数詞 |
無品詞 | 独立語 | 独立語 |
姓 | 固有人姓 | 姓 |
名 | 固有人名 | 姓 |
その他の人名 | ? | ? |
単純地名 | ? | ? |
接尾語付き地名 | ? | ? |
組織名 | 固有組織 | - |
その他の固有名詞 | 固有一般 | 固有名詞 |
形動名詞 | 名詞形動 | 形動名詞 |
連体詞 | 連体詞 | 連体詞 |
副詞 | 副詞 | 副詞 |
接続詞 | 接続詞 | 接続詞 |
感動詞 | 感動詞 | 感動詞 |
カ行五段 | カ行五段 | か行五段 |
サ行五段 | サ行五段 | さ行五段 |
タ行五段 | タ行五段 | た行五段 |
ナ行五段 | ナ行五段 | な行五段 |
マ行五段 | マ行五段 | ま行五段 |
ラ行五段 | ラ行五段 | ら行五段 |
ワ行五段 | ワ行五段 | わ行五段 |
ガ行五段 | ガ行五段 | が行五段 |
バ行五段 | バ行五段 | ば行五段 |
五段動詞 | - | - |
一段動詞 | 一段動詞 | 一段動詞 |
サ変動詞 | サ変動詞 | - |
ザ変動詞 | ザ変動詞 | - |
数字列接頭語 | 冠数詞 | 冠数詞 |
人名接尾語 | (接尾語) | 姓名接尾語 |
地名接尾語 | (接尾語) | 地名接尾語 |
組織名接尾語 | (接尾語) | 固有接尾語 |
(人名) | 固有人他 | (人名) |
(その他の固有名詞) | 固有商品 | (固有名詞) |
(その他の固有名詞) | 固有組織 | (固有名詞) |
ザ変名詞 | 名詞ザ変 | ざ変名詞 |
(形容動詞) | 名サ形動 | さ変形動名詞 |
- | - | 副詞的名詞 |
- | ハ行四段 | - |
- | カ変動詞 | - |
- | ワ行五段音便 | - |
- | ナ変動詞 | - |
- | ラ変動詞 | - |
(形容詞) | 形容詞ウ | (形容詞) |
(形容詞) | 形容詞イ | (形容詞) |
(形容詞) | 形容詞エ | (形容詞) |
(形容動詞) | 形動タリ | (形容動詞) |
接頭語 | 接頭語 | 接頭語 |
接尾語 | 接尾語 | 接尾語 |
(無品詞) | (独立語) | 慣用句 |
(無品詞) | 単漢字 | その他自立語 |
- | 終助詞 | - |
(無品詞) | 顔文字 | 顔文字 |
- | - | 短縮読み |
ことえり | ATOK | MS-IME |
「-」は対応する品詞がないもの
「?」は対応する品詞が不明もの
辞書書類のコンバートのコツと注意
書類の読み込み/登録が異常終了してしまう時は。
・登録形式/書式にミスがないか確認。
・登録できない語句ややたらと長い語句がまじってないか。
・ことえりは登録する書類の読み込み数が10万語を超えると不安定になる。
10万語以降は5千〜8千語程度の少ない数の書類を作成して読み込ませるといいことえりはテキスト登録時に登録形式以外で「"」が含まれてるとそこで読み込みが不正終了(もしくは読み込み終了)してしまう。
「"」を使用した語句を登録したい時はメニューの「単語登録/削除」から登録するか 「"」を2つ続けて「""」にすればテキストから登録可能になる。
(もちろん変換時は「"」となる)作成した語句が大量で不要な「"」がどこにあるのか見つからない時
まず書類の複製を作成して「","」を「0000000」になど変換。
その後「"」を「♯♯♯♯」などと変換すると発見しやすい。各種IMEのシステム辞書(基本辞書)はテキスト出力できません。テキスト化できるものはユーザーが追加、作成した辞書だけ(一部不可のものもあり)です。
たとえシステム辞書が取りだせてもそれを利用すると著作権法違反になるかも。データを改造/改変した物を公開したり配布することは当然違法行為です。
注意しましょう。この辺のサイト様を参考に。
『Kosei's Web Page』
『Maniac IME』