読者です 読者をやめる 読者になる 読者になる

びぃえるくぅと。

ガラケーは打楽器。

アニソンVJとかでmigemoはかなり有効だと思う

以前Twitterの方で

と書いたことがあって、その後

というリプライを頂いたりしたので、真面目に migemo をVJで有効活用することを考えてみました。

待って migemo って何。

普通、日本語のテキストの中で検索を行う時は、ひらがな・カタカナ・漢字を入力しますよね。

日本語のテキストが含まれています

という文章があって、日本語 という文字が含まれているか確認したい場合は

日本語

って文字で検索をかけます。当たり前ですね。

ところが、 migemo を使うと、

nihongo

という文字で検索をかけると、なんと 日本語 がヒットするようになります。

f:id:yadex205:20160524182459p:plain

内部で何を行っているのか

migemo は入力されたローマ字をクエリとして、

QUERY: nihongo
PATTERN: (ニホンゴ|ニホンゴ|日本(語|極道史|合成ゴム)|にほんご|nihongo|nihongo)

上記の PATTERN に見られるような正規表現を、辞書データを元に生成してくれるツールです。 なので、 migemo 自体が検索を行う訳ではないのですが、様々な検索系のツールと組み合わせることで 非常に強力な検索環境が整います。

C/Migemo の入手と基本動作

Rubyで書かれたオリジナルの migemo は2004年ごろに開発が停止しています (公式サイト)。 現在は C言語で書き直されたC/Migemo が開発されており(公式サイト)、こちらを入手しましょう。

Windows

公式サイトからバイナリを入手することができます。

Mac

Homebrew を用いてインストールすることができます。

$ brew install cmigemo

cmigemoコマンドラインツールなので、WindowsならコマンドプロンプトMacならターミナル(homebrew使ってるからもう動かしてますね)で使います。 そして大事なのが、起動時に辞書ファイルをオプションで指定しないと、期待した動作をしません。

Windowsの場合はダウンロードしたアーカイブを展開した中に、Macの場合は

/usr/local/share/migemo/utf-8/migemo-dict

に配置されているので、-d オプションとともにパスを指定しましょう。

そしてQUERYというプロンプトが表示されます。お好きなローマ字を入力してみて、どのような正規表現が出力されるか試してみてください。

で、なんでアニソンVJで migemo が使えそうだと

自分は今までアニソンVJをしていないので、次回のパーティーには試験的に始めてみようと考えています。 しかし、動画ディレクトリを見ていると、アニメごとにディレクトリが細かく分かれていて、目とマウスで追っかけていくのが案外しんどいなと思いました。 どうせなら動画のディレクトリ以下を、アニメのタイトル等で検索をかけてしまった方が早いですね。

そしてどうせなら、日本語のアニメタイトルでもローマ字で検索をかけることが可能ならなおさら快適ですよね。

それだけです(爆)

最後に

そしてこのような記事を書いていて申し訳ないのですが、具体的なソリューションがまだ見つかっていません。 見つけ次第、あるいは最悪作りしだい、記事にしたいと思います...

追記 (2016/05/24)

Macのターミナルで、以下の用に遊べます。

$ find [検索したいフォルダ] | grep -E $(cmigemo -d /usr/local/share/migemo/utf-8/migemo-dict -w [検索したいローマ字])

例えば

$ find ~/Dropbox | grep -E $(cmigemo -d /usr/local/share/migemo/utf-8/migemo-dict -w mentaru)
/Users/(ユーザー名)/Dropbox/Twitter/メンタルリセット.png
/Users/(ユーザー名)/Dropbox/Twitter/メンタルリセット修造.png
/Users/(ユーザー名)/Dropbox/Twitter/メンタルリセット修造.xcf
Copyright © 2015 Yadex205