カテゴリー
自作ソフト

メールの文面から自動分類するThunderbird拡張機能作った その2

ゴールデンウィークをぶっ潰して作ったThunderbird拡張機能AutoBucketをリリースしました。今回はAutoBucketを作った経緯を書いてみたいと思います。

私のメール分類法

AutoBucketを作成した経緯を説明するためには、まず私のメール分類法を説明しなければなりませぬ。

みなさんは日々大量に届くメールをどのように管理していますか?私は以下のような感じで大きく分けて考えています。

  • ちゃんと見なきゃいけないメール(社内通知や自分担当の案件に関係するメールとかとか)
  • 目だけは通しておきたいメール(担当外案件のメールとか)
  • 情報収集の為のメール(メルマガとか)
  • ほぼ見ずに捨てるメール(他の人のテレワーク始業開始メールとかグループウェアの更新通知とか)

これらのグループ毎に次のアクションが変わってきます。「ちゃんと見なきゃいけないメール」は自分が何か行動を起こさないといけないものだったり、関係者のアクション待ち後にまた自分が何かアクションしなきゃいけないようなメールです。このようなメールは一通り決着がつくまで受信箱に残しています。決着がついたらアーカイブします。Thunderbirdでアーカイブすると時系列のフォルダにメールが移動して受信箱から消えます。

「目だけは通しておきたいメール」は内容確認したらアーカイブします。あとで資料として参照したい場合があるからです。

他の情報収集の為のメールやほぼ見ずに捨てるメールは、ざーっと内容見てほとんどは削除、たまに資料として残したい物はアーカイブします。

こういう感じで私の場合、メールの差出人とかプロジェクトとかで細かく分類すると言うよりは、その後のアクションに応じて大きくメールをわけて考えています。

メーラーの振り分け機能の限界

こんな感じでみていくと、一番最初の「ちゃんと見なきゃいけないメール以外のメール」は後回しにしたくなるのが人情。そこでメールソフトのフィルタ機能を駆使してメールの振り分けをするわけだけど、コレが結構やってみると面倒だし難しい。

例えば、グループウェアの通知系メールや部署単位に作られているメーリングリストなんかは運用方法がよくないというのもあるんだろうけど大量にメールが飛んでくる。大半は必要ないんだけど中には自分が関わっている案件に関する内容も流れてくるので、Fromでフィルタして一律でゴミ箱行きにしてはマズい。

人が送ってくるメールも案件毎にメーリングリストが作られていればいいけど、案件化する前だったりするとメーリングリスト自体が無かったりする。じゃあ差出人でわけるとなると、別にその人から送られてきているメールにすべて自分が何かアクションが必要かというとそうでもない。これも単純なメールのフィルタ機能のみでフィルタする事は不可能だったりする。メールソフトにはメールの返信をスレッドで表示してくれる機能があるけど、あれもちゃんと元のメールに返信しないと繋がって表示されない。送る人の工夫で件名に特定の文字を入れるという方法もあるけど、これも送る人次第。実際は件名みても何のメールかわからんないメールがほとんどですよね。

そもそも「ちゃんと見なきゃいけない」というのは私個人の感覚によるところも大きく、結局のところ「メールの内容次第」だったりするわけです。

POPFileというソフトがある

じゃあメールの内容を解析してある程度振り分けしてくれるような仕組みがあるとありがたいのですが、実は十年以上前からあります。POPFileというアプリです。

http://getpopfile.org/docs/jp

ローカルでプロキシサーバーとして動作しベイジアンフィルターによりメールを分類しメールヘッダに分類情報を追記するので、メーラーのフィルタ機能でヘッダに応じて分類するような仕組みになっていて、まさに私のやりたいことに合致していたので、ずっと使い続けていました。

致命的な問題発生

しかし、先月頭ぐらいに事故が起きました。いや、正確には事故か起きていることに初めて気づいた。そう、メールが消失したのです。社内の人からの連絡で客先から送られてきているはずのメールの一通がなぜか私が受信できていないことに気づきました。迷惑メールやゴミ箱や変なフォルダに入っているわけでもない。メールの件名などを聞いてThunderbirdでグローバル検索してみるとメールは引っかかるのに何故か本文は表示されないし、検索が引っかかったフォルダを見ても一覧に表示されなくて明らかにおかしい。PC再起動しても状況変わらず。仕方ないのでThunderbirdのメールフォルダの最適化を行うとついには検索にもヒットしないようになりました。メール完全消失です。試しにPOPFileのログをみてみると、そこにはログが残っていました。ということはPOPFileまでは無事メールがきていて、POPFileとThunderbirdの間で何か問題が起きてメールが消えたということになります。

POPFile廃止

メールが消失した原因はわかりません。Thunderbird自体の問題の可能性もあります。ただ通信経路上にPOPFileが入り込んでることで不安定になっている可能性は捨てられないので、長年使用していたPOPFileを利用停止しました。受信失敗してエラーでも出ればまだ手を打ちようがあるのですが、サイレントに問題が握りつぶされているので危なくてしかたありません。思い起こしてみると過去も1-2回ほどメールが見つからないという事が起きていたので、たぶん同じ現象が頻度は低いもの起きていたのでしょう。

そこから一ヶ月ほどPOPFileなしで運用していたのですが、やっぱりつらい。メルマガや情報収集の為のIT系のニュースメールを差出人毎にフィルタを作ったりするだけでうんざりしてきました。

そこでPOPFileの代替になるものを自分で作ってしまおうと思ったのが4月末頃の話です。

a-tak/auto-bucket

Automatic mail classification extension with Bayesian filter for Thunderbird - a-tak/auto-bucket

AutoBucket

メールをベイジアンフィルターで複数のバケツに分類してタグを付ける拡張機能です。

この記事を書いた人: A-tak

A-tak.com(えいたっく どっとこむ)の管理人。
Apple野郎なおっさんでしたが、ちょっと最近のAppleには飽き気味。
A-tak.comは2002年2月から運営(前身のサイトは1999年3月から)。今年で18年目!

Twitter
Mastodon
Facebook