2008年10月

      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

最近のモノ

« 2006年8月 | メイン | 2006年10月 »

2006-09-28

mg の新機能

変更したのはもう去年のことだが、今使っている mg には、これまでとまったく違う検索機能が追加されている。

mg に限らず grep 系のコマンドでは、検索エンジンのような指定がしにくい。たとえば foo と bar の両方が含まれている行を検索しようとすると案外面倒なのである。普通はパイプを使ってこんな風にするのだろうか。

% grep foo file | grep bar

mg で1回でこれを実行するとすれば、

% mg -e 'foo.*bar|bar.*foo'
という具合か。でも、文字列の数が増えてくるとパターンが極めて複雑になってしまう。

先読みを使うとこんな風にも書ける。

% mg -e '(?=.*foo)(?=.*bar)'
これはこれで、なかなかご機嫌な使い方だ。 さらに buz を含まない行を探したければこう書けばいい。
% mg -e '(?=.*foo)(?=.*bar)(?!.*buz)'

しかし、bar と foo を含んで bar を含まないパラグラフを探したいとかいうと、なかなか面倒なのだ。 というわけで、それをもっと簡単に指定できる機能を実現してみたのである。 最初は必要があって追加した機能だが、その後なかなか使う機会がなくて、リリースに至らずにいる。

続きを読む "mg の新機能" »

2006-09-27

mg の Unicode 対応

リンク: log.utashiro.com: mg-5.0.1.3

ずいぶんと前のブログにコメントすいません。 文字が UNICODEの実体参照になっているテキストファイルは フィルタをかまして検索できるようになるのでしょうか?

実体参照というのは意味がわかりませんが、Unicode には特に対応していないのです。
偶然使える機能はあるのかもしれません。
検索前にフィルタで EUC とかに変換するのであれば -z オプションを使えばできます。

そういえば未リリースの手元のバージョンでは -z は --if オプションに変更されています。
ちょっと修正規模が大きいのでちゃんと整理できていなくてリリースしていません。

普段 MacOS を使っているので使えた方が便利かもしれないとは思っていはいます。でも、単純なテキストファイルはあまりないので、どうせなら XML 対応と一緒かなあという感じです。

2006-09-20

sccc: ヘンリー L. メンケン

リンク: sccc: ヘンリー L. メンケン
Evil is that which one believes of others.
It is a sin to believe evil of others, but it is seldom a mistake.
--Henry Lewis Mencken
A Mencken Chrestomathy, Chapter 30, p. 617, Knopf (1949)
の日本語訳を探しているのです。後半については『人間は邪悪なものであると考えるのは罪である。だが、たいていの場合、間違ってはいない。』と訳しているのがいくつか見つかるのですが、前半はないのです。本として出版されていると一番いいので、ご存知の方はお知らせください。

stopped to talk with him

息子1号のところには、たまに進研ゼミからマンガ入りのDMが届く。 今回のマンガでは、主人公の女の子が
次の英文を和訳せよ。
I stopped to talk with him.
という問題に対して
彼と話をするのを止めました
と答えて怒られるのだが、さて、これはどこが間違っているのだろうか?
「とめました」と読めば(半ば)間違っているだろうが、「やめました」ならあっているように思う。もちろん台詞にルビはふっていない。 それとももっと深い理由があるのだろうか。
と書いたら、さっそく himazu さんからコメントを頂いた。
「話すのをやめました」ならば「stopped talking」としなければならず、「stopped to talk」だと「話すために立ち止まった」となる、と昔習った記憶があります。
なるほど。やばい、中二以下だ。家に帰って「学校出たのかな」をもう一度聴きます。恥ずかしいから、この記事は2日後に削除されるように設定しました :-)。
: Seven&Bi-decadeSeven&Bi-decade
反省して10回聴いた。えくすみゅーずきゅー。

hatena.utashiro.com

最近のトラックバック