某日記

(中期)

平成15年3月11日(火曜日)

昨日

mklocale 嫌いだ。

おかげで眠い。

捕獲

食うつもりがないなら捕まえるな <えーーー?

support status

こういうものを作った が、どこに置くのがいいのかね。

……

おいおい無茶な判決やな…… 。 それを認めちゃうと、世の中の多くの曲が訴えられるぞ。

夜中

FreeBSD 上でのクロスビルドで、ホストツールの mklocale が コンパイルできない問題をずっとひきずっていたのだが、 埒があかないので FreeBSD 4.6.2 をインストール。 いろいろ rename したりして解決。

rune なんてものを public interface にしている FreeBSD もアレなのだが、 _ で始まるシンボルとか _t で終わるシンボルを扱う必要がある NetBSD の tools の方も苦しい。 ISO C 的にはそういうシンボルはシステムに予約されてるので、 それ以外の人が使ってはいけない。もちろん NetBSD の tools は ホスト環境では単なるユーザアプリケーションに過ぎないため、 コンパイルが通らなくても文句は言えないんだな。

例の占い

いろいろと試してみたが面白い。 「A さんを好きな人にお薦めの B さん」という場合に B さんを入力してみてもえてして A さんのスコアが低かったりとか。 逆引きが欲しいところなり。

新しい人は往々にしてデータが少ないらしく、 たとえば「中原杏」を入力すると、「やぶうち優 50」「にしむらともこ 50」 とかでてくるが、三者の作風を考えたら「ちゃお」つながり以上ではないわな。

ちゃおの同じような世代で「もりちかこ」を入れると 「種村有菜 40」「あらいきよこ 40」とかでる。ふーむ。 種村有菜は誰入れても上位に入ってくるのでまあそういうもんなんだろう。 上位に入りがちなのは他に CLAMP と高屋奈月。そういうもんだろうな。

新しい人に戻すと、りぼんの「福米ともみ」に至ってはお薦めが出ない。 山野りんりんもお薦め出てこないが、 山野りんりんは現状はどっちかというと 四コマ系の人だからこれもそういうもんだろう。

「桃栗みかん」で「河下水希」がお薦めされないのは面白くないな<間違い

ちなみに、私の場合だれがお薦めされたか、は、 別に面白くもなんともないから書かない。

平成15年3月12日(水曜日)

regex

regex の国際化についてのメモ。

特開平06-028196。マルチバイト文字列の正規表現を因数分解し、 ターゲット文字列のバイト列表現をシングルバイト文字列と見なした場合に 等価となるような正規表現を作る方法。 日本では審査請求されずに 7 年以上経過しているので既に無効。 アメリカでどうなのかは知らないが、 ruby とかはこれを使ってるらしい。

PCRE。 宣伝条項つき BSD ライセンスとほぼ同等のライセンスを持つ正規表現ライブラリ。 不完全ながら UTF-8 をサポートしている。

FIVA のカーネルをいじったら、ものすごい勢いで時間が進むスレ状態に。

原因は意外にも、autri.c にあった。 3/2 版パッチで、CODEC のタイムアウト処理に tick というローカル変数を 使っていたのだが、これを最新のパッチで revoke した時に 一ヶ所 tick <<= 1 というのを消しわすれてて、 しかも間の悪いことに tick という extern 変数が あったもんだから以下略。というか最初の時点で気付けよ俺。

neo crown

ついに完結 。 えろいよー。

いわゆる直リンク

ううむ 。 法的にはともかくさ、何でまず先に技術的対策を取ろうとしない? エロサイトですら直リンク対策できてるのに。 そんなことでお給料を貰っていては月給泥棒のそしりはまぬがれまい。

平成15年3月13日(木曜日)

眠いがな。

regex

熊谷さんからメールが:


素人考えですが、 一文字が可変長のエンコーディングスキームのままで扱うのではなくて、 一度なんらかの 32bit fixed-width form なバイト列へと変換してから 同様の方法で変換するのはどうでしょう? いずれにしろ ISO-2022 は こういう方法でないとうまく扱えないでしょうし。 それに、POSIX の regex は collation order をもちゃんと扱う必要があるので、 どこかで wcsxfrm 相当の処理が必要になるわけで。

glibc-2.3 の実装は この へん

ちなみに、なんでマルチバイト regex が大変かというと、 一般的な実装では、ごく簡単な規則で正規表現を NFA へと変換したのち、 これをさらに DFA に変換して状態遷移表を作成するのだが、 入力が高々 256 通りしかない 8bit の文字列では 状態遷移表に単純な二次元配列を使ってもたかが知れているのに対し、 16bit 以上の文字集合で単純にそれをやると馬鹿でかい表になってしまう、 という話ね。

どうせ collation の処理が必要なんだから、 regcomp 時に入力状態の圧縮と collation の処理を同時に行う コンバータを動的生成する、というのも一つの方法か。 そうすれば、状態遷移表を単純な二次元配列のままで扱うことも可能になるな。 これ、修論になる程度の話題だと思うけど誰かやってみない? glibc の前者の論文ではこういう方法は 「ポータビリティが無い」と否定されているが、 当然システム組み込みの regex なんだから、ここも locale module に 追い出してプラグインにしちまえばそんな心配は無用のものになるわな。 残る問題は、どっちのほうが速いか、ということだけど、 まあそんなもんは作ってみなきゃ何ともいえんだろう。

今週のちゃんぴおん

大戦鬼。神髄伝授。

フェイスガード(1)。今週も暴走風味。

愛みて。

×。八雲たん萌え。

フェイスガード(2)。近くの生身より遠くの裸。

ニセ D 。次号最終回。

癌呆

ユーザよりも先に自分たちのモラルを確立しなさい

小西寛子は今いずこ

一部で噂になっていたファンファンファーマシー DVD 。 それもいいけどへりたこぷーちゃんきぼんむ。

平成15年3月14日(金曜日)

やはり眠い。

ループ

PCM レコーディング系 BGM のループ再生といえば、 やっぱり思い出すのがセガラリー 2 かのう。 アーケードはどうだか知らないけど、なると版のセガラリー 2 は、 生ブラスやらなんやらが入った BGM が延々とループしつづけるので、 すげーインパクトがありましたわな。きっと、今でもその手のノウハウを 一番蓄積してるのはセガとかコナミとかあたりだろうな。

MP3 とか OggVorbis は、窓関数によるフィルタリングの副次的な効果として 自然なループが比較的容易に構成できるので(まあ普通の PCM でも 端のところでちょっとした処理をするだけなんだが)、 最近まであまり使われてなかったことのほうが不思議といえば不思議やね。

:-)

FIVA

それはアレですが 、 うちの FIVA で使ってるカーネルなら ここに置いときます

ハイバネ領域の作り方 (危険なのでバックアップとってから or インストール直後にやるべし):

  • fdisk で、実メモリより大きいパーティション ID=160 の パーティションを作る。
  • このパーティションが NetBSD から見えるように、 disklabel を書く。
  • ftp.netbsd.org:/pub/NetBSD/misc/tshiozak/fiva20x あたりから phformat-netbsd.c を持ってきてコンパイル、実行。
  • カレントディレクトリに phformat.dump というファイルができてるので、 こいつをさっき作ったパーティションに dd で書き込む。

リンクの自由

この件に関して、私はあまり昔から意見は変わってないんだけどね。

基本的にリンクというのは自由の範疇の話なので、 リンクする側の裁量で自由に行うべきであってリンクされる側 (や第三者)がどうこう言うのは筋違いだとは思う。 一方で、未だに「リンクする権利」などという主張はナンセンスだと思ってる。 あるのは「リンクする自由」。

自由をどう行使するかという観点だと、やっぱり個人サイトで「リンクしないで」 と書いてるところにリンクするのは、やっぱりどうかと思う部分はあるのよ。 これは人間関係の問題なので、 自由とか権利とか技術論とかそういう話で 二分法的に決めてほしくはないと、個人的には思う。

もちろんわたしゃ「リンクしないで」と書いても無意味なことがわかってるし、 守るべきものを守るための手段も持ってるから、 自分ではそういうことを書いたことはないけど。 そういうテクニカルな面では全くナンセンスだと思いつつも、でも、 そういうことを書く人間の気持ちもわからなくはないし、 私自身は多少はその辺のことを気に留めるようにしてる。

この辺は、要するに自由権の行使に関する私自身のモラル観の話なので、 他人もそうあるべきという話ではないけども。

一方、この辺はリンクされる側の社会的な立場によって判断を 変えるべきだと思う。 新聞社のサイトの場合はその社会的役割および公共性の高さを考えたら、 無断でリンクされても文句を言うべきではないわな。

まあ、いずれにしろ、間違った法律知識を振り回して威圧するやりかたは いけませんやね。法人さんは特に。一方で、個人サイトの人が 「リンクしないで」とお願いしてるのにそれを一方的に無視するのは、 それはそれで大人げないのではないかと。そう思います。

平成15年3月15日(土曜日)

夕方

秋葉。本を 2 冊:

  • Unicode Demystified
  • 詳説 正規表現
前者は Unicode の処理についての本。 後者は正規表現の実装についての実用上のことを書いたほぼ唯一の本。

平成15年3月17日(月曜日)

ワラタ

男にとっては切実な問題 なのだが、40 以降は俺を笑い死にさせる気か!

平成15年3月18日(火曜日)

遅延気味。

BGM

最近は「PEARL PIERCE / 松任谷由美」をループ。アレンジも演奏も最高。 ベーシストとしては、高水氏の弾くパッシブジャズベーの男くさい サウンドがたまらんし、アレンジャーとしては、 大胆かつ緻密なブラスとストリングスの絡みがたまらん。

NY 市、仏への抗議の意図で自由の女神を撤去

撤去前撤去後

詳細。 WTC があるのはこの際目をつむれ。

平成15年3月19日(水曜日)

夜中

【速報】RO 鯖クラックキターーーー!!【デカチン】

そして、絶妙のタイミングで TX で RO 紹介。

平成15年3月20日(木曜日)

【特攻野郎コアチーム】"THE CORE-TEAM"

♪ちゃーららっちゃー、ちゃちゃーちゃー(以下略)

硫黄島で鳴らした俺たち特攻部隊は、濡れ衣を着せられ USL から提訴された。 4.3BSD から脱出し、4.4BSD Lite に潜った。 しかし、パッチリリースにくすぶってるような俺たちじゃあない。 筋さえ通れば実装次第でなんでもやってのける命知らず、 不可能を可能にし、巨大で遅いコンピュータを生き返らせる、 俺たち、特攻野郎コアチーム!

「俺はリーダー Christos Zoulas。通称 christos。tcsh と isapnp の天才。 俺のような天才マネージャでなければ、 百戦錬磨のつわものどものリーダーは務まらん」

「俺は Jun-ichiro Hagino。通称 itojun。 自慢のカメに女はみんなイチコロさ。 IPv6 から M17N まで、なんでも揃えてみせるぜ」

「よぉお待ちどう。俺様こそ Frank van der Linden。通称 fvdl。 i386 の腕なら天下一品! PC98? IA64? だから何?」

「Luke Mewburn。通称 lukem。ftp の天才だ。wuftpd でもぶん殴ってみせらぁ。 でも、北半球だけは勘弁な」

俺たちは、コンパイルの通らぬ current にあえて挑戦する、 頼りになる神出鬼没の、特攻野郎コアチーム! 助けを借りたいときは、いつでも言ってくれ。