トップ 最新 追記

十日日記


2004-05-02

Link 韓国語投稿を抑止する

携わっているホームページの掲示板も広告投稿の被害に遭っている。ただし不思議なことに、投稿に使用されている言語は韓国語である場合がほとんどで、文字化けしまくっている。これをなんとかできないかと相談を受けた。

掲示板のCGIスクリプトはWeb Forumだった。このスクリプトにはIPアドレスによるアクセス規制機能がある。しかし韓国語投稿は毎回かなり異なるIPアドレスから行なわれており、それを羅列するのは面倒だ。また、韓国系のIPアドレス全部を規制対象にすると、現地在住の方々にも累が及んでしまう。おまけに気に入らないのは同機能では読み込みすら規制されることだ。読むのは誰にだってできるようにしておきたい。

そこでCGIに手を入れてきわめて安易な対策を行なう。Web ForumはSJISコードで動作・表示している。韓国内の文字コードについてはまったく知らないが、とにかく文字化けは漢字ばかりだ。それなら、カナをまったく含まない投稿文を外国語投稿とみなせばよいではないか。この判定を投稿ボタンを押した際になされるようにして、カナを含まない投稿は書き込まれないようにした。

結果。広告投稿は激減したが、完全というわけではない。文字化けを解析するときに見落としていたのだけれど、ひらがな数文字が混じることも時としてあるようだ。もっとも、その頻度は月に数件(以前は日に数件)だから、これ以上の対策は行なわないことにする。面倒だし。

Tags: PC

2004-05-05

Link 細いネクタイ

店で見かけるネクタイがそろって太い。いちばん太い部分で10cmていどが相場になっている。私は細いネクタイが好きなのだが、なかなか扱っている店が見つけられなかった。店頭購入を諦めWeb検索してようやく見つけたのがネクタイのシャトーである。ちゃんと「細いネクタイ」というコーナーがある。

Tags:

2004-05-08

Link 規範意識を知る

詳説 レクシスプラネットボード 鷹家秀史・林龍次郎『詳説レクシスプラネットボード』(2004年、旺文社)を新宿紀伊国屋で見つけ、購入。この書籍は、日本の学習参考書に書かれている英文法・語法規則に関して実際の運用状況を母語話者103名に質問調査した記録である。似たような調査としてはThe American Heritage Book of English Usageがあるけれど、本邦では初のことではなかろうか。

たとえば関係代名詞を考えよう。人を先行詞とする場合にはwhoを、物を先行詞とする場合にはwhich/thatを用いるのが関係代名詞の基本事項だ。しかし、先行詞に最上級や限定表現(the only, the same, all, every, any, no)があるときにはthatが使用される。ただし、「先行詞が『人』のときはwhoも用いられる」という。

上のような記述から私が想像するのは、限定表現がある場合にはthatを使うのが好ましく、whoを使うのは略式――すなわちthatとすべきところを単純化してwhoのままにしている――と受け取られるというものだ。

この書物では次の4種類の文を挙げて、「どちらの関係代名詞を好みますか」と尋ねている。

(a) Any student [that/who] can use computers is welcomed.
(b) This is the only student [that/who] can solve the problem.
(c) She is the most famous pianist [that/who] lives in Japan.
(d) All the prisoners [that/who] tried to escape were punished.

この問いに対する回答は、以下の通りであった。

       that   who
-------------------
(a)    27%   80%
(b)    31%   77%
(c)    53%   52%
(d)    36%   76%

(c)の文を除けばthatよりもwhoのほうが2倍以上の大差をつけて多いではないか。母語話者はwhoを使うのが一般的なのだ――と考えるのでは統計感覚が少し不足している。この手の調査では、インタビュイーの見栄から規範意識が先に立つ場合がある。たとえば日本語の話者に対して「ら抜き言葉を使いますか?」と尋ねたとき、本人は何気なく使用しているにもかかわらず「ら抜き言葉は不適切」という意識から「使いません」と回答することが考えられよう。

この書籍は自由回答も収録しているのが嬉しい。LSEの大学院生による以下の弁を見てみよう。

However, it is very common to hear "that" used as a substitute for "who". This is especially the case when people are talking. I am guilty of doing this myself. However, I would not use "that" when writing. It shows a lack of knowledge of the English language.

thatの使用は英語に関する無知を露呈する、というのだ。ほかの自由回答でも、thatは話し言葉で使うとかinformalだとか、「whoを使うべきだ」という意識がよくわかる。つまり学習参考書を読んでの私の想像はまったくの誤りで、むしろ書き言葉ではwhoを使うほうが安全だったわけだ。

かような具合に、母語話者が規則に対しどのような意識をもっているのかを知る恰好の書籍に同書はなっている。このほか、(c)の文は不自然なので実際には用いないとか(d)はthat/whoで含意が異なってくるとかいった回答もあって、これらについては手にとって実際に読んでみてほしい。英語好きなら読んで損はない。

Tags: 言語

2004-05-11

Link 株価と対数正規分布と納得性

高橋先生の授業を覗いてみて興味を引かれた話題。ひょっとして金融をやっている人には常識的な話かもしれない。

株価の分布には対数正規分布を仮定するのが標準的だ。これはなぜか。とっさに考えたのは、株価は乗法の世界にあるからだということ。正規分布だと同額の増減が同確率だと考えることになって、これは少しまずい。たとえば2000円の株価が4000円になるのと0円になるのとが同確率と考えるのは無茶だろう。対数正規分布を仮定するということは、株価が倍になるのと半分になるのとが同確率だとみなしているわけ。

実際に説明されたのは、収益を正規分布と仮定しているという話だった。つまりt+1期の収益y_{t+1} = (x_{t+1} - x_t)/ x_tと表わせるが、ちょっと変形してy = (x_{t+1}/x_t) -1とできる。右辺第1項は1に近いからy=x-1に近い。y=x-1はy = log xとx=1で接する(というかlog 1+xの1次近似)――というような持って行きかただった。

上の説明はいい加減といえばいい加減だけれど、妙に納得させられる話だと私は思う。小学生がよくする質問で1 = 0.9999999…はなぜかというのがあって、これに対する欺瞞的な回答は

1/3 = 0.333333…
両辺を3倍して、
1 = 0.99999…

とやるのが通り相場になっているけれど、子供はこれではあまり納得しない。ところが話を少し複雑にして、

2/7 = 0.2857142…
5/7 = 0.7142857…

を電卓で計算させておいて辺々を足させると妙に納得する子供が出てくるから不思議なものだ。結論としては、ごまかすときには要求する知的水準の匙加減が重要だということ。

Tags:

2004-05-15

Link 数Aの教科書

高校数学Aの教科書(数研出版)を読んでいる。94課程や03課程は全体としては改悪の方向に進んだけれど、2項定理を1年生にもってきた点は評価できる。03課程では数列を数学Bに移した関係で総和記号(Σ)を使っていないが、こういう記号は早く慣れさせるためにも使用を厭う必要はなかろう。

03課程の教科書は親切で、小見出しも細かいしレイアウトも整っている。余談では計算量の爆発の問題や回帰分析の話題なども扱われていて、社会との接続をはかろうとする努力が見受けられる。この教科書の難を挙げるとすれば、詳細目次が存在しないことくらいだろう。(節レベルまでの目次しかない。)

それはともかく場合の数のところを見る。組合わせの節で、C記号の性質としてn \choose r = n \choose n-rとn \choose r = n-1 \choose r-1 + n-1 \choose rの2つが性質として挙げられている。前者の説明は

n個のものからr個取り出すとき、取り出すr個を選ぶことは、後に残すn-r個を選ぶことでもあるから、n \choose rとn \choose n-rは等しい。

としている。そのうえで後者を「組み合わせの考え方を用いて説明せよ」と問題として出している(p.30)。言葉で説明すれば下のような具合になるだろう。

n個のものからr個取り出すとき、先に1個だけ取り除いておく。そして残りのn-1個からr-1個を取り出して最後に取り除いた1個を加えたのが右辺第1項で、こちらは取り除いた1個が必ず含まれる組合わせの数を表わす。右辺第2項は、残りのn-1個からr個を取り出すことになるので、取り除いた1個が必ず含まれない組合わせの数を表わす。両者は背反だから等号が成立する。

……これで高校1年生にわかってもらえるだろうか。自信がない。

展開教科書には2項定理を載せているのだから、後者の問題は2項定理を使えばいいのに。あと、個人的にはn-1を2回も出してくるのは式のかたちが汚いから、左辺をn+1 \choose rにしたい。ふつうは右のようにする。

上の恒等式でx^rの項の係数を比較すれば等号が成り立つ。

Tags:

2004-05-20

Link KNOPPIX 3.4Jと遅いディスク

KNOPPIX 3.4JでNTFS書き込みに対応したという話をRさんから聞き及び、使う。KNOPPIXは3.1Jの版で満足していたので更新を控えていたのだが、NTFS書き込み対応となると緊急ディスクにはますます便利になった。起動オプションにmemtest86までついている充実ぶりだ。

KNOPPIXのISOイメージファイルを控えにとるために別ディスクに複製するとき、Fドライブが遅いのに気がつく。685MBのファイルの複製に3分31秒かかっているというと、1秒間あたり3MBしか転送できていないではないか。ためしにGドライブに複製すると、こちらは48秒で転送できる。14MB/sと納得のいく数字だ。(14MB/sという数字は内蔵ディスクのReadと合わせているため、Write性能はこの倍くらいだろう。)

ここでディスク構成を以下に記す。

C, Dドライブ(80GB)  内蔵IDE    Maxstor 4R080L0
Fドライブ(60GB)     IEEE 1394  Seagate ST360020A
Gドライブ(60GB)     IEEE 1394  Western Digital WD600AB

なぜFドライブが遅いか。疑う要素はいくつかあろう。(a)ドライブ、(b)外付けディスクケース、(c)IEEE 1394カード、(d)ケーブル、(e)OS。原因究明のためhdbenchで試験をした。

                             Read  Write  Copy
1. Terminator RATOC Seagate  8981  11460  1593
2. ThinkPad   RATOC Seagate  8620  10400  1565
3. Terminator MSA   Seagate  9104  12084  1124
4. ThinkPad   MSA   Seagate  9371  11986  1159
5. Terminator RATOC WD      34536  23879  2417
----------------------------------------------
6. Terminator C drive       38713  38009  3265
7. Termanator DVD-RAM x3     4128   1831  4268
----------------------------------------------
8. Terminator RATOC Maxstor 40250  24282 15987
9. Terminator RATOC Maxstor 29543  20736 13752 MaxRec enable

(1)と(2)の比較から、原因が(c)カードではないことがわかる。Terminatorに積んだIEEE 1394カードはTIの、ThinkPadに刺したカードはVIAのチップだが、どちらにしても性能は低い。(3)〜(5)を見れば、(b)ケースが原因でもないことがわかる。SeagateはMSAのケースに入れても遅いし、Western DigitalはRATOCのケースに入れても速い。(d)や(e)の線もダメで、Linuxのhdparmで測っても同じ傾向だった。となると、あとはドライブしか残らない。ちょっと信じがたいが、「不可能を消去してゆけ。そして残ったものが、いかにありそうにないことでも真実なのだ」(マイクロフト・ホームズ)。

ドライブをIDE接続するがReadは10MB/sに及ばない。最後の手段として物理フォーマットを試みるも、結果は何ら変わるところがなかった。交換を検討しよう。

追記040522。結局、Maxstorの4R120L0(120GB)に交換した。結果を上表8に掲載する。Copyが妙に高い数値を出すのだが、理由は不明である。knoppixのISOファイルをCからFへ複製させると2分40秒かかる。FからCへは40秒ちょっとですむので、ちょっと妙だ。

調べた結果、Terminator TUのIEEE 1394接続で遅延が発生しているようだ。そういえばDVD-RAMドライブをケースに入れたときもDVD-Rの4倍速書き込みに遅延が発生して失敗し、5インチベイに内蔵させたのだった。Terminatorはお世辞にも高品質な基盤ではないから、雑音が発生しているのだろう。

対策としては、ゲート社のページからダウンロードできるTexas Instrumentsの1394 MaxRecを使って転送レートに制限をかける。ベンチマークでは2割ほど遅くなる(上表9)が、安定性は増すようだ。例のISOファイルのC→Fへの複製も48秒になった。このソフトはなぜか上記ページでしか入手できないが、こんな現象の発生は稀なのだろうか。

Tags: PC

2004-05-27

Link AMラジオのような音は電車内で聞きやすいのか

少し前、『鶴瓶・上岡パペポTV』のMP3ファイルを作成するにあたって音源を22kHzにダウンサンプリングしていると書いた。しかしそれをそのままMP3変換すると、やや高い周波数の雑音が発生する。もう一度wavファイルに変換しなおしてスペクトルを観察するに、雑音の高さは9kHzのようだ。lame.exeで8kHzのローパスフィルター(一定の周波数よりも低い〈row〉ものだけを通す〈pass〉フィルター)にかけると、雑音は取り除かれた。

なぜそのような雑音が混入するのかしばし考え、折り返し現象であると気がつく。シャノンの標本化定理により22kHzのサンプリングレートなら11kHzまでの再生が理論的には可能であり、10kHzの正弦波と12kHzのそれはまったく同一になる。むかしの映画で車輪が逆回転しているように見えるのと似たような話だ。

私は高い音の雑音を嫌うので、実際には2.75kHz以上の音は減衰するようにしている。それと同時に重低音も除去してある。このような処理を行なうと、音声はAMラジオのようになる。AMラジオ愛好家としては、嫌いな音ではない。

この音の利点を感じたのは電車やバスの中で再生させたときだ。落語のCDはそのまま160kbpsのMP3ファイルにしているけれど、こちらは聞こえにくい。かといって音量を上げると音漏れがする。それにくらべて音域を制限した『パペポ』のMP3ファイルは明瞭に聞きとれるのだ。人間は1kHzから4kHzあたりの音に敏感だというから、そこに集中させているのがよいのだろうか。

ちなみにlameのローパスフィルターは、たとえば8kHzなら「lame.exe --lowpass 8 hoge.wav」のようにして使う。また、MP3ファイルの音量を再エンコーディングすることなく可逆的に変更できるソフトウェアとしてはMP3Gainがある。音響心理を考えてくれるようで、具合がよい。『このみち』に収録されていた「汽車ポッポ」は、このソフトを使って3dB上げることによって迫力が増した。

Tags:

2004-05-31

Link 三点リーダーの使いかた

三点リーダーを2つまとめて「……」として使うのは文章においてのみの規則なのか、漫画を見ると「…」が単独で出てくるものが多い。

Tags:


プロフィール

渡辺 慎太郎(na@10days.org)

分野別表示

Admin | Client | Dev | Excel | Linux | PC | PDA | Web | iPad | web | 家電 | 文具 | | 英語 | 言語 | | 音楽

月別表示

1999|07|
2003|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|

最近の記事

雨量情報 dictionary.com Yahoo google Yahoo! 路線情報 東京アメッシュ l-mura l-aka l-momo 目次 r-mura r-aka r-daidai r-kiiro asahi.com nogulabo r-sora r-midori r-midori r-momo