このページは福井県立大学の田中求之が2006年1月まで運用していた Mac のサーバ運用に関する会議室 「Web Scripter's Meeting」の記録です。情報が古くなっている可能性がありますのでご注意ください。

analogの出力結果で

発言者:おがさわら
( Date Monday, October 06, 1997 16:58:39 )


ログ集計ツールAnalogの出力結果に以下のような項目があるんですけども、
英語力の問題なのか、どうもいまひとつどういう項目なのかがわかりませ
ん。

なんと翻訳し、なにも知らない人になんと言えばいいのか教えてください。

>Number of distinct files requested.
>Number of distinct hosts served.



→  Analogのページ

たまちゃん さんからのコメント
( Monday, October 06, 1997 17:43:29 )

>Number of distinct files requested.
>Number of distinct hosts served.

この場合のditinctはdifferentの意味ですから,異なるファイル,例えば,
a.html,b.html・・・・・に対してどれだけリクエスト(日本語だと要求でしょう
か?(^_^;;))があったかということと,異なるホスト,例えば,abc.co.jpや
zyx.ac.jpからの(リクエストに)どれだけ答えたかということだと思います。

Analogがstatus codeのどれをカウントしているかについては,教えていただた
ページのReadmeをご参照下さい。


→  Readme for analog2.11

田中求之 さんからのコメント
( Monday, October 06, 1997 18:21:01 )

たとえば、このサーバーの9月5日から17日の12日間のログを処理させると、

Number of distinct files requested: 1,002 
Number of distinct hosts served: 6,055 

となります。これは、期間中に私のサーバーにある 1,002 のファイルに対してリク
エストがあったということと、6,055 の異なるホストからアクセスがあったというこ
とを意味しています …のはずですよね? (^_^;;

この場合の file というのは、html, jpg, gif などのファイルのことで、CGI は
含まれていないはずです。

田中求之 さんからのコメント
( Monday, October 06, 1997 18:30:24 )

>この場合の file というのは、html, jpg, gif などのファイルのことで、CGI は
>含まれていないはずです

これ、間違いです。CGI も含まれています。ただし、この会議室の場合は、すべて
webcon.mtxt というファイルへのアクセスになるので、たった1つのファイルに
異常にアクセスが集中しているように集計されるのでした (^_^;;

ちなみに、同期間(9/5-17)の場合、ファイル毎のアクセスの状況は

#reqs:  %reqs: kbytes: %bytes: file
-----  ------  ------  ------  ----
19474: 39.77%:  65113: 16.55%: /webcon.mtxt
 1686:  3.44%:   2474:  0.63%: /default.html
 1050:  2.14%:    943:  0.24%: /pumpkin.nclk
 1026:  2.10%:  14590:  3.71%: /makeserver.html
  892:  1.82%:   1848:  0.47%: /techalley.html
  526:  1.07%:   4610:  1.17%: /webslab.html
  520:  1.06%:   3560:  0.91%: /clipdecoder/default.html
  390:  0.80%:    690:  0.18%: /galley.html
  298:  0.61%:   2014:  0.51%: /yamamoto/works.html

ですので、圧倒的にこの会議室へのアクセスが多いわけです。
(いまだに ClipDecoder にもアクセスがけっこう来てるなぁ…)

たまちゃん さんからのコメント
( Monday, October 06, 1997 21:00:23 )

》となります。これは、期間中に私のサーバーにある 1,002 のファイルに対してリク

》エストがあったということと、6,055 の異なるホストからアクセスがあったというこ

》とを意味しています …のはずですよね? (^_^;;


のはずです。(^_^;;)


すみません。紛らわしい書き方をしてしまいました。マニュアルに


A host is a computer that has requested something from you. Analog 

gives the number of distinct (different) hosts that have made a 

successful request, and the number of distinct files they have 

requested. 


と書いてありましたから,おっしゃる通りだと思います(hostsの前の

distinctはいいですが,filesの前のdistinctは分かりづらいですよね)。


#その昔,ソフトバンクの磯貝さんが「マッキントッシュのログ解析ツールは

使えなかった」とMacWeekでおっしゃっていたので,「Analogは試されました

か?」と申し上げると,「試しましたが,不安定で使わなかった。」とのお返

事でした。毎月(だったと思います)のログが当時で2ギガもあったそうで

す。結局WebTrendsというWindows用の解析ソフトを使われたようです。あれは

宣伝だったんだと今になって分かりました。いやはや。(^_^) でも,一読者の

メールに素早くお返事をいただけたので,好感を持ちましたです。


田中求之 さんからのコメント
( Monday, October 06, 1997 23:07:23 )

>「試しましたが,不安定で使わなかった。」

出たころ(移植されてすぐの頃)はけっこう不安定だった記憶がありますが、最近のは
メモリーをちゃんと与えておけば、ほぼ問題ないですよね。


たまちゃん さんからのコメント
( Monday, October 06, 1997 23:25:27 )

>> メモリーをちゃんと与えておけば、ほぼ問題ないですよね。


だと思います。さすがに2ギガのログは扱ったことがありませんが。 (^_^;;)

おがさわら さんからのコメント
( Tuesday, October 07, 1997 10:31:20 )

>となります。これは、期間中に私のサーバーにある 1,002 のファイルに対してリク
>エストがあったということと、6,055 の異なるホストからアクセスがあったというこ
>とを意味しています …のはずですよね? (^_^;;

はい、ありがとうございます。ということは、このサーバには少なくとも1002
のファイルが参照可能な状態になっているということですよね。

それから、ホストの方は理解できました。考えて見ればこちらはわかりやすい
ですね。

----

以前はWebstatなどを試して見たんですが、100MB以上のログを処理するのに一晩
かかるため、ちょっと実用的じゃないということであきらめていました。

Analogはとにかく早いのがいいですね。WebTrendのような素晴しいツールがでて
くればもっとうれしいんですが.....