作成日:2001年06月01日、更新日:2002年10月07日 作成:鷹の巣

自宅サーバーにおけるこのWebページの一年の歩みを書いてみました。


カウンタに見るこの一年の歩み

私のホームページは、2001年7月5日まで、当初たった1ページだけのWebページでした。この時点では、訪問者数のカウントに対しては、 そう深く悩むことは、ありませんでした。何故なら、ブラウザのリロード(再読み込み)だけを防止していれば、それで、ほぼ正確に訪問者数 をカウント出来たからです。当初、インターネットでの検索は、YahooさんとGoogleさんしか知らなかった私は、こんなたった1ページだけを Yahooさんのディレクトリ登録とGoogleさんのロボット検索に早速申請したり、自宅サーバーで検索できる有名なサイトに相互リンクを 申し込んだり、無茶をしていました。

はじめに

2001年5月25日~31日
カウンタの話とは、無関係ですが、私が自宅サーバーをはじめたきっかけは、 全部フリーソフトでつくる自宅サーバfor Windows (ISBN4-89977-008-1 C3055 \1980E)という本を読んで、 自宅サーバーに興味を持ち、自宅サーバ構築メモby a-kさんのサイトを見て、非固定IPアドレスで、独自ドメイン名の 自宅サーバーが公開出来ることを知ったからです。その後、どめいんばーどさんのサイトで、年間US$6~10で、独自ドメイン名が取得可能だと解り、急いで、独自ドメイン名を取得しました。 本文中にも書いておりますが、「非固定IPアドレスで、独自ドメイン名の自宅サーバー運用」というのは、 自宅サーバ構築メモさんのサイトの二番煎じであり、その点に関して、当サイトの独創性は、全くありません。

自宅サーバー公開直後の主な出来事

2001年6月 1日
「鷹の巣」の自宅サーバーを公開。何も宣伝していないのに1日4カウントし、不信に思う(不正アクセス?)。
2001年6月 2日
「自宅WWWサーバの入り口」さんに登録したおかげで、早速、1日約30カウント
2001年6月24日~28日
葛飾独歩さんの「自宅サーバ道」さん、oguさんの「パーソナル・サーバーの設置所」さん、 stockさんの「自宅サーバのススメ」さんに相互リンクを申し込み。nomiさんの「自宅サーバーRING」に登録。 この頃1日約80カウント。相互リンクする度にアクセス数が上がるので、これに味を占めて以降、多くのサイトに 相互リンクを申し込む。自宅サーバーとしては異色の苦沙彌のインターネット僧坊さんとも相互リンク。
2001年7月 5日
現在の様なページに分割し、カウンタを設置しているindex.htmlに対して index.html→子1.html→子2.html→子3.htmlの様な流れに変更。しかし、 index.html→子1.html→index.html→子2.html→index.htmlの様な流れもあり、二重カウントの可能性もあった
2001年7月 7日
「一発太郎」さんから各検索エンジンへ登録依頼を行う。
2001年7月14日
Yahooさんのディレクトリに自宅サーバーというカテゴリ(分類)がなかったので、いい加減に申し込んでいたカテゴリ(分類)の 「ホーム >コンピュータとインターネット >情報、資料 >アドバイス」に登録される。この頃1日約230カウント
2001年7月24日
Yahooさんのディレクトリ登録のNEWマークがなくなり、日平均アクセス数が約180カウントに下降。
2001年8月20日
ルータの設定例の収集の為、検索エンジンから発見した、「おいでんホームページ」の「おいでんリンク」を見て感動。 早速、相互リンクを申し込み。 申込み後に気付いたのだが、他の登録サイトに比べて、「鷹の巣」の自宅サーバーだけが、設定の実例の記載がない。 とり急ぎ、ルータの設定例を作成して、おいでんさんに報告すると、白黒の画像が重たいと遠回しに優しくご指摘される。 急いで、画像の減色処理と画像の圧縮処理を勉強し、画像ファイル容量を美しさを保ったまま、小さくする。

カウンタへの疑惑と入り口ページの設置

2001年9月頃から、
検索サーチエンジンからのアクセス数も増え、多少自宅サーバー運営に余裕が出来た。 この頃から、多くの有名な「自宅サーバー」と「ホームサーバー」のサイトより、自サイトのアクセス数が異常に多いのに気付き、 何か不正カウントを行っているのではないかと、疑問を持つようになった。

そこで、下記の様なWWWサーバーの生ログによるアクセス解析を行った。 (アクセス解析ソフトは、ステータスコードが200とか304中心で今ひとつ信用していません。) Windowsのコマンドプロンプト画面より、

C:\>type  httpd.200108XX.log  |  sort  >  log.txt

として、IPアドレスで、WWWサーバーの生ログファイルをソートし、これをクライアント機のMicrosoft Excelで、スペースを区切り符号として読み込み、 IPアドレスのデータだけをフィルタで、「重複するレコードは無視する」として、1日当りのIPアドレス数を調べた。 何と1日当りのIPアドレス数の2倍近いカウントをしているではないか。 残念ながら、kent-webさんのDAY COUNTER-EX というカウンタは、一つ前にアクセスしたIPアドレスしか保持されていない。 この様なIPアドレスによる二重カウント防止機能は、ブラウザのリロード(再読み込み)だけしか防止出来ません

早速、カウンタを設置しているindex.htmlを入口ページに変更して、新たに目次ページ(top.html)を設置して、 index.htmltop.html→子1.html→top.html→子2.html→top.htmlの様な流れにし、index.htmlに戻って来れない様に工夫した。 これは、効果があり、案の定、アクセス数(IPアドレス数)は増えてもカウンタ数は、逆に減った。この状態で、2002年6月3日まで、運用。

私は、近眼なので、「Webページにフレームを使用すると画面の面積が減るので、使用しない。」という考えを持っています。 従って、一日の正確な訪問者数をホームページ(トップページ)に表示しようとすると不正カウントが発生する可能性が付きまといます。

私のカウンタに対する現在の方針は、

  1. 訪問者数を把握するのは、index.htmlのページだけで行い、直リンクは、無視する。

  2. カウントするだけのクッキーは、利用者の便宜を損なうので、利用しない。

  3. 但し、統計を取る為、クッキーを使用したサーチミシュランさん(2002年5月31日にサイト終了)や ページビューランキング(2002年6月から)の使用は、許して頂く。 クッキーを受け入れないUser Agent(ブラウザ)は、カウントされないので、これを訪問者数の最小値と考える

  4. バナーの画像ファイルやアクセスエラーや明確なロボットアクセスを除いたログで、IPアドレス数を算出し、 このIPアドレス数を訪問者数の最大値と考える。(非固定IPアドレスの訪問者は、接続が切れるとIPアドレスが変わる為)

  5. 訪問者がロボットである場合は、もともと計数しない様にしていたが、保守が面倒な割りにカウント数がほとんど上がらないことから、 計数しても構わないこととする。
2002年6月 3日
当然の成り行きですが、ホームページが目次ページ(top.html)だと勘違いして、目次ページの方にリンクされているサイトが 多いので、従来のtop.htmlをmokuji.htmlに変更し、 index.html→mokuji.html→子1.html→mokuji.html→子2.html→mokuji.html→子3.htmlの様な流れにし、 top.htmlをindex.htmlにURL転送を行った。

CGIカウンタの処理は重いが、入り口ページの廃止

2002年6月 9日
目次ページ(mokuji.html従来のtop.html)を廃止することを決意する。 mokuji.htmlを廃止し、index.htmlに統合して、保守を楽にし、 index.html→子1.html→index.html→子2.html→index.html→子3.htmlの様な本来の流れに変更。 勿論、index.html→子1.html→子2.html→子3.htmlのような流れも当然あります。 重複カウントをある程度、防止する為、アクセスされたIPアドレスを100個溜め込んで、二重カウントを防止。 改造方法の詳細は、こちらのCGIのFAQ集A901に記載しています。 100個は、当サイトでは、大体4時間のIPアドレスの寿命に相当します。 (クッキー未使用のため、非固定IPアドレスの方で、IPアドレスが変って再訪問される方は、二重カウントされます。)
2002年6月26日
0時にhtmlファイルを一括変更。Web頁の作成は、Microsoft FrontPage 2000(タグが汚いので、お薦めしません)を 使用しているので、全く意味のない半角スペース等を除去した。ファイルサイズが平均77%小さくなった。 使用したツールは、■G-PROJECT■miniHTMLというフリーソフトを使用させて頂きました。
2002年6月28日
Webページ体重計を使用して、自サイトのWebページを評価。 とりあえず、ホームページ(index.htmlでトップ頁とも言う)のバナーをテキスト化し、30Kbyte以下とし、 画像を含めて、40Kbyte程度とした。

以上の処置を行って、現在経過観察中です。結果は、下記の2002年6月度のアクセス集計に示します様に、かなり良いところになっていると 今のところ考えています。一体どれだけの割合で、ブラウザにクッキーの受け入れ拒否を設定されているか不明ですが、ページビューランキング のサイトより信頼性が高いと考えています?

「鷹の巣」の自宅サーバー2002年6月度のアクセス集計
2002年6月度 訪問者数 IPアド
レス当
りのテ
キスト
転送量
E=A/B
IP
アド
レス

カウ
ント

F=
B/C
IP
アド
レス

ペー
ジビ
ュー
G=
B/D
備 考
目安 最大値 目安A 最大値B 表示値C 最小値
D
全転送量
[byte]
全IP
アドレ
ス数
テキスト
転送量
[byte]
テキス
トのみ
IPアド
レス数
ホーム
ページ
カウン
ト数
ページ
ビュー
Rank
ing
記録数
6月 1日 土曜 196,897,633 1,258 148,936,173 956 672 475 155,791 1.42 2.01 -
6月 2日 日曜 159,518,422 1,306 112,900,205 974 712 441 115,914 1.37 2.21 -
6月 3日 月曜 196,330,341 1,325 143,956,517 1,041 793 460 138,287 1.31 2.26 top.htmlをindex.htmlへ転送。
6月 4日 火曜 175,989,458 1,353 133,598,190 1,062 801 634 125,799 1.33 1.68 -
6月 5日 水曜 185,480,232 1,320 135,315,678 1,030 825 500 131,374 1.25 2.06 -
6月 6日 木曜 191,860,597 1,272 142,235,649 979 727 482 145,287 1.35 2.03 -
6月 7日 金曜 164,255,813 1,263 120,269,088 954 697 522 126,068 1.37 1.83 -
6月 8日 土曜 156,307,303 1,184 114,216,269 899 658 432 127,048 1.37 2.08 -
6月 9日 日曜 177,411,066 1,159 130,528,007 861 572 346 151,600 1.51 2.49 アクセスIPアドレス100個記憶。
6月10日 月曜 176,469,357 1,249 131,846,785 964 643 417 136,771 1.50 2.31 -
6月11日 火曜 208,889,986 1,340 155,096,121 1,009 630 416 153,713 1.60 2.43 -
6月12日 水曜 160,455,616 1,121 118,368,267 927 579 400 127,690 1.60 2.32 -
6月13日 木曜 179,877,651 1,319 128,609,598 1,021 671 406 125,964 1.52 2.51 -
6月14日 金曜 162,166,123 1,212 119,014,008 919 536 412 129,504 1.71 2.23 -
6月15日 土曜 157,434,013 1,177 112,151,425 875 567 365 128,173 1.54 2.40 -
6月16日 日曜 178,768,300 1,196 130,805,260 895 610 414 146,151 1.47 2.16 -
6月17日 月曜 197,367,537 1,328 161,742,060 1,029 599 405 157,184 1.72 2.54 -
6月18日 火曜 169,822,089 1,338 119,723,608 1,026 624 410 116,690 1.64 2.50 -
6月19日 水曜 145,407,997 1,304 101,934,082 1,009 601 444 101,025 1.68 2.27 -
6月20日 木曜 211,168,808 1,491 145,835,682 1,129 753 501 129,172 1.50 2.25 -
6月21日 金曜 177,390,140 1,385 141,572,295 1,071 682 453 132,187 1.57 2.36 -
6月22日 土曜 184,326,750 1,208 133,426,401 909 591 411 146,784 1.54 2.21 -
6月23日 日曜 216,832,259 1,215 159,175,487 931 604 419 170,973 1.54 2.22 -
6月24日 月曜 245,039,783 1,424 185,872,307 1,108 680 527 167,755 1.63 2.10 -
6月25日 火曜 235,877,510 1,736 170,075,832 1,378 709 595 123,422 1.94 2.32 -
6月26日 水曜 216,513,166 1,562 161,623,833 1,242 684 511 130,132 1.82 2.43 Webページサイズを77.7%に圧縮
6月27日 木曜 203,519,799 1,693 132,494,141 1,362 685 581 97,279 1.99 2.34 -
6月28日 金曜 173,578,579 1,610 122,653,629 1,295 681 590 94,713 1.90 2.19 トップ頁のバナーをテキスト化
6月29日 土曜 192,056,320 1,669 137,378,459 1,316 723 526 104,391 1.82 2.50 日経ネットナビ2002年8月号掲載
6月30日 日曜 195,002,864 1,724 138,236,261 1,407 728 604 98,249 1.93 2.33 -
月合計値 5,592,015,512 40,741 4,089,591,317 31,578 20,037 14,099 3,935,072 47.43 67.59 -
日平均値 186,400,517 1,358 136,319,711 1,053 668 470 131,169 1.58 2.25 -
標準偏差値 23,787,358 177 18,984,384 159 72 75 20,086 0.20 0.20 -
月合計補正値 4,834,438,798 - 3,332,014,603 - - - - - - Webページサイズを77.7%に
圧縮した補正値。
日平均補正値 161,147,960 - 111,067,153 - - - 105,516 - -
注)
  1. 「ページビューランキング記録数」を除いて、集計は、Microsoft Excelを使用して処理を行いました。
  2. 「全転送量」欄は、AN HTTPDのログファイルに記録された転送量の合計です。クライアント側のキャッシュデータは、含まれません。
  3. 「全IPアドレス数」欄は、AN HTTPDのログファイルに記録されたIPアドレスの数であり、同じIPアドレスからの接続は、1カウントとなります。
  4. 「テキスト転送量」欄は、AN HTTPDのログファイルに記録されたテキストのみの転送量の合計です。 大きくは、以下の様なフィルタを入れて、バナーリンク等の画像や不正アクセスを除外し、ログファイルを小さく前処理します。
    C:\>logfilter.bat 01
    
    
    logfilter.batの内容
    
    find /i /v ".gif " httpd.200206%1.log > tmp.log
    find /i /v ".jpg " tmp.log > tmp1.log
    find /i /v "robot.txt" tmp1.log > tmp.log
    find /i /v "OPTIONS " tmp.log > tmp1.log
    find /i /v " 404 " tmp1.log > tmp.log
    find /i /v "favicon.ico" tmp.log > tmp1.log
    find /i /v "robots.txt" tmp1.log > h.200206%1.log
    コマンドの詳細は、「DOS/Vコマンド・リファレンス BY FPCU」をご覧願います。 その後、Excelに読み込み、ステータスコードが400番台と500番台のエラーを除外して集計した転送量です。(結局、200と304コードと同じ?)
  5. 「テキストのみIPアドレス数」欄は、項dで作成したログファイルから、IPアドレス数を集計したものです。
  6. 「ホームページのカウント数」欄は、トップページにのみ設置したカウンタの計数値を表します。
  7. 「ページビューランキング記録数」欄は、カウントは、1日1回1ブラウザごとにカウントされる仕組みになっていますが、 ブラウザのクッキーが有効であり、そのクッキーに当日の訪問履歴がない時にカウントされる様になっています。クッキーを使用しますので、 1ユーザーのIPアドレスが変わっても別カウントしませんが、ブラウザがクッキーを受け入れなければ、カウントしません。 この「ページビューランキング」への記録は、全Webページにリンクを設置して、クッキーをチェックしております。
  8. Eは、IPアドレス当りのテキスト転送量で、当サイトの平均テキストページ容量が22kByteであることから、ユーザーは、IPアドレス当り約6ページ 閲覧されていることを表しています。
  9. Fは、IPアドレス対カウント数で、この数値は、1以下になってはいけないし、数値が大きい程、トップページに設置したカウンタの信頼性が高い と考えます。Gより数値が大きい場合は、明らかにトップページ以外への直リンクが多く、技術系のWebページとしては、望ましいと考えます。
  10. Gは、IPアドレス対ページビューランキング記録数で、この数値が大きい程、技術系のWebページでは、サイト内容が独創的か情報が新鮮で あり、一日の再訪問者が多いことを表していると考えています。
  11. 6月度のテキスト系の転送量は、約3.3Gbyteであり、IPアドレス1個当り約105Kbyteです。私のサイトの1Webページの平均が16Kbyte ですから、IPアドレス1個当り6.2頁読まれているということになります。意外と読まれていないので、ガッカリしています
「鷹の巣」の自宅サーバー2002年7月度のアクセス集計
2002年7月度 訪問者数 IPアド
レス当
りのテ
キスト
転送量
E=A/B
IP
アド
レス

カウ
ント

F=
B/C
IP
アド
レス

ペー
ジビ
ュー
G=
B/D
備 考
目安 最大値 目安A 最大値B 表示値C 最小値
D
全転送量
[byte]
全IP
アドレ
ス数
テキスト
転送量
[byte]
テキス
トのみ
IPアド
レス数
ホーム
ページ
カウン
ト数
ページ
ビュー
Rank
ing
記録数
7月 1日 月曜 197,185,843 1,927 140,513,874 1,616 792 742 86,951 2.18 2.18 不正な誤カウントが発生。注)a
7月 2日 火曜 229,619,173 1,997 162,378,704 1,705 778 730 95,236 2.34 2.34 -
7月 3日 水曜 191,237,170 1,913 136,495,919 1,635 794 762 83,483 2.15 2.15 -
7月 4日 木曜 213,759,512 1,975 155,162,633 1,713 811 764 90,579 2.24 2.24 -
7月 5日 金曜 183,799,916 1,903 133,429,773 1,599 725 695 83,445 2.30 2.30 -
7月 6日 土曜 196,336,629 1,663 149,771,818 1,414 587 663 105,920 2.13 2.13 初めて、C<Dとなる。注)b
7月 7日 日曜 172,620,986 1,639 130,109,394 1,412 592 699 92,145 2.02 2.02 -
7月 8日 月曜 207,399,235 1,873 151,694,845 1,653 805 712 91,769 2.32 2.32 -
7月 9日 火曜 202,455,626 1,908 149,376,592 1,599 718 748 93,418 2.23 2.14 -
7月10日 水曜 220,473,802 2,060 162,738,094 1,739 800 820 93,581 2.17 2.12 -
7月11日 木曜 246,035,180 1,904 171,228,417 1,626 715 679 105,306 2.27 2.39 20時40分全頁を差替え。注)c
7月12日 金曜 185,902,327 1,815 133,248,276 1,526 672 298 87,318 2.27 5.12 9時頃~11時30分、切断。注)d
7月13日 土曜 220,866,949 1,737 157,600,384 1,461 724 312 107,871 2.02 4.68 -
7月14日 日曜 186,783,209 1,663 137,756,853 1,407 746 304 97,908 1.89 4.63 20分間停電。IPアドレス変化。
7月15日 月曜 214,386,657 1,957 155,440,486 1,635 829 396 95,070 1.97 4.13 PageViewRankingのリンク位置変更
7月16日 火曜 279,878,156 2,189 206,177,010 1,902 859 372 108,400 2.21 5.11 -
7月17日 水曜 218,879,359 2,041 158,243,106 1,762 764 326 89,808 2.31 5.40 -
7月18日 木曜 205,541,852 1,975 150,332,161 1,723 810 93 87,250 2.13 18.53 PageViewRankingを掲示板に変更。
7月19日 金曜 179,911,231 1,803 132,173,692 1,528 709 77 86,501 2.16 19.84 -
7月20日 土曜 172,638,913 1,596 123,708,664 1,339 706 44 92,388 1.90 30.43 -
7月21日 日曜 175,002,064 1,609 133,739,080 1,330 721 69 100,555 1.84 19.28 -
7月22日 月曜 193,292,111 1,945 145,749,526 1,631 762 76 89,362 2.14 21.46 -
7月23日 火曜 219,398,742 2,091 163,141,634 1,748 863 431 93,330 2.03 4.06 1時30分掲示板にトップ頁を追加。
7月24日 水曜 166,470,971 1,575 127,542,248 1,289 570 201 98,946 2.26 - 5時30分~12時40分、切断。注)e
7月25日 木曜 216,413,458 2,031 161,756,680 1,657 781 27 97,620 2.12 - PageViewRankingへのリンクを
完全に撤去したがブラウザの
キャッシュによりアクセス数が
計数される。
7月26日 金曜 209,183,907 1,888 152,675,549 1,536 744 32 99,398 2.06 -
7月27日 土曜 203,849,804 1,620 153,009,425 1,304 686 18 117,338 1.90 -
7月28日 日曜 175,385,647 1,553 129,958,694 1,267 652 24 102,571 1.94 - -
7月29日 月曜 199,635,010 1,980 146,834,812 1,640 818 37 89,533 2.00 - -
7月30日 火曜 211,279,573 2,005 150,202,461 1,740 875 37 86,323 1.99 - -
7月31日 水曜 195,257,270 1,928 137,368,221 1,664 855 30 82,553 1.95 - -
月合計値 6,290,880,282 57,763 4,599,559,025 48,800 23,146 11,218 2,931,876 65.44 - -
日平均値 202,931,622 1,863 148,372,872 1,574 747 362 94,577 2.11 - -
標準偏差値 23,621,980 172 16,424,208 162 69 302 8,359 0.15 - -
注)
  1. あるサイトにCGIの再配布を行うに当たって、ページビューランキングのテキストバナーを誤って付けたまま再配布。 ページビューランキングのアクセス数だけが、推定50カウント程度、水増しされました。
  2. トップページに設置したカウンタの数値が、ページビューランキングの数値より少なくなる現象が発生。 ページビューランキングのリンクは、この時点では、全ページに設置しているので、当然と言えば当然です。
  3. 20時40分にページビューランキングのリンクをトップページのみに変更。トップページ以外のリンクは、全て削除しました。 7月12日~17日で、クッキーを受け入れた方の比率は、47.3%と判明
  4. フレッツADSLとプロバイダ(ASAHI-NET)間で、不具合が発生し、インターネットから切断されていました。(PPPoE認証接続失敗) DiCEのログによると、11時26分にIPアドレスが更新されから12時頃まで、インターネットサーバーが機能していませんでした。
  5. 7月24日19時17分PageViewRanking終了。(理由は、PageViewRankingサイトのクッキー処理に時間がかかりすぎる場合があるからです。) フレッツADSLとプロバイダ(ASAHI-NET)間で、不具合が発生し、インターネットから切断されていました。(PPPoE認証接続失敗) AN HTTPDログによると、5時32分にIPアドレスが更新されから12時42分まで、インターネットサーバーが機能していませんでした。

目次▲頁先頭