2015-07-03(Fri)

Google Analytics のスパム対策

前回のGoogle Analytics の www.event-tracking.com スパムの時に読んだサイト Ohow で推奨される有効なホスト名による一致フィルタを作ってみる。

但し、最後にも書きましたがこの手法を採用するか否かは・・・。
とりあえず以下、フィルタの作り方だけは勉強しておこうということで。

参考したページはこちら。
http://www.ohow.co/what-is-referrer-spam-how-stop-it-guide/#Valid_Hostname_Filter_Multiple
乳児レベルの英語力で適当に理解したつもりでいるだけなので間違っている可能性は大いにあり。
必ず元記事を参照してください。

■有効なホスト名フィルタ


この方法はすべてのゴーストスパムを防ぐことができるし、またそうしないと新しいスパムが現れるたびに新しいフィルタを追加する事になる。
これは、これまでのGoogle Analyticsでスパムを停止するための最も効率的な方法といえる。
この方法の重要な部分は、任意の合法的なトラフィックを除外しないように、すべての有効なホスト名のリストを取得することだ。

ちと判んないけど要するにホワイトリストということでいいのかしら。

・ホスト名のリストを表示する


レポート>期間を指定して適用(多ければ多いほど良い)
gaspam001rep.png

gaspam201.png


左メニューのユーザー>ユーザーの環境>ネットワーク
gaspam202.png

グラフ下の“プライマリ ディメンション:”横の“ホスト名”をクリック。
表示された表からのすべてのホスト名から有効なものを検索してコピーする。
gaspam203.png


・有効なホスト名の判断


主にGoogle Analyticsトラッキングコード(UA-XXXXXX-1)を置く自身のホスト名を含む全ての場所
例)www.yourdomain.com, yourdomain.com, blog.yourdomain.com

ショッピングカートのような自身のIDを追跡するサービスを有しているならその場所も有効なホスト名だ
例)yourshopingcart.com

サイトに多くの国からの訪問者があり、彼らが翻訳サービスを使用している場合、それも有効なホスト名となる
例)translateservice.com


・無効なホスト名の判断


基本的に自身のサイト環境から認識していない他のホスト名は google.com とか amazon.com のような見覚えのある名前(スパマーは人を欺くためにこのような名前を使用する)になっている。
そして一連してホスト名が設定されていない。


・有効なホスト名の正規表現式を作成する


有効なホスト名を収集したら、それらのすべてに一致する正規表現式を作成する。

例)yourdomain.com|otherdomain.com|translateservice.com|yourshoppingcart.com|otherservice.net

サイトの年齢や規模によっては、式はもっとシンプルかもしれないしもっと複雑になるかもしれない。
あなたが YOURDOMAIN を追加した場合、あなたがサブドメインを持っている場合でもそれらのすべてを追加する必要はない。あなたが yourdomain.com を指定すると、それは blog.yourdomain.com や help.yourdomain.com のようなサブドメインにマッチする。
正規表現なのでスペースは入れないようにして | でホスト名を区切る。 \ は . をエスケープするが GA はシンプル正規表現の中でそれ無しで式を受け入れる。(?)


正規表現で説明している部分が上手く文章化できないけど、言わんとしていることはなんとなく。
hoge\.com と書かなくても、 . は任意の一文字を現すので hoge.com で大方間違いなくマッチするしシンプルでいいんじゃね?

ってことかと。

んで、当サイトを例にして次のように書いてみる。
jnsmith.blog64.fc2.com|googleusercontent.com


・フィルタを設置する


アナリティクス設定
gaspam002ana.png

ここで「フィルタ無し」ビューを作っていないなら後で比較できるよう作っておくことを推奨する。

なるほど、自分は推奨されるとおりビュー設定から「ビューをコピー」で別ビューを作った。

ビュー>フィルタ

gaspam101.png


新しいフィルタgaspam003newfilter.pngをクリック。

フィルタ名:適当に「有効なホスト名」とか
フィルタの種類:カスタム>一致
フィルタのフィールド:ホスト名
フィルタパターン:先に作成した正規表現式
gaspam204.png

保存する前に時間節約とデータ保護のためにフィルタの確認を行うことを強く推奨する。

「このフィルタを確認する」をクリックすると、フィルタ適用前と後で除外されたデータを確認できる。
問題がなければ「保存」をクリックして終わり。


でもこれって、どこか悪意のない紹介サイトで、新たにリンクされた時とか記録されないような気がするのはオイラだけ?
このフィルタ手法を適用するか否かは・・少し実験用のサイトで様子を見てから決めようと思いまふ。
 
 
プロフィール

nakami

Author:nakami
可愛いテンプレートに似合う俺
うそAチームのスミス大佐

NAVI
カテゴリー
最近の記事
リンク
FC2カウンター
ブログ内検索
RSSフィード
sponsored link