Google Analysticsと他WEB解析ツールでの統計差異を考察してわかったこと
2018年7月31日SEO用語集, SEO関連, トピックス, ノウハウ
複数のWEB解析ツールでサマリーの統計情報として基本的なPVや訪問数、滞在時間、直帰率がツールの種類で大きく異なっているケースが多い。これを調べてわかったことはGoogleはよくも悪くもすべての母数で平均値をとっている。それに対してGoogle以外の解析ツールはもう少し高度な事をしていることがわかった。つまり集計に値しないものは母数に入れていない。言い換えると人間目線のマーケティング思考で集計されている。
例えば、平均滞在時間があったとしよう。この中には(not set)等の怪しいリファラーSPAMが大部分占めている可能性がある。202レスポンスで戻ってくるDoS攻撃もあるだろう。どうやらこのような怪しい(not set)を積極的に統計情報の中に取り込んで統計除外対象に組み込んでいるのが読み取れる。
気づいたきっかけ
セキュリティ攻撃を受けている時の統計グラフの数字の差異がGoogle Analysticsと他WEB解析ツールとの差が激しく出たからだ。こう考えると、改めてWEB解析ツールは複数使う必要があると感じたし、どこを比較して見たらより正確な状態をつかめるかも理解できた。実勢にあっていないところもあるがやはり全体像を掴むためGoogle Analysticsの素の情報も必要だと感じる。
キーワードに出てくる分かりにくい表記を理解してより正確な実態像をつかもう
- (not set) キーワード計測不能な状態のケース(URL直アクセス、リダイレクト、ブラウザ起動時のタブオープン、他の検索エンジン、たまたまタイミング的に拾えなかった、攻撃によるもの)
- (not provided) 殆どは検索エンジンがhttpsで暗号化されているのが常だからキーワードがわからない状態です。GoogleならGoogleSearchConsole連動で明確にできますが他エンジンは連携していないので不明となります。
- (other) Googleが一日のディメンジョンに格納できる量が限られているため、それを超えたものはotherで集計される。
- (content targeting) Adsense埋め込みの場合
- (remarketing / content targeting) AdSense広告由来のアクセスで、リマーケティングによる表示からのアクセス