こんにちは!名前だけ編集長をやっている羽山です。

弊社では無料で利用できるアクセス解析ツールのGoogle Analyticsを利用しています。
今回は大規模サイトで問題になる(other)について一般的な対策から裏技的な方法までご紹介します。

(other)とは
Google Analyticsが一意のURLとして1日に認識できるのは50,000URLまでです。それを超えた場合、ページビューの低いURLから優先的に(other)というURLに変化してしまいます。
5万と聞くと十分な数に思えますが、弊社の運営するスーパーデリバリーでは30万点超の商品があり、それに商品一覧のページが加わると果てしない数のURLになります。 

弊社で実施している3つの対策
1. 50,000URLに収まるようにフィルタ設定してプロファイルを分割する
Analyticsのヘルプにも記載してある最も一般的な対策です。
ヘルプによると高トラフィックのページビューをフィルタで削除することによって50,000URLに抑えなさい。となっています。

完全に分離されたいくつかのセグメントがあるならば、それぞれプロファイルを作成してAnalyticsが公式にオススメする方法に従えば問題ありません。しかしそういったセグメントがないのなら情報が各プロファイルに分離してしまうので全体のセッション数やページビューなどをつかみづらくなります。

そこで弊社ではいくつかのページを同一のページとして書き換えることによってURL数を減らしています。
この方法ではセッション数やページビューには影響が出ないため、対象のURL自体を解析したい場合以外は特に意識せずに利用できるというメリットがあります。

スーパーデリバリーの例では商品詳細ページのURLが多数を占めていました。
そこでプロファイルを3つに分けるという対策をとっています。
  • (a) フィルタなしプロファイル
  • (b) 商品詳細ページのURLをすべて1つのURLにまとめたプロファイル
  • (c) 商品詳細ページ以外のURLをすべて削除したプロファイル
(b)の設定は下記のようになっています。
カスタムフィルタ、詳細
フィールド A -> 引用 A: リクエストURI, ^/p/r/pd_p/[0-9]+/
フィールド B -> 引用 B: -
出力先 -> 構成: リクエストURI, /p/r/pd_p/0000000/
出力フィールドを上書き: はい
この例では下記のようにURLが変化します。

(置き換え前)
http://www.superdelivery.com/p/r/pd_p/1234567/

(置き換え後)
http://www.superdelivery.com/p/r/pd_p/0000000/
 
通常の解析では(b)のプロファイルを利用して、商品詳細を解析したい場合は(c)を使います。
(a)はこの後に出てくるアドバンスセグメントを利用した方法やReporting APIを利用してデータを抽出する場合に利用しています。


2. 直近の数値を見る
実は50,000URLの制限は前々日以前のデータにのみ適用されます。
例えば今日が7月30日だとして、7月29日のデータを閲覧する場合は50,000URLを超えたデータを閲覧可能です。ただし、直近のデータの閲覧については保証されていない場合もある点は注意が必要です。


3. アドバンスセグメントを利用する
Analyticsの内部データとしては50,000URLに制限せずに保持されています。
50,000URLに制限されるのはAnalytics側である程度集計されたパターンの解析を行う場合に適用されます。
その枠を超えて動的な解析が必要な操作を行うと元データから解析されるため、50,000URLを超えたデータを閲覧できます。

早速試してみます。
下記のようなアドバンスセグメントを作成します。
名前: すべて
一致, ページ, 正規表現一致として、テキストボックスに . (ドット) 一文字を入力
すべてのページに一致する条件なので、セッションは一切絞り込まれない素通しのアドバンスセグメントです。

作成したら早速そのアドバンスセグメントを適用してデータを見ると (other) がなくなり、すべてのデータが表示されます。ただし、アドバンスセグメントではデータの件数によってはサンプリングされることがあるので、その場合は期間を短くするか[データ精度を優先]する設定に変更して下さい。


弊社では上記3つの方法を組み合わせて50,000URLの制限とうまく付き合っています。
他にもPreminumを利用するという方法もありますが、それなりに高価なので現時点では採用していません。

以上、今回はAnalyticsの話題でした。また次回よろしくお願いします!