私はいくつかのドメインを持っていまして、一所懸命更新をしているサイトもあれば、下品なサイトもあり、また、ドメインに愛着があるからとりあえず毎年お金だけ払って更新はしていないサイトなんかもあります。

そのうちの1つのサイト、2006年頃に取得したとあるドメインが変なのです。

前々回のTBPR(ツールバーページランク)更新の時、PR3が付いていたんです。

元々MTで運営していたドメインなのですが、新しいドメインを取得しそちらに移転し、バックリンクらしいバックリンクも数本しかなくてPR1程度だったので、301リダイレクトなどの作業は特にせずに工事中です。移転しましたといった感じで移転先を教えるペラページを作成して放置していたサイトです。

何年分かの蓄積されたログをもってしても、PR1だったのが、何もせず放置しているだけでPR3にあがっていました。

2キロバイトしかないhtmlファイル1つで、しかも被リンクもほぼ皆無なのにPRが上がるとはいかなることか。

なかなか気に入ったドメインで、いずれ素晴らしいサイトを作ろうと思って残していましたので運営歴があるから認められたのかな? と、なんとなく思っていました。

それと同時に、Googleの判断基準はよくわからないな。と思っていました。

しかし、実は自分の身に覚えがなかっただけで、PageRank偽装をやらかしていたのかもしれません。

2015年4月6日追記:PageRank偽装になったトリガーが予想ではありますが特定できました。

見に覚えのないPageRank-メニュー

PageRank偽装とは

ツールバー上に表示されるPageRankの数値を、本来より高く表示する手法のことです。

主な使い方は、中古ドメインを売るときに高い数値を表示させておいて高く売りつけたり、相互リンクやディレクトリ型リンク集の登録者を呼び込んだりする為に利用されるようです。

見分けるには検索でPageRank偽装チェックとヤフればたくさん出てくるかと思います。

もしくは、info:ドメイン名で調べると、本来のPR元のページが表示されるので判断できます。

なぜPageRank偽装に気付いたのか

ある日、手持ちのドメインにいくつサイトリンクが付いているか調べようと思い、自分のサイトAのドメイン名を入力し検索したところ、私の管理している別サイトであるBサイトのタイトルとdescriptionの内容が表示さているではありませんか。

なんということでしょう。

当時のサイトAのhtmlの内容は、私の管理しているドメインにリンクを張り、サイトAは工事中だけど、他にこんなサイト運営してるよ。といったリンクを張っているだけでした。

工事中

このページはリニューアルに向けて放置中です。

新ドメイン〇〇〇へ移転しました。

お手数ですがブックマークの変更をお願いします。

また、新サイトBも開設しました。

興味のある方はよろしくお願いします。

こんな感じの本当のペラページでした。

推理開始

ウェブマスターツールには登録しているから、同じ運営者だということはGoogleも理解しているだろう。

しかしサイトAはXrea+を使っておりまして、サイトBはエックスサーバー。

「IP分散しても無駄だぜ」と言わんばかりのGoogleさん凄いね。

きっとペラページ過ぎて、ドメインオーソリティの一番高いBサイトと同じサイトだと勘違いしているに違いない。

という推理をした私は、descriptionとrel=”canonical”を設定し、「違うドメインだよ、Googleちゃんのお茶目さん」などと考えながら、放置していました。

しかし、待てども待てども、サイトタイトルやdescriptionの内容は元に戻らず、その次のPR更新でも3をキープしたままになっていました。

PageRank偽装チェックを使ってみた

SEOチェキというSEOツールがあったので暇な私は色んなドメインを入力して遊んでいました。

そのツールはグーグルPageRankやAlexaランクなども一覧で表示され、各種ブックマーク数やインデックス数、バックリンク数もまとめて表示してくれる面白いツールなのですが、その項目の一つにPageRank偽装チェックという項目があったので、クリックしてみました。

すると、私のサイトAは「Warning! 偽装の可能性あり」と表示されたではありませんか。

なんということでしょう。

他の偽装チェックツールと使ってみても、偽装していると出るし、info:コマンドでも確かに私のサイトB(PR3)のページからPageRankが流れてきているようです。

また、ドメインAで検索すると、タイトルとスニペットがドメインBの物が表示されるのですが、キャッシュの内容もドメインBの物になっていました。

PageRankを偽装する方法

PageRank偽装で調べてみても、PageRank偽装に騙されないための方法や、PageRank偽装を暴くチェックツールの記事が多く、「PageRank偽装する怪しいツール」とやらでPageRankを操ると書いている記事もありました。

しかし、私が知りたいのは、PageRankを偽装する方法なのです。

方法がわからないと解除のしようがありませんからね。

というわけで、ググってみると、クローキングとリダイレクトを使うアレという記事に、クローキングを利用して、Googleクローラーが来たときだけ高PRのサイトに301リダイレクトで飛ばすというかなりアグレッシブな手法を使っているとのことでした。

なるほど。

さっぱりわからない。

いや、理屈はわかるのですが、何故、自然とそのようなことが起こってしまうのであろうか。

結局は自分のミスだったのか

.htaccessを知らず知らずに自分のBサイトに対して何かやらかしてるのか?? と思い、偽装容疑サイトAにFTP接続接続してみました。

で、.htaccessを確認してみようかと思いましたが、そもそも、index.htmlとウェブマスターツールの所有者確認用乱数.htmlとrobots.txtしかありません。

robots.txtを見ても

User-agent: *
Allow: /

と、男らしさを感じさせるほど、何も書いていません。

ウェブマスターツールでみても何かメッセージが来ているわけでもなく、クローラーは時々来てはいるようです。

クローラーがうまくクロールできてなさそう

ただし、データがないようで、インデックスはされていないようです。

やはりインデックスされていないようだ

Google検索エンジンでsite:コマンドをやってみても、確かにインデックスはされていません。

念のため、生ログを見てみると、Googlebotは時々やってきて、200 okになってるし、robots.txtも200 okで見ているはずなんです。

サイトBの.htaccessでも確認してみようかとディレクトリを覗いてみると・・・

犯人らしきファイル発見!!

サイトBにウェブマスターツールの運営者確認用の乱数.htmlがなぜか2種類ありました。

2種類の運営者確認用の乱数.htmlが存在する事によって、Googleが何か混乱したのか、勘違いを引き起こしたのでしょうか。

2015年4月6日追記:上記のウェブマスターツールの運営者確認用のhtmlは、本件には関係ありませんでした。

とりあえず全ドメインの所有者確認をやり直してみた

ただ、FTPで見てみるとサイトBにだけ管理者確認用の乱数.htmlが2個あっただけで、他のサイトにおかしな点は見当たらなかったです。

他の紐付けしているドメインは所有者の確認を1つの共通のgmailのアドレスで行っていましたが、Bのサイトだけはサイトを立ち上げる前にGoogleAppsのアカウントを作ってメール用に運用していた後サイトを作ったので、最初に確認された所有者確認コードが1つだけ違っており2種類の管理者確認コードが存在していたのかもしれません。

そのあたりの何かがトリガーになってGoogleがバグったとしか思えないんですよね。

2chでも何のリンクも付いてない自分のサイトにPRがついていて、偽装チェックをしたら身に覚えのない偽装の疑いが掛かっていたということだったので、時々起こる事例のような気はします。

FTPで2個あった確認用の.htmlは削除して、念のため、所有者確認を全ドメインでやり直してみました。

そして、ついでにウェブマスターツールで、Fetch as Googlebotにインデックスを送信しておきました。

結局何が原因だったのだろう

  1. 複数のメールアドレスと紐付ける作業がうまく行かず所有者が良くわからない状態に?
  2. 2種類の所有者確認用.htmlが2種類あり混乱してる?
  3. ペラページ過ぎてindex削除されている?
  4. 知らず知らずのうちにクローキングしている?
  5. サイト設定→新しいドメインの URL を Google に連絡します。で、誤って移転先に指定した?

現状、思いつく原因がコレくらいしかないです。

1.の紐付け作業でGoogle側が混乱している。という可能性はゼロではないけど、先にドメインでGoogleAppsに登録して、あとでGmailのアカウントに統合させるなんて珍しいことではないと思いますので、こんなので簡単に再現されるのなら、ググった時にもっと情報が出てきそうです。

2.の所有者確認用.htmlが2種類あって混乱している可能性ですが、確かに1回目はGoogleAppsに紐付けたほうのhtmlを拾っていっているのですが、2回目以降はちゃんと、Gmail側のhtmlを拾っていってたんですよね。
このあたりの作業で何かイレギュラーな事例が発生(もしくは複合的な)して混乱しているのか。

3.のペラページ過ぎてインデックス削除されているというのは、ペラ過ぎたらインデックス削除で終了じゃないでしょうか。わざわざ別鯖(別IP)で私が管理しているサイトで最もアクセスが多く、PRの高いサイトのタイトルとスニペットに書き換えてPRまで3にしてくれるほど親切だとはとても思えません。

4.の知らず知らずのうちにクローキングしている説も、生ログみてる感じなさそうでしたし、そもそも、htmlとrobots.txtしかないような仕様でたまたまそのようなことが起こるとは思えません。
そもそもAサイト(タイトルが書き換えられて困っているサイト)は、放置歴が長く、Bサイトのドメインを取るより以前から放置されていました。

5.はBドメインのウェブマスターツールアドレス変更(移転)の設定画面でAサイトを誤って指定したらそうなるのではないかなという勝手な想像です。
これ、ウェブマスターツールでドメインをまとめて管理しようとしたときに、新しいドメインの URL を Google に連絡します。という説明を見て、深く考えずに押してしまった可能性は正直否定できません。
最初に登録していたのがAドメインで、次にBドメインを追加しようとして押してしまった可能性は十分に考えられます。
しかし、押したかどうかは今では知る由もありませんし、念のためもう一度Bのサイトを指定しなおそうと思っても、Bドメイン→Bドメインという指定はできないようです。

やはり特に怪しそうに感じたのは2.と5.なのですが、他にどのような原因が考えられるのでしょうか。

とりあえず、現状試したことリスト

  • 重複していた所有者確認用の乱数.htmlを削除した。
  • Googleにもう一度クロールのお願いをした。

まだ試せそうな施策リスト

  • サーバーを移転させてみる(Xrea→Xserver)
  • インデックスされるようなコンテンツを作ってみる
  • ウェブマスターツールでサイトAの登録を抹消する
  • ウェブスパムチームに再審査の申請

サーバーを移転は本当の気休めというか、Xrea側におかしな点はなさそうなので意味はなさそうです。

インデックスされるようなコンテンツを作るというのも、いまいち関係なさそうな気がします。

ウェブマスターツールでサイトAの登録を抹消してしばらく様子を見るというのは、多少の効果はありそうですが、Googleから見ると他人にPRを渡そうとしている(騙そうとしている)悪い企みのように見られそうで怖いです。

ウェブスパムチームに再審査の申請を出して、サイトAとサイトBは運営者は一緒だけど全く別コンテンツだと伝えるのは効果があるかもしれません。

が、そもそも何が原因かわからないので、スパムチームに送るのはお門違いの気もします。

PageRank偽装をやらかした?まとめ

まずはしばらく様子を見て、スニペットが変更されたりPRが下がってまともな数値になれば、2個あった所有者確認用の.htmlが原因だということになりますね。

しばらく様子を見てみないとどう変化するかはわかりませんが、このまま平常のPageRankやスニペットに戻って欲しいものです。

もし、このようなパターンの答えやヒントをお持ちの方がいらっしゃいましたら、コメント欄、トラックバックピンバック、SNS、メールなどで教えて頂けたら幸いです。

 追記:本件はGoogle側のおせっかい過ぎる機能のおかげでした

2015年4月6日追記:実はPageRank偽装が発生した理由は、Googleが高機能に進化し過ぎていたことが原因でした。

工事中

このページはリニューアルに向けて放置中です。

新ドメイン〇〇〇移転しました。

お手数ですがブックマークの変更をお願いします。

また、新サイトBも開設しました。

興味のある方はよろしくお願いします。

実は、リンクとそのすぐ近くに移転という文字列を記述していたため、勝手に移転したと勘違いされて処理されてしまっていたようです。

ほんんどコンテンツがない状態でリンクと移転という文字列を記述してしまうと、ページ移転と勘違いされてしまうようです。

近いうちにテキストに大幅な修正を行い、正しく反映されるか調べてみたいと思います。

関連記事