2013年1月21日月曜日

google急上昇ワードの謎


google急上昇ワードが変?!

ガジェットなどでgoogle急上昇ワードをチェックしている人は案外多いようです。


こんなのです。


20位くらいまでgoogleからxmlで提供されているので
http://www.google.co.jp/m/services/trends/get?hl=ja&gl=jp


参照して個人でアプリを作ったりも可能。








 普段から見ていると、中におかしなキーワードが混ざってることに気がつきます。
一介の不動産屋や、メンズエステのことをそんな大勢の人が検索してるはずは
ないよなぁ…と。


これは、きっとSEO業者さんの仕業。
どんな手法でやってるのか、実サイトを調べつつ考えてみようと思います。



 ひとまず4位のあたり見てみます。
 そのままキーワード通りに検索すると、ほんとに普通の町の不動産屋さんて感じのサイトがヒットしてgoogle mapも表示されています。


8位のメンズエステも同様。


先にこの二つのサイトのドメインについて調べてみました。
 
不動産屋さんサイトのドメイン情報
ドメイン登録業者:お名前.com
サイト管理者:design-in.jp(->kagoya.net)
サーバー:NTT Verio (lala-cake.com)
root99#whois asahi-fudousan.net
This server only serves information on GMO Internet,Inc.-maintained domain names
For more information, please contact hostmaster@gmo.jp.
Domain Name: asahi-fudousan.net
Created On: 2010-11-19 22:56:05.0
Last Updated On: 2012-05-24 20:33:51.0
Expiration Date: 2013-11-19 22:56:05.0
Registrant Organization: Asahi Real Estate Development
Registrant Street1: 20-28,Takasago2-chome
Registrant Street2: Registrant Email: admin@onamae.com
Admin Name: Yusuke Watanabe
Admin Organization: Design Inc.
Admin Street1: 3-3-2 Shibuya
Admin Street2: Shibuya MK bld. 5F
Admin City: Shibuya-ku
Admin State: Tokyo
Admin Postal Code: 150-0002
Admin Country: JP
Admin Phone: 03-5467-2051
Admin Fax: 03-5467-2061
Admin Email: domain@design-inc.jp
Tech Email: yokota@design-inc.jp
Name Server: ns1.secure.net
Name Server: ns2.secure.net

エステ屋さんサイトのドメイン情報
ドメイン登録:AGN Inc
ドメイン登録者:sakura.ad.jp
サーバー:ucom
root99#whois luxia.jp
[Domain Name]                   LUXIA.JP
[Registrant]                    AGN Inc
[Name Server]                   ns1.dns.ne.jp
[Name Server]                   ns2.dns.ne.jp
[Created on]                    2011/04/25
[Expires on]                    2013/04/30
[Status]                        Active
[Last Updated]                  2012/12/04 09:48:45 (JST)
Contact Information:
[Name]                          SAKURA Internet Domain Registration
[Email]                         jprs-staff@sakura.ad.jp
 MENSLUXIA.JP も同様だけど、MXがあるのはこれだけだから、こっちが本体かな?


ドメイン登録業者:ムームードメイン
root99#whois uewomuitearukou.info
Domain ID:D47487589-LRMS
Domain Name:UEWOMUITEARUKOU.INFO
Created On:15-Aug-2012 13:03:14 UTC
Last Updated On:14-Oct-2012 20:36:31 UTC
Expiration Date:15-Aug-2013 13:03:14 UTC
Sponsoring Registrar:GMO Internet, Inc. d/b/a Onamae.com (R110-LRMS)
Registrant Name:Whois Privacy Protection Service by MuuMuuDomain
Registrant Organization:Whois Privacy Protection Service by MuuMuuDomain
Registrant Street1:2-7-21 Tenjin Chuo-ku
Registrant Street2:Tenjin Prime 8F
Registrant Street3:
Registrant City:Fukuoka-shi
Registrant State/Province:Fukuoka
Registrant Postal Code:810-0001
Registrant Country:JP
Registrant Phone:+81.81927137999
Registrant Phone Ext.:
Registrant FAX:+81.81927137944
Registrant FAX Ext.:
Registrant Email:privacy@whoisprivacyprotection.info
Admin ID:1392A617187
Admin Name:Whois Privacy Protection Service by MuuMuuDomain
Admin Organization:Whois Privacy Protection Service by MuuMuuDomain
Admin Street1:2-7-21 Tenjin Chuo-ku
Tech Name:Whois Privacy Protection Service by MuuMuuDomain
Tech Email:privacy@whoisprivacyprotection.info
Name Server:DNS0.HETEML.JP
Name Server:DNS1.HETEML.JP

 いきなりSEO業者さんの名前が出てくるのかと思ったけど、特におかしいところは無いですね。共通項があるとしたら お名前.comのGMOが出てくることくらいだけど、ドメインのリセラーでは大手なので、まぁありがちとも言えます。
 あとは、不動産屋さんのサーバー場所なんですが、lala-cake.comと同じ場所にあって、ドメイン情報を見るとまたムームードメイン。ムームーの中身はGMOなので結局全部一緒か。うーん。

サーバーの置き場所もぜんぜん統一感無いし、純粋にアクセスアップだけ請け負う業者さんに依頼したのかも知れませんね。


 今回のキーワードをgoogle トレンドで見てみると短期間で瞬間的にアクセスが発生したことが分かります。

Google トレンド キーワード「メタボ メンズエステラクシア」


アクセスのあった地域で見ると、1/8~1/9 で東京でのみ色がついてます。 かなりピンポイント。東京の人しか検索してない。

Googleトレンド 地域別




とりあえず出てくるサイトを片っ端から見て行こうかな…。




 上の方に出てくるサイトはみんな結構まとも。
 ちゃんとお店の宣伝をしてる。
けど、これ個人のブログだからここまで業者よりな案内はなんかねぇ。












 ちょっと下のランキングになると、とたんに変な文章に出くわす。これなんか日本語として成立してないくらいおかしい。





  よく見ると、右側の最近の記事一覧が…
あれ?

今日の急上昇ワードにある「フランク ザンボニー」「ソンミ」まで記事作ってる。
これは完全にプログラムが介在してると見て間違いなさそう。

デタラメな文章をgoogleでヒットした文字列を使って生成しているのか、それとも
 他に考えられる理由としては、急上昇ワードの一致率が高いとサイト順位が上がったりするとか?


 さらに他にも見て行きます。

これなんかは、エントリーのタイトルにエステ屋さんの名前があるけど本文はまるで関係ない記事。
タイトルはGoogleのランク付けに大きく影響してる部分なので、それ以外はどうでもいいっていうある意味割り切り型かな。







 これもタイトルのみで中身は全部同じ内容のコピー。



また、20ページ目くらいからは、日本語はめちゃくちゃなのに「てにをは」だけはシッカリしてるような、形態素解析のルーチンを持った駄文作成ツールでもあるんじゃないかと思わせられるページが延々と続きます。





 もう疲れたよ…パトラッシュ。いったい何件あるの? 

とヒット件数見たら3万件?
一つのサイト更新で3つ4つの更新ページがGoogleにリストされるとしても1万サイト近くあるんでしょうか。



これはさすがに見てらんないな。

トレンドの上昇タイミングを見ても1日くらいで更新をかけてることになるから、botを使って自動化しないと不可能。




 メンズエステ以外にはどんなこと書いてるのかと思って見たけど、特に商品の紹介というわけでもなさそう。


冒頭の  "歳をとると、目元のしわが気になったり顔のたるみが気になったり、髪の毛の色が気になったり様々なところが気に" で検索すると、ほぼ同内容のサイトが4760件登録されている。
 
手動だとしたら凄いなぁ。。








どうやら
 googleの順位を上げてくれるおじさんがどっかにいて、その人に頼むと、その人が持ってるブログとかサイト1万件くらいをプログラムで一気に更新かけて宣伝してくれる。
そんなところまでは判明しました。


botで思い出したけど、
少し前に特定のサイトを狙ったbot攻撃が話題になりました。
ウィルスに感染した数十万のクライアントが一斉に攻撃対象のサイトにアクセスしてサーバーをダウンさせるという手法です。

IRCから指示を出してたみたいですが、基本的にtelnetプログラムが動作してればIRCでもWebへのアクセスでもなんでも出来ますね。
まだやってるのか分からないけど、当時このbotを時間貸しでレンタルしてるクラッカーもいたみたいなので、興味がある人はTorの中とかで探してみては?


botとひとくくりに言ってしまうと、bot=悪と誤解する一部の人がいるかも知れないので念のため補足しておきますが、Twitter botや、Wikiの更新など、大量のデータを処理させるためのプログラムは今や当たり前に存在しています。

これらのプログラムを使ってgoogleの検索クエリーとか投げたりとかしてたりすると面白そうだなぁと思いました。


.