なぜゴミ記事が検索で上位に表示されるのか

なぜゴミ記事が上位なのか? 素朴な疑問・考察

ネットで検索していると毎回必ずといっていいほど出くわすのが、大げさなタイトルばかりで中身のない「ゴミ記事」や「ゴミまとめ」です。あれ本当にイラっとしますよね…。

それで検索ユーザーとしては早急にそういうゴミ記事を検索結果から排除してもらいたいのですが、なぜかその手の記事にエンカウントする確率は減るどころか年々増えているような気さえします。Googleなどの検索エンジンは何も対策をしていないのでしょうか?

答えはもちろん「No」です。しかし実は今のところ、検索エンジン側が対策してもゴミ記事を弾くのには限界があるのです。今回はその辺の事情について、私が知っていることや推測も交えて書いていきます。


※ゴミ記事を検索結果から除外する具体的な方法を知りたい方は、以前の記事「邪魔なサイトを検索から除外する方法」をご覧ください。

スポンサーリンク

そもそも、検索結果の表示の仕組みはどうなっているのか

ではそもそもの話ですが、ブログやサイトのページが検索結果に表示される仕組みについて説明しておきましょう。

例えばGoogleの場合、サイトが検索結果に表示されるまでには次のようなステップがあります。

  1. 何らかの方法でサイトの存在が検索エンジンに通知される
  2. 「クローラー」がサイトを巡回し、各ページを評価する
  3. ページが検索結果に表示される

1つずつ詳しく説明しますね。

何らかの方法でサイトの存在が検索エンジンに通知される

まず、サイトが検索結果に表示されるためにはGoogleなどの検索エンジンにブログやサイトを認知してもらう必要があります。どんなに素晴らしいサイトであっても、認知してもらわなければ絶対に検索結果には掲載されません

それでサイトの存在を検索エンジンに通知するには、主に次の2つの方法があります。

  1. 専用のページから検索エンジンにURLを送信する
  2. どこかのサイトにリンクを貼ってもらう

一つ目は専用のページから検索エンジンにサイトのURLを送信する方法。これが一番一般的で確実です。昔は手動で行うことが多かったのですが、今はブログシステムが自動的にやってくれたりするので、ブログを書けば勝手に検索エンジンに通知されるようになっている場合が多いです。

また、二つ目としてはどこか別のサイトにリンクを貼ってもらう方法もあります。後述する「クローラー」がそのサイトを巡回した時に、リンク先をたどって自動的に認知してくれます。ただし、こちらのほうはどのタイミングで認知してもらえるかはわかりません。

「クローラー」がサイトを巡回し、各ページを評価する

次に、サイトを認知した検索エンジンは「クローラー」と呼ばれるプログラムでサイトを巡回し、各ページを解析して評価を行います。この評価のアルゴリズムは非公開ですが、おおよそ次のような項目を見ていると考えられています。

  • サイトの被リンク数
  • サイトの構造
  • 記事に含まれるキーワード

どうやらこういったものを総合して点数化しているようです。なお、クローラーが巡回するのは一度きりではなく、サイトの更新頻度に合わせて定期的に巡回してきます。

ページが検索結果に表示される

最後に一通り評価が終わると、ページが検索結果に反映されます。といっても、ほとんどの場合は最初のうちは圏外だったり、検索結果の2ページ目以降に表示されるのが普通です。しかし、記事を改善したり、記事がたくさんシェアされたりすると順位が上がる場合があります。


各検索エンジンでは上記のような手順でページを評価して検索結果に反映させています。私は素人なのでこのくらいしか知りませんが、調べれば色々面白い記事も出てくると思うので興味のある方はググってみてください。

なぜ、ゴミ記事が上位に表示されるのか

ではここからが本題です。なぜゴミ記事が検索で上位に表示されてしまうのでしょうか?その理由には検索エンジンの限界と、それを突くテクニックがあることが考えられます。

検索エンジンの限界

まず、いくら検索エンジンといえども「どのページを良しとするか」という判断には限界があるのが現状です。

わかりやすい例としては「画像中心のサイト」が挙げられるでしょう。例えばプロの写真家が素晴らしい画像で埋め尽くされたサイトを作ったとしても、そのサイトは一般的な検索ではまず上位には食い込みません。

理由は簡単で、画像ばかりで文章がないサイトはクローラーが評価しづらいサイトだからです。評価ができないということは当然「良いサイト」だと判断できないということで、上位には表示されないのです。

ではなぜ画像中心のサイトはクローラーが評価を行いにくいのかというと、現在の技術では画像そのものの良し悪しを判定するのが難しいからです。つまり、どんなに素晴らしい画像でも画像だけではクローラーが評価を行えません。

さて、ここで鋭い方は「じゃあ画像検索はどうなってるんだ?」と疑問に思うでしょう。画像からその良し悪しを判定できないなら、画像検索は何を基準にして画像の表示順位を決めているのでしょうか?

実は検索エンジンは画像を解析する代わりに、画像の説明文などを読み取って「これは〇〇の画像だ」と判断しているのです。そうすれば画像という非常に解析コストの高いコンテンツを見なくてもある程度の精度を得られるというわけです。つまり検索エンジンにとっては画像そのものではなくて、あくまでもテキストが重要なのです。

まあ、画像に関しては最近は人工知能が発展してきているので、今後はそれを応用した解析を行うようになると思います。しかし現状では上記のような仕組みになっていて良し悪しの判断には限界があるのです。

検索で上位に表示されるようにする手法「SEO」

そしてWeb界隈では、そうした検索エンジンの特性を利用してページを上位に表示させるためのテクニックが当たり前のように使われています。それが「SEO」(検索エンジン最適化)という手法です。

タチの悪いことにゴミ記事を量産しているクソブログに限ってこのSEOだけはしっかりしている場合が多いので、

SEOに強いゴミ記事>>SEOをしていない優良記事

という風になりゴミ記事が上位に表示されてしまうのです。

今のところ、検索で上位表示されるために重要なのは記事の中身ではない

まあもちろん、検索エンジンも優良記事が上位になりやすいようなアルゴリズムを採用しているようですが、先述の通り検索エンジンにも限界があるので「人間が良いと思う記事」ばかりを上位に表示させるわけではありません。検索エンジンにとって良い記事とは、あくまでも

  • サイトの構造が正しい
  • 検索されやすいキーワードが適度に含まれている
  • 文章量が適度に多い
  • 自然な被リンク数が多い
  • 検索結果でたくさんクリックされている

といった「間接的な」要件を満たしている記事です。

そういうわけで、今後人工知能などの技術が発展すれば「中身のある」記事がきちんと上位に表示されるようになるかもしれませんが、今のところ上位に表示されるために重要なのは記事の中身ではなく、その周辺部分だと言えます。

このような状況が改善されない限りはクソ記事が上位に居座ったままでしょう。Google先生には頑張っていただきたいものです。

おわりに

以上、検索エンジンの仕組みとゴミ記事が検索で上位に表示される理由について推測も交えて書いてきました。

…といっても理由がわかったところで私たちにはどうしようもないので、検索エンジン側がきちんと対策をしてくれない限りは自分でどうにかするしかありません。記事の冒頭でも紹介しましたが、ゴミ記事を検索結果から除外する具体的な方法を知りたい方は、以前の記事「邪魔なサイトを検索から除外する方法」をご覧いただければと思います。

今回は以上!