SEO〜検索エンジン(Google)の仕組み

2020年1月7日 (更新日:2020年1月24日)

SEO〜検索エンジン(Google)の仕組み:SEO〜検索エンジン(Google)の仕...


SEO〜検索エンジン(Google)の仕組み

Googleではウェブクローラというプログラムが定期的に世界中のウェブページを訪れ情報を収集していきます。
収集した情報は検索インデックスに登録して整理されていきます。

例えばGoogleで検索すると検索入力の下に約7,030,000件(0.61秒)などのヒット数とかかった時間が表記されます。
こんなに膨大な量をコンマ何秒で表示するためにはリアルタイムでは不可能でGoogleの中で構築されているデータベースにサイトの情報が入ってないと無理です。

ということはウェブサイトを作ってもこのGoogleのデータベースにサイトの情報が入ってないと検索しても出てこない事になります。

 

検索インデックス登録

クロールのデータベースへの収集プロセスは大きく分けて2通りあるようです。
その2つの方法からウェブサイトへアクセスし、サイト上のリンクから他のページに行って新しいサイトの情報、変更点、無効なリンクについて確認しているようです。
1つは過去のクロールから得られたアドレスを使って収集しに行きます。
もう1つはウェブサイトの制作者(所有者)からサイトマップを提供してもらい、そのサイトマップから構成されるリストから収集しに行きます。

 

Google Search Console

検索について大事なことが分かってきました。
検索してもらい自分のウェブサイトを見つけてもらうためにはまずGoogleのデータベースにインデックス登録されていなければならない。
そしてインデックス登録されるためにはジッと固唾を飲んでまっとくのでは無く自らウェブサイトの情報を積極的に提供することが出来る。

Googleではサイトのクロール方法をサイト所有者が細かく指定できるSearch Consoleが提供されています。
このSearch Consoleを使って積極的にサイトマップを提供してインデックス登録を仕掛けていきます。

 

インデックス登録されホッと一息

Search Consoleを使ってインデックス登録されホッとしたのも束の間、Google検索のインデックス登録には何千億ものウェブページが入っていてその容量は余裕で1億GBを超えています。
検索して最初のページにヒットするURLは10個ほど。極端な話、何千億ページの中からその10個の中に入らなければ若しくは2ページ目にヒットする個数を含めると20個ほどのURLに入らないと存在を認識してもらう事が困難になります。

 

それでは

いろいろ分かってきました。それではその何千億ものウェブページの中から検索結果が10位以内若しくはトップにヒットさせるためには…。