Google Search Consoleを使ってみる。【その4.クロール と インデックス について】

f:id:mikanusagi:20180504150209p:plain こんばんは。Google Search Consoleに登録してみたmikanusagiです。

登録したはいいけど、使い方がさっぱり。(*´Д`)

ページを開いたら出てくる最初の画面。

  f:id:mikanusagi:20180508210425p:plain

なんかガチ素人の自分、知らない言葉で、初っ端からやる気をなくしそうです (笑)。

 

 

クロールとは

ぱっと目に付くのがクロール…。自分、水泳のクロールしか知りませんけど…(´_ゝ`)

 

クロール【crawl】

検索エンジンなどのプログラムであるロボット (クローラ、スパイダー、ロボットを略してbotなどと呼ばれる) が、サイトのページをダウンロードして解析を繰り返して情報を収取し、リンクなどをたどりながら、さまざまなサイトを巡回、情報収集していく。

このことをクロール、クローリングという。

 

       f:id:mikanusagi:20180511033134p:plain

 

クローラが収集したデータは、検索エンジンのデータベースに登録される。

検索エンジンは、その情報をもとに、どのサイトをどの順番で表示するか決定する。

 

逆に、クロールしてもらわないと、検索サイトに載らない。

 

なお、、サイト内の情報は膨大なため、

一度にすべての情報を正確に収集してもらうのは難しいらしい。

     f:id:mikanusagi:20180511035535p:plain

何度も巡回して、新しい情報や細かい情報をとっていくらしい。。

 

そのために、クローラが、来やすいように、かつ、

正確な情報を収集しやすいように、準備しておくことが大事。

 

 

クロールされやすくするためには?

 

① クローラの通り道を作る。

→内部リンクを貼る。外部リンクを貼ってもらう。

 

 

 

 クローラに存在を主張する。

→サイトマップを作ったり、記事を上げたら情報を流したりする。 

 

f:id:mikanusagi:20180511122157p:plain

▲ そもそもクローラになかなか気づかれないという…

 

自分で何もしなくても、情報が拡散されていくことはあるけれど…

うちみたいなサイトは、情報流さないと離れ小島のまま。。

何らかのきっかけでクローラが来てくれるかもしれないけど、それがいつのことになるか分かりません。

クローラに早く来てもらうために、Google Searchにサイトマップを登録したり、RSS/Atom feed などを登録することは、効果的だそうです。

 

Google Search Consoleを使うと、正しくクローリングされているかなども

確認できるとか。この話は後程…。

 

 

インデックスって何のこと? 

インデックス【index】

クローラがかき集めてきた情報は、 インデクサーというプログラムによって、整理されて、取り出しやすいデータに変換して保存される。これをインデックスという。

 

インデクサーは、タグなどで、サイトの構成や内容を判断している。

 

f:id:mikanusagi:20180511130440p:plain

▲タグに<h~>(見出しのタグ)がないと、見出しと認識されない。

 

この情報をもとに、情報リストが作られて (クエリ実行)、

検索エンジンでの表示順位が決まるので、、

ただの見た目ではなく、タグなどを正しくつけることは大事なのですね。

 

 

検索サイトに表示してもらうには、

① クローラに情報を提供。

② インデクサーに正しく認識してもらう。

これが必要だということかな。。

 

…もうお腹いっぱい (*´Д`)

では、今回はこのへんで。(*'▽')/