多くのページで「検出 – インデックス未登録」と表示される場合の問題点
大きく分類すると以下の二点の何れかが原因となっている場合が多いようです。
サイト内部のリンクの問題
コンテンツの問題
サイト内部のリンクの問題
サイト内のリンクの形式が統一されていない場合には、多くの重複URLが生成されてしまう事になります。
または無限にURLが生成されるようなリンクの張り方を誤って行っている場合が考えられます。
コンテンツの問題
検索結果に表示する必要の無いコンテンツとしてGoogleに判断されている場合もあるようです。
例えばデータベースから自動的にコンテンツを生成しているケースを想定してみましょう。
既にGoogleでインデックス済みのページ(自身のぺージや競合のページも含めて)と比べて自身のコンテンツと似たようなコンテンツが多く存在している場合は、Googleは「全てを検索結果に表示させる必要は無い」と判断してしまうでしょう。
確認すべきポイントと修正方法
まずは技術的な点を確認するようお勧めしています。
STEP1:URLパターンに誤りが無いか
URLのパラメータ、大文字小文字などの違いなどを含め、重複するパターンのURLが無いか確認して統一(正規化)しましょう。Googleは重複するパターンのURLを見つけた場合、それが大量にあった場合には、全てのパターンのURLをクロールする事はなく、途中でやめてしまいます。
この場合の対処方法としては、canonical属性の記述、301リダイレクト等でURLを正規化する必要があります。
URLの正規化については「canonical属性の使い方」をご覧ください。
STEP2:内部リンクの張り方に誤りが無いか
全てのページに対して正しくクロールが完了するかテストする必要があります。方法としては、「screaming frog」などが紹介されていますが、SE Rankingの「サイトSEO検査」機能でもテストできます。
サイトSEO検査
「クロール済みページ」サブセクションのURLを見ていく事で、統一したURLパターン(http/httpsやwwwあり無し、ディレクトリ階層のスラッシュなど)の内部リンクとなっているかを確認できます。
SE Ranking サイトSEO検査 クロール済みページ
STEP3:ページの品質に問題が無いか
もし1、2、の部分で問題が無ければ、コンテンツの品質に問題がある可能性が高いようです。
類似のコンテンツがサイト内外にあるようであれば、それと比較してオリジナルの情報を追加したり、検索ユーザーが求める情報をリサーチして、必要なトピックを追加して、コンテンツの差別化を図り、品質を改善させる必要があります。
またはインデックスされていないコンテンツのうち内容の薄いコンテンツは、別のコンテンツと統合するなどしてページの数を調整するという方法も有効かもしれません。
その他にSearch Consoleのカバレッジの項目で気になる項目としては、404エラーに関連する項目が挙げられます。「エラー」や「除外」どちらにしても念の為に内容を確認する事をおすすめします。
404エラーの対応方法については以下のページが参考になるかもしれません。