Поисковые машины и спецпоисковики

Главная > Информатика > Интернет > Поисковики


Побеждает тот, кто владеет информацией.

Интернет еще не есть просвещение, ибо он подобен автомобилю, на котором можно добраться как до библиотеки, так и до кабака.

В настоящее время существует 3 основных международных поисковых системы – Google, Yahoo и MSN, имеющих собственные базы данных и поисковые технологии. Большинство остальных поисковых систем использует в том или ином виде технологии трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, AllTheWeb и Lycos – базу Yahoo. Портал Mail.ru долгое время использовал поисковую технологию Google, а с 2006 года - Yandex. В России основной поисковой системой является Yandex, за ним идут Mail.ru, использующий технологию Yandex, замыкает тройку лидеров - Rambler [он давно не лидер - стал новостным приёмником, как Апорт - барахолкой]. Однако наибольшее количество поисковых запросов обрабатывает Google, российская версия которого (Google.ru) начала свою работу в 2004 году. [2012-02-05]

Ссылочный граф

Разделы страницы о сканировании ресурсов всемирной сети:

  • Сборники статей о поисковых механизмах
  • Списки поисковых систем
  • Специализированные "пауки" и веб-роботы
  • Русскоязычные универсальные поисковые машины
  • Международные поисковые системы
  • Имена поисковых роботов (ботов) для управления их доступом
  • Поисковики-монополисты: благо и зло

Также могут быть полезны следующие разделы сайта:


Сборники статей о поисковых механизмах

Списки поисковых систем

Обзоры поисковых машин (их также называют поисковиками, ботами, роботами, спайдерами, пауками и сканерами сайтов).

Специализированные "пауки" и веб-роботы

Кроме перечисленных в разделах ниже русскоязычных и международных поисковых машин, вы можете воспользоваться поисково-каталоговыми системами на следующих страницах сайта:

На самом деле, любая поисковая система предполагает наличие собственного каталога, даже если он не доступен обычному пользователю. А любой каталог ресурсов (в том числе, новостей или справочных сведений), как правило, имеет свою поисковую подсистему.

Поиск видео-роликов (MP3 и других)

Поиск файлов (в том числе мультимедиа)

Поиск программ и информации по ним

Научно-образовательные поисковые машины

Справочные и энциклопедические поисковики

Тур-поиск (билеты, номера)

Поисковики с особыми сервисами

Поиск вымерших сайтов

Раньше такая возможность была в самом Гугле - теперь надо пользоваться поиском в особых архивных хранилищах. Полезнейший сайт https://archive.org/web/ (web.archive.org) заблокирован Ростехнадзором на территории РФ, т.к. там на одной странице оказалась экстремистская информация. Но и сейчас можно попытаться посмотреть отдельную страницу, введя, например, такой URL:
http://web.archive.org/web/2014/https://www.lexicons.ru/modern/m/index.html (копию lexicons.ru/modern/m/index.html за 2014 год.). Вот как раз эту страницу у меня получилось восстановить! :) Заметьте - это веб-архив, т.е., хронологический веб-каталог, что еще раз показывает дуализм поиска и каталогизации информации.

Русскоязычные универсальные поисковые машины

Хороший обзор и сравнение основных поисковиков и каталогов Рунета - в статье Кто самый крутой? О русских поисковых системах. Также интересен краткий обзор Самые популярные поисковики России.

Российские поисковые системы

Из раздела изъят когда-то популярный поисковик и каталог Апорт - он превратился в банальный склад ресурсов о товарах. См. его описание в разделе интернет-каталогов.

Русифицированные зарубежные поисковики

Международные поисковые системы

Самые известные международные поисковики

Менее популярные зарубежные search-машины

Имена поисковых роботов (ботов) для управления их доступом

Обычно сайт стараются оптимизировать и раскрутить, чтобы получить конверсию. С этой точки зрения пусть побольше веб-пауков сканируют ваши сайты. Но с другой стороны излишний трафик замедлит загрузку страниц и снизит поведенческие факторы, а вам придется платить своему хостеру за превышение процессорной нагрузки.

Может быть, тогда лучше дать доступ к сайту только самым популярным поисковикам, особенно если вы пользуетесь их статистикой и панелями для веб-мастеров? Тогда на сегодняшний момент это будут Гугл, Яша, Мэйлру и Бинг. В прошлом занменитые зарубежные Альтависта, Вебальта и даже Яху (который и сейчас жизнерадостен, но уже стал отказываться от удобных сервисов) вам не критичны. Наш Апорт с уникальным алгоритмом поиска превратился в барахолку, а Рэмблер - в новостийную простыню для планшетов (впрочем, он уверенно заявляет, что будет реанимировать и реформировать свой рейтинг).

Список имен главных веб-сканеров основных поисковых систем прошлых и настоящих лет:

У крупных поисковых систем иногда, кроме основных ботов, имеются также отдельные экземпляры для индексации блогов, новостей, изображений и т.д.

Поэтому, наверное, стоит закрыть доступ к большинству из них с помощью директив в файлах robots.txt и/ил .htaccess, открыв только для 3-4 самых популярных в России и зарубежом. Во всяком случае, к многочисленным элементам дизайна (картинкам, стилям, скриптам, шаблонам) точно нужно закрыть всем, кто еще не умеет их обрабатывать (а умеют пока Гугль и Яндекс).

Поисковики-монополисты: благо и зло

Начало века радовало россыпью уникальных поисковиков с рейтингами-каталогами. Поисковиков выжило совсем немного: гугл, яху (доживает), яндекс, мэйлру (не конкурент, но еще жив) байду. Может, еще какие-то национальные. Каталогов, наверное, уже почти не осталось. Каталог Яху давно зарылся. Яндекс-каталог тоже. Дмоз не так давно. Пока жив рейтинг Мэйлру. Выжившие поисковики потому и выжили, что стали лучше и всестороннее других выполнять запросы пользователей. Но не начнут ли они терять это качество в отсутствие конкуренции? Вот, например, раньше Яндекс глупил, когда "исправлял" редкий поисковый запрос - теперь и Гугл этим занялся.

И ещё появилась неприятная тенденция: поисковики-монополисты начинают качать права и поступать некорректно по отношению к веб-дизайнерам, да и к пользователям. Почему, например, Яндекс помечает сайты с "устаревшим" протоколом HTTP красным треугольником с предупреждающей надписью "незащищённый сайт". Защита нужна веб-магазинам. А если сайт - сборник статей, блог, кустарный персональный сайт - зачем ему это пятое колесо? HTTP - совсем не устаревший протокол для них, другого им и не надо. А пользователи посмотрят на значок опасности - и не зайдут на сайт. Это уже трестовый сговор.

Суперпоисковики несправедливы к вебмастерам. Сами зарабатывают деньги, а другим не дают, сайты с партнерками принижают в рейтинге. А, если их в партнеры брать - платят не много. Гугл однажды неплохо платил за свой Adwords, потом резко снизил цены. Яндекс вообще всегда платит копейки.


Главная
Интернет : Веб-дизайн | Тестирование | Оптимизация | Раскрутка | Коммерция | Поиск | Каталоги | Утилиты | Об Интернете | Книги о вэбе | Веб-услуги | Студии | Хостинги

Энциклопедии | Сетевые каталоги регионов | Интернет-магазины | Реклама в Интернет | Студенческая страница | Искусство
На правах рекламы (см. условия): [an error occurred while processing this directive]    


© «Сайт Игоря Гаршина», 2002, 2005. Автор и владелец - Игорь Константинович Гаршин (см. резюме). Пишите письма (Письмо И.Гаршину).
Страница обновлена 22.03.2024
Яндекс.Метрика