Шаг 11. Граббер.

Граббер потому и граббер, что позволяет грабить практически любые сайты работающие на DLE. Однако, он не дает возможности так хорошо настроить парсинг, как это позволяет сделать парсер LoadPartners. Поэтому, по возможности, старайтесь пользоваться именно парсером от LoadPartners. Сначала я не хотел даже писать о граббере, зачем, если есть такой хороший парсер? Но потом подумал: мало ли что может случится с LoadPartners, граббер будет работать всегда.

Для начала, скачайте граббер.

Распакуйте архив, достаньте из него папку grab и положите в корневую директорию сайта. Откройте в браузере http://285.test1.ru/grab/index.php (где 285 это имя папки, в которой у Вас лежит сайт). Никаких ошибок, не должно быть, все должно открыться без проблем. Теперь нам нужно найти как можно больше сайтов, работающих на DLE. Ну, это не трудно. Кстати, это не обязательно должен быть варезник. Можете выбрать любой сайт, который работает на DLE.

Перейдите в раздел «Настройки» и в обязательном порядке поставьте галочки перед:

  • Проверять новость на существование
  • Делать задержку перед скачиванием полного поста
  • Делать хайд

В поле «Автор новостей:» укажите имя автора, свое, или придумайте какое-то.

Здесь Вы тоже можете выбрать, загружать картинки, или нет. Но в данном случае, их лучше все таки загружать.

Что касается синонимизации, то я бы посоветовал не пользоваться ею вообще. Это не скрасит Ваш сайт ни перед редким посетителем, ни перед поисковыми системами. Но если хотите, тогда сначала откройте в браузере http://285.test1.ru/grab/install.php (где 285 сами знаете что) и подождите, пока увидите сообщение о том, что «База установлена». Это нужно для того, чтобы в базу данных Вашего сайта, загрузилась база синонимов.

Перейдите во вкладку «Граббинг», введите адрес сайта работающего на DLE (любой версии) и укажите, с какой, по какую страницу грабить. Учитываются только те страницы, которые выводятся в навигации, в самом низу сайта. Категорию, в которую нужно загружать новости, пока можете не указывать. Но если Вы собираетесь грабить конкретный раздел сайта (для этого, введите полный путь к разделу в поле «Сайт:»), то можете указать заранее созданную категорию для новостей из этого раздела. Категории создаются в админпанели.

Жмите начать, и спустя некоторое время, все материалы из указанных страниц будут сграблены. Можете продолжить грабить и наполнять сайт. Но, не стоит все материалы брать только с одного сайта, и подряд.

Разбить материалы по категориям, когда Вы напарсите их достаточное количество, можно в админке, в разделе редактирования новостей. Откройте «Расширенный поиск новостей» и в поле «Поиск по новостям:» введите ключевое слово. Для этого, Вы должны хотя бы примерно знать, какие материалы загружались. Если парсился сайт с фильмами, то названия категорий обычно жанры фильмов, и так далее. Создайте категории, и переместите в них найденные при помощи расширенного поиска материалы.

Так, на этом с граббером закончим.