dle.in.ua » Платное » Граббер контента с любых сайтов [Платный]

Граббер контента с любых сайтов [Платный]

Автор: randomstar от 27-12-2009, 01:51
Граббер контента с любых сайтов [Платный]

Предлагаем Вашему вниманию программу для копирования контента с любых других сайтов, построеных на движках или на простых html страницах(граббер). Программа написанана на PHP и использует в своей основе регулярные выражения. Программа полностью заточена под DLE 8.2 (8.3) и не требует никаких дополнительных настроек кроме копирования дистрибутива программы на сервер. Ощутите мощь регулярных выражений - 2 минуты и 1000 новостей уже лежат в Вашей базе. Многочисленные настройки программы позволяют настолько гибко менять выдранный контент, что получившаяся новость может измениться до неузнаваемости в сравнении с оригиналом...
Программа имеет приятный интерфейс и расчитана для людей, разбирающихся в html и имеющим представление о регулярных выражениях. Все что надо для работы программы - это залить файлы программы в корень сайта (на сервер), куда будет копироваться контент.

Программа состоит из нескольких модулей, каждый из которых выполняет свою функцию.

Изначально программа разрабатывалась под движок DLE 8.2 и следовательно нет необходимости подключать ее к базе данных, если Вы используете этот двиг или DLE 8.3 .После копирования файлов программы на сервер у Вас уже будет доступ к считыванию и записи информации в базу (никаких настроек менять или дописывать не надо!). Программа полностью автономная, запись настроек проектов для копирования контента осуществляется в 2 текстовых файла. Первый из них несет информацию о сайте-жертве (сайт, с которого будет копироваться контент): адрес сайта, начальная и конечная страницы копирования, категория для копирования, и др. Второй файл содержит дополнительные настройки для текущего проекта (например: какую информацию надо удалить из скопированого текста). Все настройки проекта записываются именно сюда и при желании можно легко загрузить любой из сохраненных проектов.

Основным направлением программы можно назвать извлечение информации с сайтов, в основе которых используется движок (Joomla, WordPress, DLE и др.). Там, где есть деление на категории и постраничный вывод информации, а также можно работать и с простыми сайтами созданными на основе HTML страниц. Программе надо указать адрес категории, которую Вы желаете скопировать и номера страниц (от и до).

Программа работает с PHP классом-Snoopy, который позволяет выдавать действия программы за работу человека в браузере (куки, операционная система , браузер...). Существует возможность подключаться к сайту-жертве через прокси-сервера. С каждым новым соединением через прокси будет использоваться новый IP адрес из списка proxylist.txt ( в случайном порядке ), который Вы укажете. Ну и конечно, можно работать и без всех этих наворотов.

Имеется возможнось принудительной перекодировки контента из UTF-8 в windows-cp1251.

Разработан модуль синонимайзера (текст в вашей б.д. можно будет пропустить через этот модуль для получения оригинального контента).

Программа автоматически извлекает картинки из указанных тегов, однако зачастую картинки на сайтах имеют водяной знак, или отсутствуют вообще. Поэтому был разработан модуль-картинки поисковиков. Используя данный модуль можно будет по названию новости и по дополнительным ключевым словам найти соответствующую картинку у Google или Yandex, залить картинку к себе на сервер и поставить ссылку на нее.

Подробное описание программы и демо-версию вы найдете на сайте : www.spider.randomstar.org
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.