Обзор парсера Content Downloader 7
Сегодня хочу рассказать о Content Downloader парсере, который является лидером среди всех парсеров, сам им пользуюсь, поэтому хочу поделиться своим опытом. Познакомился с ним довольно давно, сначала не мог понять, зачем он вообще мне нужен, чем может быть полезен… Прочитал
В общем, я был приятно удивлен, на что способна программа первым делом спарсил 1 сайт на вордпресс там было порядка 500 статей может чуть больше, не помню сейчас, да и не суть. После спарсил все теги картинки, которые были, но картинки, увы, были не во всех статьях. Тут я прибегнул к парсингу картинок с гугла по ключевым тематическим запросам. Спарсил более 1000 картинок за очень короткий промежуток времени это очень обрадовало меня, да и еще каждой картинке было присвоено свое имя согласно запросу, которому она была найдена. Далее начал работать со спаршеным сайтом, почистил от мусора, лишних тегов, сейчас то я понимаю, что этого всего можно было сразу избежать, указав более точно границы парсинга, но на тот момент мне это было не известно спарсил, так как смог. После чистки от мусора заполнил метки к статьям, указал заголовки, в каждую статью поставил тематическую картинку те, что были, оставил тоже. И самое важное на сайте доноре не была сделана оптимизация картинок, небыли прописаны alt и title как мне сделать это? Все очень просто в парсере есть уникальная возможность в одно нажатие проставить сразу во всех статьях, к каждой картинке свой уникальный тайтл взяв его с заголовка статьи, а это будет самый тематический ключ, по которому данная статья и будет продвигаться в топ. Заголовок и тег H1 + упоминание ключевых слов в тексте это залог успеха. На том сайте, где я парсил этому внимание не было уделено и там все заголовки были повторами главной страница сайта, а это в глазах поисковика дубли тайтлов (не хорошо это). Вот и получается, что в итоге у меня получился более оптимизированный сайт, чем тот, с которого делал парсинг.
Это был мой первый опыт знакомства с парсингом вообще. И после этого, мне стало немного смешно или даже обидно) как я, раньше не зная этого делал все в ручную. Помнится нужно было сайт с одного движка перенести на другой, готового решения не было и пришлось делать все в ручную там было всего ничего статей 200 примерно, но как это было долго, наверно неделю помучался я с ним. Хотя зная бы тогда про то, что мои возможности с парсером Content Downloader многократно возрастут и спарсить свой же сайт и перенести на новую CMS не составит труда и по времени займет несколько минут, а не дней. Купил бы, лицензию не задумываясь, но всему видимо свое время. Хватит обо мне, поговорим теперь про сам парсер и его функционал.
Content Downloader 7 – универсальный парсер контента
Думаю, стоит начать с того, что разработчик программы Зайковский Сергей Владимирович следит за тем, чтобы весь заявленный функционал программы был в актуальном состоянии, постоянно выходят обновления (практически ежедневно, что-то усовершенствуется, добавляются новые функции, пожелания, рекомендации от пользователей). Именно за такой подход к делу и хочется поблагодарить от имени всех пользователей парсера.
Погорим о том, что же такого умеет делать Content Downloader, чем он вам может быть полезен и какие функции у него есть?!
– Парсинг сайтов, блогов, интернет-магазинов (с выводом данных в нужном формате в CSV файлы, либо *. txt)
– Парсинг любой части кода с любой введенной в программу (или собранной программой) ссылки
– Парсинг контента с закрытых источников даже где требуется авторизация
– Парсинг любых ссылок с сайта, которые отвечают заданным фильтрам (до 1 миллиона)
– Парсинг Google картинок по списку ключевиков в разные папки
Принцип работы Content Downloader
Работа парсера довольна, проста и понятна, программе мы задаем границы страниц, откуда нужно парсить информацию загружаем список урлов тех самых страниц, которые хотим спарсить, далее настраиваем шаблон вывода и формат сохранения. Хочу заметить, что программа «на лету» может производить чистку от мусора, обработку, замену, уникализировать текст тем самым в итоговом процессе вы получите готовый материал в нужном для вас формате для импорта в подходящую CMS будь то интернет магазин или блог. Все это достигается за счет встроенных макросов которые достаточно популярно описаны в разделе справки http://sbfactory.ru/cd/ рекомендую внимательно изучить данный материал. После ознакомления с этим разделом у вас отпадут многие вопросы и вам станет ясен принцип работы с программой, для чего и как она может быть вам полезна. Узнаете более подробно про функции и методы парсинга популярных магазинов, онлайн сервисов, работы с соц сетями и многом другом. Научитесь создавать свои сайты, переносить сайт с самописных движков или сайтов с чистого хтмл или даже таких как ucoz на популярные CMS как WordPres либо DLE а настройка шаблона вывода сможет вам помочь настроить нужный вам формат под любую систему управления сайтов. Я считаю что это большой плюс в функционале программы.
Дополнительные возможности парсера Content Downloader
– Авторизация через передачу cookies из IE или через POST-Запрос
– Возможность задать любые cookies
– Многопоточность до 50 потоков
– Возможность задавать любой user agent (даже менять их при парсинге)
– Возможность использовать список прокси
– Возможность задавать паузу между запросами
– Возможность обработки данных прямо в процессе парсинга (об этом писал выше)
Пример парсинга Content Downloaderом интернет-магазина в CSV файл
Системные требования к установке Content Downloader
– Запуск от имени администратора (на Vista и Seven);
– Windows XP, Windows 7, Windows 8, Windows Vista;
– Наличие в системе диска с меткой C;
– Internet Explorer Версии 9.0 и выше (желательно последний);
– Минимальное разрешение экрана 1280*800;
– Стабильный интернет без прокси в 128 и более кбит/с.
Рекомендуется использовать программу на OS Windows7 64-bit
Что еще такого полезного умеет Content Downloader
1) Парсить e-mail адреса
2) Парсить несколько картинок с одной страницы с присвоением каждой уникального имени файла
3) Парсинг и импорт в Webasyst
4) Парсить видео с Youtube (+ заголовок, описание, рубрика)
5) Парсер товаров с интернет магазинов
6) Парсить Wordstat
7) Автоматически обновлять цены на сайте (или любые другие данные) путем MySQL-запросов
8) Создание файла импорта для WordPress (импорт контента в WP)
9) Загрузка изображений на сервер сразу при парсинге
10) Импорт комментариев в WordPress
11) Использовать прокси (с аутентификацией и без)
12) Парсинг рубрик и подрубрик в отдельные ячейки CSV
13) Парсинг обсуждений Вконтакте
14) Парсить сниппеты Google
15) Парсить номера телефонов
16) Парсить выдачу Google
17) Парсить Яндекс Маркет
18) Очистить загружаемый контент от лишних тегов
19) Парсить 2 гис и многое другое…
По своему опыту хочу сказать что нет такого интернет ресурса которые невозможно было бы спарсить Content Downloaderом
Система помощи Content Downloader
Как парсить контент (для новичков) можно ознакомиться тут sbfactory.ru/cd/?p=190
Так же рекомендую ознакомиться с программой от разработчика Content Downloader под названием BackLink Checker
Стоимость программы в зависимости от потоков
– Content Downloader start: до 5 потоков при парсинге контента и сканировании сайта (1000 рублей) скидка 5% итого 950 р
– Content Downloader standard: до 10 потоков при парсинге контента и сканировании сайта (1500 рублей) скидка 10% итого 1350 р
– Content Downloader ULTIMATE: до 50 потоков при парсинге контента и сканировании сайта (2000 рублей) скидка 15% итого 1700 р
Мой совет по поводу покупки Content Downloader вам раз вы получили такую уникальную возможность купить программу напрямую у разработчика, да еще и со скидкой сделать выгодную покупку стандарт версии в 10 потоков, так как брать меньше по своему опыту скажу, нет смысла.
Специальное предложение для тех, кто умеет читать до конца статью! Скидка на покупку программы для этого можете использовать вечный промо-код STEPAN
Здравствуйте. Скидка через «промо-код STEPAN» действительно 15% на максимальную версию?
С уважением Александр.
Приветствую, конечно действителен я же написал ВЕЧНЫЙ это значит что пока существует программа этот промокод работаетhttp://www.seocafe.info/showthread.php?t=35481
в списке дилеров ищи
СТЕПАН Skype SUDBA108 ICQ 557331441
у меня всегда самые лучшие скидки, тема на форуме
Сейчас скидки больше до 25%
Здравствуйте, Степан! Что такое поток и на что он влияет?(думаю, вопрос простой, но тем не менее). Может ли она сразу парсить несколько данных- название, сайт, почтовый ящик, телефон, адрес, комментарии. Или это надо делать поочерёдно? Когда было последнее обновление? Как долго программа планируется поддерживаться производителем и обновлятся? Какая сейчас стоимость программы? С уважением, Олег.
Поток это одновременно открытых урл адресов то есть страниц сайта
Если все адреса на одной странице то можно их парсить сразу. Если на разных то по очереди.
Программа регулярно обновляется в неделю по несколько разhttp://content-downloader.ru цены сейчас со скидкой по промокоду можно купить инструкция на сайте.
Разработчик мой хороший знакомый уже много лет занимается можно посмотреть лог в программе изменений. И в дальнейшем пока живёт будет заниматься. Это его хлеб.
http://rustepan.ru/wp-content/uploads/2016/05/log.html