API по работе с сервисом

Постановка задачи в очередь на парсинг осуществляется POST-запросом:
URL: http://api.dcollect.ru/in.ashx?key=USER_KEY

POST-параметры:
  • url - адрес, на который необходимо сделать запрос
  • cookies - куки, которые необходимо указать при вызове страницы (формат: param1=value1; param2=value2;)
  • ref - referrer-страница
  • useragent - User-Agent (если не задан, то задается случайно)
  • enc - кодировка, по умолчанию - utf-8
  • postdata - данные для POST-запроса (формат: param1=value1¶m2=value2)
  • base64 - флаг для кодирования в base64 (значения 0 или 1), используется для загрузки изображений
  • block - список идентификаторов машин, которыми не обрабатывать запрос (формат: <id1>|<id2>|<id3>), используется при повторном вызове API при блокировке конкретной машины, идентификатор приходит в первой строке контента
Ответ сервиса:
  • OK|REQUEST_ID - задача успешно была поставлена в очередь, REQUEST_ID - идентификатор задачи
  • ERROR|EMPTY_CLIENT_KEY - не указан код клиента, при запросе
  • ERROR|CLIENT_NOT_FOUND - пользователь не найден
  • ERROR|CLIENT_BLOCKED - пользователь заблокирован
  • ERROR|CLIENT_ZERO_BALANCE - у пользователя нулевой баланс, запросы запрещены
Проверка результата задания по идентификатору осуществляется GET-запросом:
URL: http://api.dcollect.ru/check.ashx?key=USER_KEY&reqid=REQUEST_ID

Ответ сервиса:
  • OK|CONTENT_PAGE - CONTENT_PAGE - содержимое страницы (первая строка - идентификатор машины, вторая строка - IP адрес, третья строка - cookies, все остальное весь текст страницы)
  • ERROR|EMPTY_CLIENT_KEY - не указан код клиента, при запросе
  • ERROR|CLIENT_NOT_FOUND - пользователь не найден
  • ERROR|CLIENT_BLOCKED - пользователь заблокирован
  • ERROR|NOT_READY_YET - страница ещё не обработана, повторите запрос через 1 сек.

Как начать (написанные классы для работы с сервисом)

Для C#-разработчиков: dcollect.zip
Для PHP-разработчика: ожидается
Для Python-разработчика: ожидается
Для Perl-разработчика: ожидается

Для подключения звоните: 8-800-200-0748