Spam-IT B - неопубликованное руководство пользователя
Всем известно, что хелп, который идет в поставке со Spam-IT B, далек от совершенства и не только новичку, но и матерому сеошнику освоить этот продукт не так уж просто. Однако, достаточно поэксперементировав и поработав с этой программой вы, наверняка, прийдете к выводу, что встроенного хелпа более чем достаточно для полноценной работы. Но, как и в любом деле, тут есть свои тонкости, о которых и пойдет речь дальше.
Это поле присутствует на формах Follow (тут ограничивает поиск страниц с формами) и Post (тут ограничивает поиск страниц, на которых было опубликовано сообщение).
В поле Scope можно задавать следюущие значения:
- Any (ничем не ограгичено)
- Host (ограничено доменом)
- Base Path (ограничено директорией)
- Path (ограничено скриптом)
Если адрес имеет вид http://site.com/gbook/guestbook.cgi?act=show, то при различных значения поля Scope поиск будет ограничиваться следующим образом:
- Host - поиск ограничивается текущим доменом, т.е. пляшет от http://site.com/
- Base Path - поиск ограничивается текущей директорией (последним слешем), т.е. пляшет от http://site.com/gbook/
- Path - поиск ограничивается текущим скриптом, который может иметь другие парамметры, т.е. пляшет от http://site.com/gbook/guestbook.cgi
В этот файл заносятся правила сопоставления названия полей форм, в которые постится сообщение, и полей файла объявлений.
Правила добавление записей в файл APContexts.csv:
- В столбце "Regex" можно употреблять только буквы, цифры, пробел
- При сопоставлении имен полей программа не учитывает регистр (маленькая или заглавная буква)
- Если нужно совпадение с именем поля целиком, то необходимо обрамлять его в "\b", например: "\bPW\b" для поля с именем PW. Зачастую полное совпадение с именем поля необходимо использовать для коротких имен полей
- Что касается полей !post, то при обработке формы программа сначала смотрит на парамметр Name каждой кнопки, а затем еще и на парамметр Value, что позволяет программе правильно определять нужную кнопку для отправки сообщения. Иными словами, при написании правил для полей !post вы обязательно должны это учитывать!
Важно: чтобы изменения, внесенные в файл APContexts.csv, вступили в силу - необходимо перезапустить Spam-IT B.
В этот файл заносятся адреса прокси листов и конструкции для правильного распарсивания программой проксей из этих самых списков. В стандартном файле ProxySources.csv можно встретить две конструкции для добавления прокси листов в файл:
1) "http://site1.com/proxy.php","(?<address>\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*:\s*(?<port>\d{1,5})"
Применяется если в коде страницы прокси записаны в виде IP:port, например, 65.65.65.65:80
2) "http://site2.com/proxy.php","!HTMLDecode:(?<address>\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*:\s*(?<port>\d{1,5})"
Применяется если прокси также представлены в виде IP:port, но присутствуют HTML encoded последовательности, например, 65.65.65.65&#58;80
В случаях когда прокси записаны в таблицах, например, IP в одном столбце, а порт в другом, необходимо писать разные регулярные выражения под каждый ресурс отдельно.
Существуют также реурсы, где списки прокси отображаются с использованием Java Script, такие ресурсы Spam-IT B не распарсит.
Важно: чтобы изменения, внесенные в файл ProxySources.csv, вступили в силу - необходимо перезапустить Spam-IT B.
- Парсите поисковики на ТОП 100 (тут по желанию можно и на ТОП 10, 20, 50, 100, 200, 500, 1000) по интерисующим вас запросам.
- Парсите беки на сайты/страницы, найденные в п.1.
- В адреса, полученные в п.2, запускаете Post с установленной галочкой Check. Адреса, в которые прошел пост, добавляете в базу.
- Исключаете из оставшихся адресов: а) адреса, которые выдали ошибку; б) адреса, в которые прошел пост, т.к. их вы уже занесли в базу; в) адреса, на которых обнаружена форма, но пост не прошел.
- Для оставшихся после п.4 адресов запускаете Follow. Тут кроме поля Scope необходимо также заполнить поле Regular exspressions, например, следующим образом:add, append, eintrag, form, insert, new, post, reply, sign, submit, write
- В адреса, полученные в п.5, запускаете Post с установленной галочкой Check. Адреса, в которые прошел пост, добавляете в базу.
__________________________
- 997 reads

Post new comment