Создание денежного потока с помощью Интернет

среда, 13 июня 2007 г.

Автоматическое удаление непроиндексированных Яндексом страниц из Сапе

Привет! Уже ни для кого не секрет, что продавая ссылки с внутренних страниц своих сайтов через Sape можно неплохо заработать. Некоторые товарищи на форуме пишут, что уже покупают себе квартиры. Я же пока получаю $8,05 в день, но этот доход ежедневно растет.

Итак, теперь о моем способе удаления непроиндексированных страниц. Дело в том, что в Сапе принимают только проиндексированные Яндексом страницы, в отличие от того же Ксапа. Причем сайт может быть хорошо проиндексирован Яндексом, но робот Сапе все равно индексирует его по своему. Например, 1200 страниц одного из моих сайтов проиндексировано Яндексом. Но при добавлении сайта в Сапе их робот "насчитал" только 650 страниц. Модератор сайт отклонил, т.к. не все страницы, проиндексированные роботом Сапе, есть в индексе Яндекса. нам нужно эти страницы удалить. Описанная ниже технология сэкономила 4-5 часов моего времени, которые я бы потратил на ручное удаление непроиндексированных ссылок. Итак, что мы делаем:

1. Качаем эту программку для проверки индексации сайтов и страниц в Яндексе
2. Экспортируем из Сапе (ссылочка внизу странички) все страницы сайта, найденные саповским роботом в txt.
3. Копируем ссылки в программку и нажимаем кнопку "Проверить". (Только не переусердствуйте! Создатели тулзы честно предупреждают, что ее использование нарушает лицензию Яндекса, который разрешает автоматизированные запросы такого рода только через XML и ваш айпишник теоретически могут забанить. Хотя я проверил 2500 страничек с нескольких сайтов за час (делал перерывы по 15 минут между каждым сайтом) и все было ок. Все же советую установить в программе задержку между запросами, благо она позволяет это сделать)
4. Копируем полученный результат назад в Excel и сортируем данные по второму столбику.
5. Загружаем Internet Explorer (в Firefox не работает, в Опере не проверял). Копируем те ссылки возле которых стоит 0 или вообще ничего не стоит из Excel в Сапе. Копируем в поле, над которым написано "Введите УРЛы страниц (с новой строки, с http://):" и нажимаем ОК. При этом, все ссылочки, которых нет в индексе Яндекса оказываются отмеченными.
6. Выбираем "Удалить страницы до переиндексации" и ждем принятия сайта модератором!


В следующем посте я расскажу о том, как поддавшись на рассказы Московского бомжа сделал Joebucks -овый шоп и что из этого вышло ($761 c 13 марта по 13 июня)

16 комментариев:

Анонимный комментирует...

Когда я удалял непроиндексированные страницы, специальной формочки не было еще.
Я делал по другому:
парсил специальным скриптом страницу, где выводились все проиндексированные Сапой страницы моего сайта. Сохранял адрес страницы и id того чекбокса, куда галочку поставить.
Затем писал скрипт, который через проксик проверял страницы в Яндексе.
Потом генерировал скрипт, который включал галочки и внедрял этот скрипт в страницы Сапы.
Сабмитил эту страницу на Сапу.
В общей сложности с проверками в Яндексе убил на это часов 6.
А страниц всего на сайте - 2400, проиндексированы 1200.

Анонимный комментирует...

В сапу проходят и не проиндексированные Яндексом страницы, их там не так и мало.
Так самому приходилось давать Яндексу ссылки на эти паги

Анонимный комментирует...

Хм...
Яндекс говорит, что 1202 страницы знает.
Sape говорит о 477 страницах, и предлагает кнопочкой YAP проверить их.
Программа нашла только 31 ссылку... Что делать?
Я уже запутался...

Unknown комментирует...

утилитка неправильно определяет проиндексированность страниц :(

homelessminsk комментирует...

значит только эти 31 и получится сейчас активировать.

homelessminsk комментирует...

2 oleg, я заметил только очень небольшие отклонения

Анонимный комментирует...

Программа нашла 158 непроиндексированных страниц. При ручной проверке таких осталось лишь 69, остальные в индексе. Надо что-то делать!

homelessminsk комментирует...

ffaust, думаю вам стоит списаться с автором проги и он внесет изменения. его адрес указан на сайте.

Анонимный комментирует...

Могу предложить вот этот скрипт:
http://shelkovo.org/yap/

Автор сайта недавно его сделал, если что отписывайтесь ему по форме обратной связи.
Я проиндексил там около 7000 страниц с разных сайтов, вроде определял всё верно.

GERAsimov комментирует...

Сенкс за описание технологии!
А можно тоже самое сделать при приобретении ссылок ?

Multik комментирует...

Подскажи плиз где можно поподробнее почитать про SAPE.ru. Буду оч благодарен, земляку :)

Анонимный комментирует...

Большой респект создателю скрипта!!!
А то бы сидел пол дня и отбирал проиндексированные страницы!
Еще раз СПАСИБО!

Unknown комментирует...

>Могу предложить вот этот скрипт:
>http://shelkovo.org/yap/

>Автор сайта недавно его сделал


но не доделал, у меня 3 раза скрипт зависал...

Анонимный комментирует...

я тут свою системку пытаюсь сделать. только там индекс гугла.
http://google.chatukg.kz/
хотелось бы услышать отзывы и информацию по глюкам.

R1S комментирует...

Программа работает нормально, просто надо ставить большой интервал, чтоб Я не спрашивал про робота. я ставлю 20 000 долго, но надежно.

Анонимный комментирует...

Все просто - ставьте 1-2 потока и от 500 мс задержку и все ок.)))ВСе работает.