Заработок в интернете

Заработок в интернете

SEO Блог
Sat, 24.06.2006 23:26
$$$
Главное меню
Новые файлы
Последнее на форуме
Партнеры

  Заработок в интернете - Query Parser (Zuzlan)
- Четверг 20 Март 2008 - 08:19 -

Query Parser (Zuzlan)

Для тех кто не в курсе, я пишу софт на заказ. Некоторые из программ я буду выкладывать тут.

Первое что хотел бы предложить вашему внимание — это Query Parser, программа для вытягивания ссылок с возможностью задать множество параметров.

Интерфейс программы

Интерфейс Query Parser

На скриншоте приведен пример работы с Google.com, но гибкость настроек программы позвляет парсить любой другой ресурс.

В поле URL задается список адресов сайтов для парсинга с параметрами [QUERY], [KOL], [N], значения которых задаются немного ниже.

Take URL’s/Take after and before — определяет способ получения ссылок со страницы: в первом случае программа будет вытягивать все активные ссылки, а во-втором то что содержится в рамках соответвующих полей.

Unique Domains Query Parser будет собирать только ссылки с уникальных доменов.

URL Encode — позволяет превратить коды символов (типа %20, %3D…) в сами символы. К примеру:

off: ……online%20now%20%3Ciframe%20src=//195.225.178.21/t%3E

on: ……online now <iframe src=//195.225.178.21/t>

скачать Query Parser

Рубрики: ПО | 15 комментариев »   Автор: Zuzlan Дата: Четверг 20 Март 2008 - 08:19

15 комментариев на “Query Parser (Zuzlan)”

  1. Забыл в архив вложить важный файлик со списком STOP-слов, а перезаливать нет желания, поэтому просто в дириктории с программой создайте папку data и в ней файл Ignore.txt, в котором с каждой новой строки по стоп слову (фразе)

  2.  
  3. Сергей ()

    Прошу прощение за невежество, но уже несколько раз встречат выражение — прарсить ссылки.
    а Зачем это нужно. сорри если что не так спросил…

  4.  
  5. парсить = вытащить (если грубо перевести)

    Ну.. К примеру нужно нам собрать большую базу форумов (для хрумера, например)

  6.  
  7. Вот еще хорошее дополнение для парсера. http://www.zu1.ru/forum/showthread.php?p=1088 — прога для отсева битых ссылок с XSS, правда уже не бесплатная 😀
    Но наверно действительно такие инструменты да еще и все бесплатно в паблик выкладывать не стоит, а то школьники задавят))

  8.  
  9. […] Query Parser — парсер с системой гибких настроек. Все загрузки […]

  10.  
  11. А вот т пишеш СОФТ, где ты этому научился? В универе?

  12.  
  13. Учился дома по книжкам еще когда в школу ходил. В универе политика была такова, что там ты уже должен знать.

  14.  
  15. Спасибо. Софтина помогла

  16.  
  17. поГрУзЧИК ()

    Автор, а вы случайно не из Москвы?

  18.  
  19. Ммм.. нет 🙂 А что?

  20.  
  21. Все понятно — с настройками разобрался. Но что означают настройки [QUERY], [KOL], [N] не знаю — подскажеш, что они означают, или где почитать?

  22.  
  23. Глянь на скрин. Это макроязык, соответствующие значения подставляются вместо [KOL], [N] и т.д.
    Так вместо [QUERY] — подставляются запросы по очереди.
    Вместо [KOL] — числовое значение указанное в настройках
    Вместо [N] — диапозон чисел от начального до конечного.

    Из примера на скрине видно как распарсится 10 страниц ([N] = 1..10) гугла, на каждой странице будет выведено 100 результатов ([KOL]) и все это произойдет для одного запроса «Query Search» (можно указать их сколько угодно, каждый с новой строки)

  24.  
  25. Программа супер, спасибо. Не помешало бы в нее встроить задержку м/у запросами на всякий случай. Хотя парсил Яшу (всю выдачу, 20 страниц по 50 сайтов на одной) и капча не вылетала, как такое сделано? Чистка куков и рандомайз юзер агентов?
    PS: плагин подписку на комменты не помешало бы поставить.

  26.  
  27. Ничего особенного не делал, просто браузерная основа играет большую роль. В этой программе уже врядле что-либо буду менять, есть порядком более совершенный парсер с массой полезных фич по работе с текстами. Когда-нибудь выложу.

    Спасибо за интерес 🙂 плагин для подписки на комменты уже установил)

  28.  
  29. Будем ждать

  30.  

Оставить комментарий

Top

www.zu1.ru © 2006-2017. Копирование и переписывание материалов сайта допустимо только при наличии прямой (без редиректа), активной ссылки на этот ресурс.


Rambler's Top100 Участник Blograte.ru заработок в интернете. блоги о заработке.