Human Emulator — запуск из командной строки

Этой статьей я продолжу цикл статей о тонкостях использования хуман эмулятора для сбора данных. Предыдущие два сборщика запускались в один поток без использования прокси и из под хуман эмулятора. Чтобы запускать мультипоточно Human Emulator нам понадобятся параметры командой строки. Для того чтобы сделать наши сборщики по аналогии со сборщиками сбора поисковых подсказок.

параметры командной строки Human Emulator

обзор параметров командной строки Human Emulator

Итак вот они : эти параметры командной строки  поддерживаются программой Human Emulator:

  • /port:»ПОРТ« — указывает хуман эмулятору на каком порту запускать прием управляющих команд. Если этот параметр не задан, то порт берется из файла port.txt в папке программы. Порт может принимать значения от 1 до 65535. На этом порту запускается прослушивающий сокет, на который приходят POST HTTP запросы. Эти запросы обрабатываются хуманом в очередности их поступления. Одна команда в одно и тоже время. Например, параметр /port:»7010« — указывает хуману запускаться на 7010 порту.
  • /script:»ПУТЬ К СКРИПТУ« — указывает хуману что нужно открыть и выполнить заданный скрипт. Если параметр не указан, то хуман просто запускается и ждет команд. Например, параметр /script:»D:\Batch\Harvest Keyword Planner\threads\gkplanner_0\run.php«, запустит на выполнение скрипт по заданному пути.
  • /in_tray:»yes« или /in_tray:»true« или /in_tray:»1« — указывает хуману, что при запуске надо сворачиваться в трей (там где часы). таким образом можно сделать так чтобы хуман запускался беззвучно. Особенно с командой $app->show_tray_icon(false); можно сделать присутствие хумана на машине совсем не напрягающим и незаметным, чтобы его работа не мешала основной деятельности и не загромождала экран. Например, параметр /in_tray:»yes« запустит хуман, свернутым в трей область.
  • /script_args:»АРГУМЕНТЫ ДЛЯ СКРИПТА« — этот параметр указывает хуману что при запуске скрипта надо ему передать параметры. Для PHP скрипта параметры после передачи будут доступны в переменной- массиве $argv[]. Например,  /script_args:»1 2 3« после передачи такого аргумента в мы получим следующие аргументы командной строки argv[0]=»путь к запускаемому скрипту», argv[1]=»1″, argv[2]=»2″ и argv[3]=»3″
  • /cache_folder:»ПАПКА ДЛЯ КЭША« — этот параметр задает папку где браузер хуман эмулятора будет хранить свой кэш (хранилище временных фалов, например загруженные картинки, видео, скрипты и т.п.). Это нужно для анонимности, некоторые сайты могут так отслеживать «уникальность заходов». Если этот параметр не задан, то кэш хранится в папке программы по следующем пути «\Порт\Cache\». Например параметр /cache_folder:»C:\Cache1« укажет хуману что работа с кэшем будет происходить в папке C:\Cache1
  • /cookies_folder:»ПАПКА ДЛЯ КУКОВ« — а этот параметр задает папку, где браузер Human Emulator будет хранить куки (различные параметры, которые записываются сайтами). Это опять же влияет на анонимность и например авторизацию. Если этот параметр не задан, то куки будут хранится в папке программы по следующему пути «\Порт\Cookies\». Например параметр /cookies_folder:»C:\Cookies1« укажет хуману что работа с куками будет происходить в папке C:\Cookies1
  • /ask_port:»yes« или /ask_port:»1« или /ask_port:»true« — указывает что при старте программы не задавать вопросов о переходе на следующий свободный порт, если текущий порт занят, то просто не запускать хуман эмулятор.

Вывод:

Используя эти параметры командной строки, мы в дальнейшем сможем организовывать работу наших сборщиков, использующих Хуман Эмулятор во многопоточном режиме. Особенно нам интересны параметры /port , /script , /script_args и /in_tray. Используя их мы можем запускать хуман в различных вариантах для организации сбора данных как с отдельных сайтов, так  и для создания целых распределенных многопоточных систем сбора. В следующей статье я рассмотрю возможности хумана для удаленного управления им по IP адресу и порту.

Опубликовать в Google Plus
Опубликовать в LiveJournal
Опубликовать в Мой Мир
Опубликовать в Одноклассники
Опубликовать в Яндекс
Опубликовано в Human Emulator, Общая информация Метки: ,

Добавить комментарий

Сентябрь 2017
Пн Вт Ср Чт Пт Сб Вс
« Фев    
 123
45678910
11121314151617
18192021222324
252627282930