Привет всем
Подскажите парсер контента, желательно бесплатный, те что за деньги я и сам нашел)))
Попробовал Uni Parser он глючит, мне, надо спарсить часть большого сайта, а он не хочет парсить там где я ему сказал, он парсит все подряд.
Нашел ломаный SJS, но в архиве с парсером троян, парсер нужен на раз, и ради одного раза покупать не хочется.


Сообщений в теме: 6
#2
Отправлено 12 Июнь 2016 - 12:57
php

«функция подсчёта длины каждого вектора в векторе векторов, на выходе вектор длин векторов-векторов» © 先生
#3
TC Отправлено 12 Июнь 2016 - 14:32
php
Пока что нашел ломаный datacol пытаюсь его настроить
Разместить рекламу на форуме, расценки тут
#4
Отправлено 12 Июнь 2016 - 22:35
вот почему то совсем не удивлен ответом.
искать каждый раз корявый софт, чтобы изучить корявые настройки как-то нелогично
вот, например, проходчик по всем урлам вебимхи, написан за 10 минут (не запускал, возможно есть небольшие ошибки):
сам пхп можно освоить за пару дней с полного нуля или пару часов после другого языка
<?php // Сбор страниц на webimho.ru $pref = 'http://webimho.ru'; $arr = array($pref.'/'); for($i=0; $i<count($arr); $i++) { $url = $arr[$i]; $page = @file_get_contents($url) if(!$page) { continue; } if(!preg_match_all('/href="(.*)"/isu', $page, $m, PREG_SET_ORDER)) { continue; } foreach($m as $k=>$v) { $new = $pref . $v[1]; if(array_search($new, $arr)) { continue; } $arr[] = $new; } } ?>
вот так можно без гемора выкачать какой-нибудь сайтик из линуксовой консоли:
wget -nc -r http://webimho.ru/
хватит придумывать себе лишний геморрой
"Они не могут ничего, у них лапки котят"
mine.organic
mine.organic
#5
Отправлено 12 Июнь 2016 - 23:15
datacol !
И есть второй, донк на нем сидит content downloader
И есть второй, донк на нем сидит content downloader
#6
Отправлено 13 Июнь 2016 - 01:39
по свету donc я также купил КД, но не осилил егошнего интерфейса. Ссылки то еще генерировать на получение мог, но вот парсинг сложных страниц методом привязки - для меня нечто.
мой выбор на сегодня, httrack + lazarus.
зы
а по теме я хз какой парсер лучше.
мой выбор на сегодня, httrack + lazarus.
зы
а по теме я хз какой парсер лучше.
#7
TC Отправлено 13 Июнь 2016 - 01:51
ну в самом деле, надо лишь освоить пару функций и жизнь станет прекрасна искать каждый раз корявый софт, чтобы изучить корявые настройки как-то нелогично
datacol !
а по теме я хз какой парсер лучше.
Разместить рекламу на форуме, расценки тут
Похожие темы
Яндекс обновил алгоритмы поиска, чтобы лучше определять неоригинальный контентАвтор Personalab, 29 авг. 2023 |
|
![]() |
||
Вопрос по сео оптимизации похожих по интенту страниц.Автор 2kw2kw2kw, 16 нояб. 2021 |
|
![]() |
Количество пользователей, читающих эту тему: 0
0 пользователей, 0 гостей, 0 анонимных
© 2023 SMO&SEO форум «WEBIMHO» — продвижение и создание сайтов, интернет-маркетинг
По вопросам рекламы на форуме и цены на рекламу
По вопросам рекламы на форуме и цены на рекламу
Все материалы SEO форума разрешены к копированию только с установкой гиперактивной ссылки на
webimho.ru,
тем, кто этого не сделает, мы оторвем руки и ноги и поменяем местами,
а когда выйдем из тюрьмы, опять оторвем и опять поменяем.
тем, кто этого не сделает, мы оторвем руки и ноги и поменяем местами,
а когда выйдем из тюрьмы, опять оторвем и опять поменяем.
Россия,
г. Москва