Перейти к содержимому


Парсер товаров для ShopCMS


  • Вы не можете ответить в тему
Сообщений в теме: 149

#141 badisoft

    Продвинутый пользователь

  • Assistent vsupport.club
  • PipPipPip
  • 5075 сообщений
Репутация: 786
Мастер

Отправлено 11 September 2014 - 11:08 AM

Но как бы сохранить возможность очистки от лишних тегов и обойти ошибку в коде целевой страницы?

Т.к. ошибка некорректно (точнее, не так, как хотелось бы) обрабатывается штатной функцией PHP, то я не вижу другого варианта кроме написания собственной аналогичной функции :). Либо, как вариант, перед strip_tags заменить в строке незакрытую угловую скобку на <

PS. Либо поискать. Может, в PHP есть штатная функция, преобразующая такие "не закрытые/открытые теги" в < и >
  • 0
http://cpu.badisoft.ru (тестовый сайт), http://badisoft.ru (модули)

#142 badisoft

    Продвинутый пользователь

  • Assistent vsupport.club
  • PipPipPip
  • 5075 сообщений
Репутация: 786
Мастер

Отправлено 11 September 2014 - 01:34 PM

Либо, как вариант, перед strip_tags заменить в строке незакрытую угловую скобку на %lt;

Например, так:

$pDescription = preg_replace("/<([^>]*?)(?=(<|$))/","&lt;\$1",$pDescription);

Это реплейс заменит на &lt; все левые угловые скобки, после которых следующей угловой скобкой идет тоже левая либо вообще никакой (конец строки).
  • 1
http://cpu.badisoft.ru (тестовый сайт), http://badisoft.ru (модули)

#143 Den

    Продвинутый пользователь

  • Assistent vsupport.club
  • PipPipPip
  • 117 сообщений
Репутация: 0
Начинающий

Отправлено 11 September 2014 - 03:46 PM

badisoft, в который раз убеждаюсь в вашей гениальности! Спасибо огромное, теперь все работает как надо.
Для общих случаев нашел модифицированную функцию для очистки от тегов - strip_tags_smart, правда так и не разобрался как ее правильно использовать, .т.к. в результате она чистит от всех тегов игнорируя исключения.
Делал так:
include('strip_tags_smart.php');
$pDescription = strip_tags_smart($pDescription, $templates['allowed_tags']);
Подозреваю, что из-за отсутвия познаний в программировании неправильно указал переменную содержащую теги-исключения. Если не сложно, подскажите что я не так сделал.
  • 0

#144 badisoft

    Продвинутый пользователь

  • Assistent vsupport.club
  • PipPipPip
  • 5075 сообщений
Репутация: 786
Мастер

Отправлено 11 September 2014 - 04:01 PM

Подозреваю, что из-за отсутвия познаний в программировании неправильно указал переменную содержащую теги-исключения.

Переменная указана правильно. Но в парсере, как я понимаю, она содержит строку c тегами вида "<a><b><c>", а для новой функции должна содержать массив вида array = ('a','b','c').
  • 0
http://cpu.badisoft.ru (тестовый сайт), http://badisoft.ru (модули)

#145 hedhedhed

    Продвинутый пользователь

  • Download User
  • PipPipPip
  • 107 сообщений
Репутация: 4
Начинающий

Отправлено 20 August 2015 - 02:09 PM

Есть ли актуальные на данный момент парсеры ? А то я знаю, что, например, ямаркет пару м-цев назад изменил формат вывода характеристик.

Или выложенные здесь парсеры можно доработать ?
  • 1

#146 x777am77

    Пользователь

  • Download User
  • PipPip
  • 22 сообщений
Репутация: 0
Начинающий

Отправлено 08 October 2015 - 12:53 AM

Всем привет!
Кто поможет настроить шаблон для этого парсера под определенный сайт?
Раньше мне его настраивал разработчик. Но сейчас он по моему немного не в адеквате :D
Создалось впечатление,что он сам не знает как работает его парсер :D
Если у кого есть желание,пишите сюда или в личку. Или на почту.
  • 0

#147 badisoft

    Продвинутый пользователь

  • Assistent vsupport.club
  • PipPipPip
  • 5075 сообщений
Репутация: 786
Мастер

Отправлено 19 October 2015 - 01:06 PM

Форум умер?

1. ShopCMS практически умер. Вымирает по многим причинам.
2. написать целевой шаблон под этот модуль сложнее, чем просто написать отдельный парсер для конкретного сайта. Ведь надо будет понять, что и как парсить (условия), а потом оформить эти условия не на привычном и знакомом PHP, а в рамках правил, которые понимает обработчик шаблона.
3. в парсере есть одна, как минимум, ошибка, не позволяющая его полноценно использовать.
4. Есть куда более интересные "парсеры по шаблонам". Этот, на мой взгляд, самый неудачный.
  • 0
http://cpu.badisoft.ru (тестовый сайт), http://badisoft.ru (модули)

#148 x777am77

    Пользователь

  • Download User
  • PipPip
  • 22 сообщений
Репутация: 0
Начинающий

Отправлено 08 November 2015 - 01:13 AM

4. Есть куда более интересные "парсеры по шаблонам". Этот, на мой взгляд, самый неудачный.



Меня в свое время этот парсер очень хорошо выручил. Но это было более 3-х лет назад. Сейчас друг попрасил сделать небольшой сайт по продаже авто чехлов. Но как выяснилось их там около 5000 наименований. В принципе описания везде одинаковые,картинки одинаковые,но коды разные.
Вот не знаю теперь на чем ему делать этот магазин. Может сейчас есть ,что нибудь поинтереснее ShopCMS?
  • 0

#149 Revived

    Продвинутый пользователь

  • Assistent vsupport.club
  • PipPipPip
  • 59 сообщений
Репутация: 0
Начинающий

Отправлено 20 September 2016 - 07:57 AM

Это парсер очень выручает, если немного к нему привыкнуть, то шаблоны под любой сайт создаются за считанные минуты. Из бесплатных аналогов ему нет. Присутствуют отдельные неудобства, но за бесплатно нужно чем-то платить.
  • 0

#150 Jeck2000

    Продвинутый пользователь

  • Assistent vsupport.club
  • PipPipPip
  • 159 сообщений
Репутация: 8
Начинающий
  • ГородСанкт-Петербург

Отправлено 25 September 2016 - 05:23 PM

Этот парсер хорошь, когда тебе надо периодически подграбливать товар (ну там допустим парочку новых в день. Я даже этот парсер купил в свое время и он меня тоже очень много выручал, пока роспотребнадзор не заблочил нужные мне сайты. Я нашел конечно выход через VPN, но это блин задница через задницу.

В конечном итоге, если нужно спарсить много товаров, то идеально подходит Content Downloader .В инете можно найти полную версию (правда не первой свежести) ,но мне например ее хватает за глаза и зауши. Видео инструкция по настройке (работе с прогой) есть по моему на офсайте, ну либо на ютюбе (не помню, где смотрел)

Все очень удобно, просто, и главное, количество задаваемых границ по моему 20 (в отличии от встроенного парсера, где собственно всего одна). После граба получаешь файл CSV и папку скартинками. CSV файл надо немного причесать, приведя к стандартному шаблону (он описан здесь )

Далее, просто импорт в магазин и все. Ну и там с картинками если надо, пошаманить, привести к нужным размерам. Тупо сделать еще 3 папки Small , Medium и Big / Залить во все 3 одни и теже файлы ну и масоово перевести их в каждой к нужному замеру

В общем кому грабить много с какого -то левого сайта, советую обратить на нее внимание.
  • 0