+

Парсинг контента с сайтов и встраивание на Modx Revo

30.11.2018 21:27
17.12.2018 04:45
214

Рано или поздно, $USER_NAME%, каждый кто имеет дело с сайтами на CMS приходит к выводу что сайты лулчше делать на движке иксы мода революшен, в простонародье именуемым Modx Revolution, возникает вопрос, как же перенести контент с других, неадекватных криво-недо-движков вроде joomla или bitrix безопасно для душевного здоровья? Сейчас я всё это покажу на примере, который к сожалению для меня оказался не совсем безопасным..

С чего же начать? Что самое важное в программировании сайтов? Конечно же фоновая музыка, воспользуемся помощью команды #НТР, она как нельзя лучше озвучит проблемы нашей нелёгкой жизни разработчиков.

phpQuery

Для начала нам надо скачать библиотеку phpQuery, эта библиотека позволяет парсить html контент используя силекторы идентичные jQuery, легко менять отдельные атрибуты у элементов, выдёргивать внутренний html блоков и всё в таком роде.

GitHub

Далее идём на github, и смотрим MODX-Content-Parcer, там я выложил весь код и приложил небольшую документацию. По мере надобности буду дописывать этот код.

ЗЫ:

Допил парсера сейчас я отложил потому как сайт для которого я его делал не структурирован совершенно, по 2 h1 на странице и всё в таком духе..