Хаки для граббера

Что такое хак, применительно к грабберу? Хак, это микропрограмма, вызываемая для обработки получаемого содержимого (контента). Из-за того, что полученный контент часто приходится каким-либо образом обрабатывать, например выравнивать картинки по правому или левому краю или по центру. Или, к примеру, удалять все ссылки на третьи сайты, оставляя просто текст или заключать в тег <noindex>, добавляя атрибут rel=nofollow Таких простых задач, может набраться довольно много. Поэтому, мы добавили в систему импорта новостей возможность указывать хаки для обработки контента, и  даже создавать свои (потребуются знания языка PHP)

Итак, для того, чтобы задействовать определённый хак, идём в раздел "категории" в граббере и выбираем интересующий нас хак в поле Хаки (микропрограммы для обработки контента) В граббере, хаки можно применять для обработки краткой или полной новости отдельно, а также можно задать обработку сразу и краткой и полной новости. Среди стандартных хаков в граббере, на данный момент имеются такие:

  • выровнять картинки по левому краю
  • выровнять картинки по правому краю
  • выровнять картинки по центру
  • отфильтровать ссылки на третьи сайты
  • заключать ссылки на третьи сайты в noindex и добавлять nofollow
  • удалять скрипты и события в тегах
  • удалять внедрённые объекты
  • удалять плавающие фреймы
  • заменять абзацы на двойные переводы строк
  • заменять переводы строк на абзацы (не всегда корректно)
  • преобразовать текстовые переводы строк в HTML переводы
  • удалить лишние пробелы, переводы строк и табуляции
  • удалить стили и стилевые атрибуты
Если вы обладаете знаниями языка PHP, то у вас есть возможночть создавать собственные хаки для обработки контента. Хаки находятся в папке граббера: корень_граббера/hacks/ в отдельных файлах, с расширением .php Хак принимает на вход переменную $content, творит с её содержимым различные преобразования и помещает обратно в $content результат

Разделы сайта

Форум web-разработчиков