Хаки для граббера
Что такое хак, применительно к грабберу? Хак, это микропрограмма, вызываемая для обработки получаемого содержимого (контента). Из-за того, что полученный контент часто приходится каким-либо образом обрабатывать, например выравнивать картинки по правому или левому краю или по центру. Или, к примеру, удалять все ссылки на третьи сайты, оставляя просто текст или заключать в тег <noindex>, добавляя атрибут rel=nofollow Таких простых задач, может набраться довольно много. Поэтому, мы добавили в систему импорта новостей возможность указывать хаки для обработки контента, и даже создавать свои (потребуются знания языка PHP)
Итак, для того, чтобы задействовать определённый хак, идём в раздел "категории" в граббере и выбираем интересующий нас хак в поле Хаки (микропрограммы для обработки контента) В граббере, хаки можно применять для обработки краткой или полной новости отдельно, а также можно задать обработку сразу и краткой и полной новости. Среди стандартных хаков в граббере, на данный момент имеются такие:
- выровнять картинки по левому краю
- выровнять картинки по правому краю
- выровнять картинки по центру
- отфильтровать ссылки на третьи сайты
- заключать ссылки на третьи сайты в noindex и добавлять nofollow
- удалять скрипты и события в тегах
- удалять внедрённые объекты
- удалять плавающие фреймы
- заменять абзацы на двойные переводы строк
- заменять переводы строк на абзацы (не всегда корректно)
- преобразовать текстовые переводы строк в HTML переводы
- удалить лишние пробелы, переводы строк и табуляции
- удалить стили и стилевые атрибуты