Обычная страница, например, нужно вытащить текст. Мы видим одну из «параноидальных» защит от копирования, так сайтовладельцы выделение мышью, блокируют правую кнопку мыши на странице, запрещая доступ коду страницы, CTRL+A тоже не работает. Что делать?
В Chrome жмем F12, если и это вдруг не работает, открываем страницу в Explorer, выбираем через меню Сервис (ALT+X) – Средства разработчика F12.
Открываем закладку «Сценарий», там, после километров скриптов, находим нужный html-фрагмент с текстом в тегах.
Копируем статью. Проще всего от тегов избавиться, скопировав все в source какого-нибудь WYSIWYG редактор редактора админки и переключиться обратно в текст. Это быстрее, чем удалять теги вручную.
<h1 style=»text-align: justify;»><strong>Багерхат в 15 веке основал турецкий воин Улуг Хан Джахан. Багерхат, или Халифатабад, как его еще тогда называли, был великолепным городом. В нем было ни много, ни мало триста шестьдесят мечетей, множество общественных зданий, мавзолеев, мощеных дорог и мостов. Чего стоит одна только уникальная терракотовая мечеть Шейт Гумбад или мечеть Шестидесяти могил!</strong></h1>
<hr/>
<h1 style=»text-align: justify;»></h1>
Бывает, что к копируемому тексту добавляют ссылку на источник. Часть текста помещают в виде изображения или добавляют невидимый текст между абзацами. С т.з. SEO: добавлять ссылку с помощью source_link – допустимо, но скрытый контент или jpeg – стопроцентно плохие идеи.
p.s. На примере мы видим типичную верстку: невалидные теги (hr), множественное неправильное использование h1, оформление внутри заголовка, оформление, не вынесенное в стили…