Нашел в своем rss-ридере пост «Notepad++ как инструмент для SEО«. Не понял, что автор хотел сказать… Наверное, рассказ про «Замену» (Ctrl+H), которая есть во всех текстовых редакторах. Но не это главное. Главное (почему я осилил написание этого поста) — вспомнил, что завалялся на моем винте скрипт, который умеет выдирать содержимое тегов title и meta-description из списка данных ему сайтов. Собственно, вот он:
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 | <?php ob_implicit_flush(); $urls = file( "urls.txt" ); $file_titles = fopen ( "titles.txt" , "a" ); $file_descs = fopen ( "descriptions.txt" , "a" ); $pattern1 = "/<title>(.*?)<\/title>/is" ; $pattern2 = "/<meta name=(\"|')description(\"|') content=(\"|')(.*?)(\"|')(.*?)>/is" ; foreach ( $urls as $one_url ) { $html = file_get_contents (trim( $one_url )); preg_match( $pattern1 , $html , $matches ); fwrite( $file_titles , $matches [1]. "\n" ); preg_match( $pattern2 , $html , $matches ); fwrite( $file_descs , $matches [4]. "\n" ); echo $one_url . " done.<br />" ; } fclose( $file_titles ); fclose( $file_descs ); ?> |
Вроде как, всё понятно:
— в файле urls.txt находится список сайтов, из которых требуется выдирать титлы и дески;
— в файл titles.txt складываются заголовки сайтов;
— в файл descriptions.txt складывается содержимое meta-description.
«Зачем всё это надо» — спросите вы! Лично я использовал этот скрипт следующим образом. В одной из отраслей онлайн-бизнеса, где безредиректные дорвеи очень хорошо себя чувствуют, есть очень много похожих друг на друга сайтов. Этим скриптом я выдирал титлы/дески из этих сайтов, бегло чистил от мусора, и конечный файл подключал к своему генератору дорвеев. Дорген в теги title и meta-desc подставлял сначала нужный ключевик, а после титл и деск, рандомно вырванный из файлов titles.txt и descriptions.txt.
Если еще кто-нибудь не понял, зачем я так заморачивался, рассказываю. Контент дорвея предназначен для гуглобота. А Титл и Деск — для посетителя, который находит мой дорвей в серпе.
Вряд ли этот скрипт заинтересует бывалых дорвейщиков, но для молодых может быть полезен. В частности, рекомендую автору поста про Notepad+++ использовать этот скрипт, вместо возни с Ctrl+H :))
п.с. Скрипт любезно предоставлен Sunday — злой гамбургер с форума Gofuckbiz 8)