Рейтинг@Mail.ru

Tag Archive | "Парсер"

Парсер Заголовков и Описаний

Нашел в своем rss-ридере пост «Notepad++ как инструмент для SEО«. Не понял, что автор хотел сказать… Наверное, рассказ про «Замену» (Ctrl+H), которая есть во всех текстовых редакторах. Но не это главное. Главное (почему я осилил написание этого поста) — вспомнил, что завалялся на моем винте скрипт, который умеет выдирать содержимое тегов title и meta-description из списка данных ему сайтов. Собственно, вот он:

<?php
ob_implicit_flush();
$urls = file("urls.txt");
$file_titles = fopen("titles.txt", "a");
$file_descs = fopen("descriptions.txt", "a");
$pattern1 = "/<title>(.*?)<\/title>/is";
$pattern2 = "/<meta name=(\"|')description(\"|') content=(\"|')(.*?)(\"|')(.*?)>/is";
foreach ($urls as $one_url)
{
    $html = file_get_contents(trim($one_url));
    preg_match($pattern1, $html, $matches);
    fwrite($file_titles, $matches[1]."\n");
    preg_match($pattern2, $html, $matches);
    fwrite($file_descs, $matches[4]."\n");
    echo $one_url . " done.<br />";
}
fclose($file_titles);
fclose($file_descs);
?>

Вроде как, всё понятно:
— в файле urls.txt находится список сайтов, из которых требуется выдирать титлы и дески;
— в файл titles.txt складываются заголовки сайтов;
— в файл descriptions.txt складывается содержимое meta-description.

«Зачем всё это надо» — спросите вы! Лично я использовал этот скрипт следующим образом. В одной из отраслей онлайн-бизнеса, где безредиректные дорвеи очень хорошо себя чувствуют, есть очень много похожих друг на друга сайтов. Этим скриптом я выдирал титлы/дески из этих сайтов, бегло чистил от мусора, и конечный файл подключал к своему генератору дорвеев. Дорген в теги title и meta-desc подставлял сначала нужный ключевик, а после титл и деск, рандомно вырванный из файлов titles.txt и descriptions.txt.
Если еще кто-нибудь не понял, зачем я так заморачивался, рассказываю. Контент дорвея предназначен для гуглобота. А Титл и Деск — для посетителя, который находит мой дорвей в серпе. 😉

Вряд ли этот скрипт заинтересует бывалых дорвейщиков, но для молодых может быть полезен. В частности, рекомендую автору поста про Notepad+++ использовать этот скрипт, вместо возни с Ctrl+H :))

п.с. Скрипт любезно предоставлен Sunday — злой гамбургер с форума Gofuckbiz 8)

Posted in Скрипты10 комментариев

Бесплатный скрипт для парсинга контента Youtube

Автор сайта seoboxer.ru выложил в паблик скрипт для парсинга видео с сервиса Youtube. Что умеет делать скирпт:

  • парсит Youtube по введённому вами ключевому слову;
  • все ссылки сохраняет в тхт-файл и загружает их в отдельном поле в браузере;
  • при клике на ссылке открывает выбранное видео для просмотра;
  • в отдельном поле выдаёт код для вставки в блог.

Скрипт заточен под английский язык; под Зендом.

Также существет и платная версия. Основное отличие – умение парсить контент не только с Youtube, но и других видео-сервисов.

Подробности и ссылка на скачивание (было http://seoboxer.ru/?p=1233500940#post), действительно, умерли, поэтому восстановленное из пепла описание:

Краткое описание, что умеет делать скрипт:

  1. Под Ваш заказ скрипт парсит ссылки на видео с youtube.com.
  2. Скрипт сохранит ссылки в файл video.txt.
  3. Скрипт загрузит все ссылки в специальном поле.
  4. Скрипт выдаст для просмотра выбранное видео, после вашего нажатия на одну из ссылок.
  5. Скрипт предоставит готовый код для каждого выбранного видео для вставки на любую вашу страницу.

Состав поставки:

  • скрипт index.php
  • скрипт index2.php
  • картинки, в зависимости от выбранной версии.

Особенность скрипта:

  • скрипт под зендом (т.к. не хочется, что бы кто-то пользовался моими функциями).
  • срипт заточен под английский язык.

И архив Personal Video Parser.

Posted in ПрограммыComments (1)