Навигация
 
Сейчас на сайте
Гостей: 17

Гости:
[Ваш IP] 14:07:28
/Форум/Тема
46.229.168.148 14:07:20
/Форум/Тема
46.229.168.135 14:07:04
/Форум/Тема
46.229.168.130 14:06:00
/Форум/Тема
46.229.168.133 14:05:55
/Форум/Тема
Yandex [Bot] 14:05:01
/Форум/Тема
Bing [Bot] 14:05:00
/Новости
Bing [Bot] 14:04:56
/Форум/Тема
Bing [Bot] 14:04:51
/Форум/Тема
54.187.49.190 14:04:47
/main.php
7 - не показано

Всего пользователей: 116
Новый пользователь: Tim
 
RSS потоки
RSS Форумы: тема

RSS Новости
RSS Комментарии
RSS Форумы
RSS Статьи
RSS Фотогалерея
RSS Файлы
RSS Ссылки
 
Нажималка
[хочу себе такую панельку!]



Ваш код:
(кнопка | ссылка)

[Полный список кнопок]
 
Автор: Polarfox
ID темы: 276
Информация
В этой теме сообщений: 4, просмотров темы: 8200.  Имеются прикрепленные файлы.
Просмотр темы
unLogic Lab » Разработка (Development) » Альфа (Alpha) и Бета (Beta)
 Распечатать тему
Thief - класс граббер - для копирования с сайта
Polarfox
Необходимо PHP 5.x (чем выше, тем лучше)

Класс "вор" (граббер) скрипт для сбора [текстовых] данных и отображения их на своем сайте.

Что это?
Простой класс для сбора и копирования к себе (в кэш) а потом и отображения, необходимых участков с любых сайтов.
Предназначен для копирования себе нужных и/или важных динамических кусков с других сайтов, в разумных и неразумных пределах.
Явно не предназначен для воровства данных. (Скрытый текст: название? ну они всегда у меня неординарные :))
Возможно использовать как на отдельных страницах, так и в панелях, но обязательно с кэшем, иначе теряется смысл (по большей части, но не вообще)

Установка
  • Скинуть файл класса в нужное место (он не зависит ни от чего)
  • Подключить и далее согласно примеру


Удаление
  • Убрать все использующее класс
  • Удалить файл


Пример вызова
Внутри - парсинг главной google
Еще подробней

  1. //1. подключаем класс
  2. require_once 'thief.class.php';
  3.  
  4. //2. создаем экземпляр
  5. $th = new Thief(
  6. 'url'=>'http://google.com',//полная ссылка - впрочем такая сойдет
  7. 'c_file'=>'th_cache.txt',//полный путь до файла - сойдет и так
  8. 'c_time'=>30,//время кэша в сек
  9. 's_regx'=>'%<form.*?>(.*?)</form>%s',//поиск ругляркой, по умолчанию берется 1ое выражение
  10. 'f_regx1'=> array('/<table /s'),//замена регулярками (можно много!)
  11. 'f_regx2'=> array('<table border=1 '),//вот на это меняется, оба массива связаны как f_regx1 => f_regx2
  12. )
  13. );
  14.  
  15. //[?.] можно установить данные или поменять потом через эту функцию
  16. // $th->set_data(/* array here */);
  17.  
  18. //[?.] fпринудительно чистить кэш так - вызов - use: thief_example.php?clean
  19. if(isset($_GET['clean'])){
  20. $th->clean_cache();
  21. }
  22.  
  23. //3. проверим нужно ли обновить по времени (или может кэша нет?) если не нужно - не обновлять.
  24. $th->recache();
  25.  
  26. //4. вывод - вывод всегда идет с кэша - только что созданного или созданного позже.
  27. echo $th->get_cache();
  28.  
  29. //[?.] лог - для отладки и интереса, можно и не показывать
  30. echo '<hr/>'.$th->get_log(false);
  31.  
  32. //все что со знаком ? - необязательно


Переменные
Можно установить следующие переменные (см. создание объекта или функ. set_data ) по типу - переменная => значение:
url - путь до страницы
c_file - путь до файла кэша
c_time - время кэша в секундах
s_regx - поисковое регулярное выражение (как здесь: preg_match( s_regx , [...], $p_matches ) ) /ОПЦИОНАЛЬНО/
sn_regx - номер эелемента в поисковом регулярном выражении (как здесь: $p_matches[ sn_regx ] ) /ОПЦИОНАЛЬНО/
f_regx1 - заменить это значение (как здесь: preg_replace(f_regx1, f_regx2, [...]) ) /МАССИВ,ОПЦИОНАЛЬНО/
f_regx2 - на это значение (как здесь: preg_replace(f_regx1, f_regx2, [...]) ) /МАССИВ,ОПЦИОНАЛЬНО/
cp_from - кодировка документа на сайте /ОПЦИОНАЛЬНО/
cp_to - необходимая кодировка /ОПЦИОНАЛЬНО/

Возможности
  • Поддержка поиска по регулярному выражению (опция)
  • Поддержка фильтров-замен по регулярным вражением (опция)
  • Работа без движка и как часть чего угодно
  • Перекодировка при необходимости (обязателен iconv как оптимальное средство)
  • Сбор страницы + кэширование по времени
  • Ручное удаление кэша


Это не полное описание, мб как нить допишу, впрочем там все понятно.
Polarfox прикрепил(а) файл:
class_thief.zip [3.38кБ / 800 Загрузки]

Изменил(а) Polarfox, 8.02.2013 14:45:20
unLogic creator | For English speaking users
unlogic.info/images/unapproved_dev.png
 
http://unlogic.info
WhiteFox
Короткая навигация по форуму (избранное): [Пропустить]

А еще есть Файлы - небольшая полезная подборка от меня


Все мои (и не только) загрузки я размещаю на форуме.
Понравившийся аддон можно скачать , кликнув по ссылке с файлом внизу поста - первый пост по традиции - это описание, ссылки на скачку и примеры работы.
Бесплатно, без регистрации, быстро и просто.

Вы можете свободно копировать информацию к себе, при условии установки активной ссылки на автора (по большей части - это все же я), сайты партнеры могут просто указать авторство, без ссылки.
Поскольку большинство скриптов я обновляю постоянно - если вы захотите распространять мои скрипты, я рекомендую просто делать ссылки на темы, либо следить за обновлениями.

 
Zaxap
А можно для тупых (таких как я) написать, в какую папку что кидать, и как прописывать...Smile
Zaxap Kramer
Время - иллюзия. (с)
 
http://www.kramerz.ru
Polarfox
Работает из любой папки, я же указывал что это отдельный скрипт.
Прописывать - см. пример.
unLogic creator | For English speaking users
unlogic.info/images/unapproved_dev.png
 
http://unlogic.info
Zaxap
Тогда я видимо просто не так прописал:З
Zaxap Kramer
Время - иллюзия. (с)
 
http://www.kramerz.ru
Перейти на форум:
 
Подобные темы
Темы Форум Ответов / Просмотров Последние сообщения
Требуется копирайтинг для веб-студии работющей с PHP-Fusion плюс аудит сайта  →  Оффтопик и флуд 3 / 14729 28.08.2014 09:54:47
Порча .htaccess вашего сайта  →  unS - Безопасность и стабильность 0 / 8976 27.01.2014 20:34:55
Все страницы сайта - страница  →  Страницы (Pages: RC, A, B) 0 / 7608 7.06.2013 12:57:01
Favicon Manager - менджер иконки сайта - панель+плагин  →  Обзоры (reviews) 0 / 7377 28.05.2013 11:47:21
Функция - получение страницы сайта  →  Хаки/скрипты (Hacks/scripts) 0 / 4737 5.02.2013 14:37:18
Имею ли я право убрать/изменить copyright (текст внизу сайта)?  →  Информация (Info) 2 / 5578 8.10.2012 08:50:46
Изменение приветствия сайта (там где центральная панель)  →  Информация (Info) 0 / 4102 20.09.2012 10:16:46
Оптимизация сайта [на PF]  →  Информация (Info) 9 / 16263 14.06.2012 13:06:43
Кнопка сайта - панель  →  Панели (Panels: RC, A, B) 12 / 38288 14.06.2012 13:03:04
Значок сайта (favicon) - отображения в строке браузера,для закладок  →  Информация (Info) 0 / 2542 29.09.2011 04:50:46