Описание: Переменные для ссылки куда перешёл и откуда... |
Поиск в теме | Версия для печати |
Alone |
Отправлено: 26 Ноября, 2007 - 10:16:43
|
Super Member
Покинул форум
Сообщений всего: 2393
Дата рег-ции: Дек. 2004
Карма 8
|
glaberzu
Да запарился...
Кстати с роботами лучше такой список юзать:
CODE:if (stristr($_SERVER['HTTP_USER_AGENT'], Yandex)) {$bot = "Yandex";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Mail.ru)) {$bot = "Mail.ru";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Msnbot)) {$bot = "Msnbot";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Yahoo)) {$bot = "Yahoo";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Google)) {$bot = "Google";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Aport)) {$bot = "Aport";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Rambler)) {$bot = "Rambler";}
if (stristr($_SERVER['HTTP_USER_AGENT'], webalta)) {$bot = "webalta";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Slurp)) {$bot = "Slurp";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Gigabot)) {$bot = "Gigabot";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Snapbot)) {$bot = "Snapbot";}
if (stristr($_SERVER['HTTP_USER_AGENT'], archive_org)) {$bot = "Archive_org";}
if (stristr($_SERVER['HTTP_USER_AGENT'], TurtleScanner)) {$bot = "TurtleScanner";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Nutscrape)) {$bot = "Nutscrape";}
if (stristr($_SERVER['HTTP_USER_AGENT'], WebSpeedReader)) {$bot = "WebSpeedReader";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Bond)) {$bot = "Bond";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Wget)) {$bot = "Wget";}
if (stristr($_SERVER['HTTP_USER_AGENT'], ZyBorg)) {$bot = "ZyBorg";}
if (stristr($_SERVER['HTTP_USER_AGENT'], Exabot)) {$bot = "Exabot";}
И через регистронезависимую функцию stristr |
|
|
Alone |
Отправлено: 26 Ноября, 2007 - 13:39:13
|
Super Member
Покинул форум
Сообщений всего: 2393
Дата рег-ции: Дек. 2004
Карма 8
|
awep
Да всё работает нормально.
awep пишет:и еще раз повторю: боты могут не передавать HTTP_REFERER.
Ну так эта именно проблема и была решена.
awep пишет:То есть нужно переформулировать проблему. Я вообще теперь не понимаю, чего тебе нужно. Если просто хочешь собирать статистику, то тупо игнорируй ботов и вообще всех, у кого пустой реферер.
Можно конечно игнорировать, но интереснее знать где они ходят
Само сабой для статистики. А то до этого я знал что они ходят, а теперь знаю ещё и где
awep пишет:glaberzu, бот не обязательно приходит со своего "головного сайта". Он же для начала собирает ссылки со страниц, т.е. "путешествует" по сайту.
У мен вообщем как получается:
С первого раза (т.е. с первой страницы) скрипт не видит бота, а потом нормально - показывает как у всех юзеров ссылочки, где был. |
|
|
awep |
Отправлено: 26 Ноября, 2007 - 15:57:40
|
Наш человек
Покинул форум
Сообщений всего: 304
Дата рег-ции: Дек. 2005
Откуда: Казань
Карма 6
|
Цитата:Какая связь не пойму? Ну и что что ходит - это уже обсудили. Ты мне лучше скажи, откуда он приходит если не с головного сервера. Для меня будет откровение. изначально приходит просто так, со своего сервака(или как это назвать,хз). И начинает собирать ссылки со страницы, потом переходит по ним(или опять же просто приходит на них с себя), собирает ссылки на следующей странице и так далее.
он не может просто так от балды прийти по какому-то адресу. он его должен сначала получить.
короче говоря, он ни откуда не приходит. он тупо скачивает страницу, адрес которой заранее грабит со страниц.
Цитата:Само сабой для статистики. А то до этого я знал что они ходят, а теперь знаю ещё и где imho невыгодно и бессмысленно собирать инфу о том, какие страницы проиндексировал бот. но только imho |
|
|
|
Поиск в теме | Версия для печати |
Страниц (4): « 1 2 3 [4] |
Сейчас эту тему просматривают: 2 (гостей: 2, зарегистрированных: 0, скрытых: 0) |
« PHP/Perl » |
Все гости форума могут просматривать этот раздел. Только администраторы и модераторы могут создавать новые темы в этом разделе. Только администраторы и модераторы могут отвечать на сообщения в этом разделе.
|
|
|