"> "> "> "> ">
 KOI | MAC | WIN | DOS | LAT


Номер 25 http://www.cityline.ru/vi/ 17 января 1997 г.



Предыдущие номера:

0. Заглавная страница/vi/index.html">
1. Поспорим о вкусах?/vi/24dec1996.htm">
2. Даешь коммуникатор!/vi/25dec1996.htm">
3. Дела юбилейные/vi/26dec1996.htm">
4. Откуда что берется/vi/27dec1996.htm">
5. Страшный вирус-I/vi/28dec1996.htm">
6. Страшный вирус-II/vi/29dec1996.htm">
7. Страшный вирус-III/vi/30dec1996.htm">
8. Новый Год на линии/vi/31dec1996.htm">
9. Новогодние ресурсы/vi/01jan1997.htm">
10. Гуттенберг-97/vi/02jan1997.htm">
11. Провайдер на завтра/vi/03jan1997.htm">
12. После написанного/vi/04jan1997.htm">
13. Протокол общения/vi/05jan1997.htm">
14. IRC: технология/vi/06jan1997.htm">
15. Где деньги лежат/vi/07jan1997.htm">
16. Фруктовые фанаты/vi/08jan1997.htm">
17. Фруктовые фанаты-2/vi/09jan1997.htm">
18. Соло на ММХ-200/vi/10jan1997.htm">
19. Из переписки/vi/11jan1997.htm">
20. Рука руку моет/vi/12jan1997.htm">
21. С полупраздником/vi/13jan1997.htm">
22. Война за стандарты/vi/14jan1997.htm">
23. IRC: кроме техники/vi/15jan1997.htm">
24. Русское поле/vi/16jan1997.htm">


Заметка двадцать пятая
АМБАРНЫЕ КНИГИ WWW

Для того, чтобы прочесть эту заметку, тебе, читатель, нужно запустить на своем компьютере программу, которой мы все никак русского названия не подберем. В первой заметке грозились называть ее гляделкой, но тут посыпалась масса возражений, среди которых наиболее веским мне кажется уточнение Алекса Дрибина, что гляделки в русском языке - это не Netscape Navigator и Microsoft Internet Explorer с Ариадной, а вовсе даже напротив того - глаза. На мое встречное предложение называть эти программы смотрелками Алекс резонно заметил, что вообще от этого суффикса разит медвежатиной, виннипуховщиной, заходеровщиной и проч., по явной аналогии с сопелками, вопилками и другими причиндалами из известного мультфильма. Возразить нам на это нечего, но ни броузер (термин с www.apple.ru), ни брайзер, ни милый сердцу Паравозова навигатор все равно на вооружение брать не хочется. Так что пока - неясно, как называть программу, которую тебе, дорогой читатель, надо запустить для чтения этих заметок.

Однако факт остается фактом: запустить ее надо. Программа эта обратится к серверу www.cityline.ru и затребует с него гипертекстовый документ (файл), с картинками, линками и всеми пирогами. Каковой документ будет с сервера послан. И ты, читатель, его прочтешь. Такова надводная часть айсберга.

Подводная часть на порядок интереснее. Запрос, направленный серверу твоей гляделкой, включает гораздо больше сведений, чем просто адрес затребованной страницы. Прежде всего, в запросе ведь должен фигурировать и обратный адрес - иначе куда бы сервер посылал свой ответ? Адрес клиента-заказчика существует в двух видах:

Цифровой адрес:
Словесный адрес:

Два этих адреса могут, конечно, совпадать, но в любом случае, IP адрес, состоящий из 4 чисел (значений байта) должен присутствовать. Иначе информационный запрос просто не может быть обслужен.

Кроме своего адреса, программа-клиент шлет еще серверу о себе дополнительные сведения: как она называется, в какой системе, и какие в принципе файлы способна воспринимать (чтобы не слали лишнего; скажем, клиент в текстовом режиме не должен ждать загрузки картинок, если он их все равно не собирается показывать). Иногда информация о названии клиента и адресе пользователя подменяется информацией о том proxy-сервере, через который идет его запрос:

Данные клиента:
Типы файлов:

Кроме того, многие серверы имеют обыкновение сообщать также информацию о том, с какой страницы они получили ссылку на данный документ. Такая отсылка называется REFERER. Если ее нет (то есть когда вы запрашиваете документ не через ссылку в другом документе, а прямым вводом адреса с командной строки своей, извиняюсь, гляделки), то значение переменной REFERER будет равно (none), то есть нет никакой реферирующей страницы - глухая несознанка. Если же вы обнаружили текущий документ через поисковую машину, то в переменной REFERER будут написаны все ключевые слова, при помощи которых вы искали информацию.

Реферер:

Мы перечислили лишь некоторые основные параметры, которые передаются от клиента на сервер практически при любой погоде. В принципе, если бы сервер об этом грамотно спрашивал, клиент мог бы рассказать ему очень много такой информации, которая не имеет отношения ни к WWW, ни к HTTPD, ни к Интернету. В свое время вышла даже отдельная версия Нетскейпа (2.02, кажется), которая была специально настроена, чтобы не выдавать серверам - без согласия пользователя - его электронный почтовый адрес и другие настройки. Нетскейп, возможно, и отчитался перед пользователем по поводу закрытых дырок, однако серверы сегодня по-прежнему очень много могут разведать о клиенте, не испросив предварительно его согласия на такие исследования.

Впрочем, сбор тайной или приватной информации через запросы по WWW - это тема интересная скорее для банков или правительственных служб (решающих эту проблему с помощью ведомственных proxy серверов, firewall'ов и других дигитальных эквивалентов колючей проволоки). Практическое значение всех этих сведений, сообщаемых серверу о клиенте в порядке рутины, относится больше к области статистики, чем промышленного шпионажа.

При компиляции любого WWW сервера и его последующем конфигурировании администратор может задать опции по ведению учета всех поступивших запросов. Среди стандартных записей, которые ведут WWW серверы типа NCSA httpd, главным является файл, описывающий параметры всех принятых запросов: время их поступления, адрес клиента, название затребованного ресурса, результат (успех или неудачу) трансмиссии. Этот файл в конвенциях NCSA называется access_log. В другой файл, под названием error_log записываются с той же степенью подробности все запросы, на которые система ответила тем или иным видом отказа. Еще один файл, названный в той же конвенции agent_log предназначен для информации о типах клиентов, которыми пользуются посетители сервера. Наконец, в файл referer_log записывается информация о том, с каких реферирующих страниц попадают посетители на данный сервер. Этот вид записей очень полезен и для оценки эффективности различных видов интернетовской рекламы, и для понимания механизмов работы поисковых машин, и для общей ориентации в мире гипертекстовых ссылок.

Ведение записей (логов) - дело полезное, но муторное. Во-первых, записывание каждого посетителя в несколько разных файлов учета одновременно отнимает время у машины, программы и пользователя (даже если он этого и не замечает особо). Во-вторых, сами по себе логи сервера - чтение не слишком увлекательное. Извлечь из них рациональное зерно и какую-то мораль позволяют специально написанные статистические пакеты, вроде getstats, WWWstats, Analog, AccessWatch, WebTrends, MKStats и т.д. С продуктами работы одного из таких пакетов читатель может ознакомиться по адресу http://www.cityline.ru/~and/, где публикуется ежедневная статистика доступа ко всем ресурсам на WWW-сервере Cityline. Статистика, оформленная в виде графиков и таблиц, наглядно представляет сравнительные данные о популярности различных страниц сервера, о числе посещений и о происхождении посетителей. Все данные этой статистики получены путем анализа основного файла access_log. Для статистического обсчета дополнительных записей - agent_log и referer_log у нас используются специально написанные анализаторы Графа и Sgt на языке PERL, генерирующие два весьма простых, но информативных файла - сведения о программах, которыми пользуются наши посетители, и о страницах, откуда к нам посылается наибольшее количество визитеров.



Copyright © 1997 Cityline Ltd.
Copyright © 1997 Антон Носик
Дизайн - Арт. Лебедев