Webalizer

Материал из Мои заметки
Перейти к: навигация, поиск
Мой Webalizer

Обзор Webalizer[править]

Основные возможности Webalizer:

  • Написан на языке программирования С. Очень быстр
  • Поддерживает стандартный Common Logfile Format (CLF), некоторые вариации NCSA Combined Logfile Format, wu-ftpd/proftpd xferlog (FTP) форматы лог файлов
  • Может работать с архивированными лог файлами (gzip, bzip2)
  • Настройка генерируемой статистики может выполняться как для конкретного запуска из коммандной строки, там и для всех запусков из единого файла конфигурации
  • Поддерживается множество языков интерфейса
  • Поддерживается работа с лог файлами неограниченного размера и логами, разбитыми на части
  • Поддерживается произвольная частота ротации лог файлов
  • Полная подержка адресов IPv4, IPv6
  • Включена поддержка distributed DNS lookup и определение местоположения по IP

Установка[править]

sudo aptitude install webalizer

По умолчанию, создается ежедневное задание (cron) для обработки лог файлов.

Запускается после того, как выполнится ротация лог файлов Apache.

Именно поэтому в файле конфигурации прописан путь /var/log/apache2/access.log.1, а не /var/log/apache2/access.log.

Настройка Webalizer[править]

Настройка Webalizer выполняется через редактирование файла /etc/webalizer.conf:

sudo mcedit /etc/webalizer.conf

Настройка Webalizer для нескольких сайтов[править]

Выше указанная конфигурация будет работать только для одного сайта. Но если есть несколько файлов, то возможно настроить Webalizer на обработку лог файлов от нескольких сайтов. Для этого необходимо сделать несколько изменений.

Допустим, имеется следующая структа файловой системы, в которой располагается два и более сайтов:

tree -L 2 /var/www/
/var/www/
|-- www.site1.com
|   |-- htdocs
|   |   `-- stats
|   `-- logs
`-- www.site2.com
    |-- htdocs
    |   `-- stats
    `-- logs

В каждом из сайтов есть директория, где хранятся лог файлы веб сервера - logs. Для начала необходимо скопировать файл конфигурации в каждую директорию:

cp /etc/webalizer.conf /var/www/www.site1.com/logs
cp /etc/webalizer.conf /var/www/www.site2.com/logs

Далее, в каждый из файлов webalizer.conf помещаем следующие строки:

Logfile   access.log
OutputDir ../htdocs/stats/

И наконец, можно выполнить анализ лог файлов:

cd /var/www/www.site1.com/logs
webalizer -q
cd /var/www/www.site2.com/logs
webalizer -q

Флаг -q заставляет приложение отработать без лишнего вывода.

Далее остается лишь обернуть последние команды в один shell скрипт и заменить дефолтный скрипт расписания для Webalizer на созданный.

# Скрипт обновления статистики
$ echo `cd /var/www/www.site1.com/logs` > /var/www/statistics_update.sh
$ echo `webalizer -q` >> /var/www/statistics_update.sh
$ echo `cd /var/www/www.site2.com/logs` >> /var/www/statistics_update.sh
$ echo `webalizer -q` >> /var/www/statistics_update.sh
# Удаление дефолтного расписания $ sudo rm /etc/cron.daily/webalizer
# Настройка расписания $ sudo crontab -e $ 0 * * * * /var/www/statistics_update.sh

Конфигурационный файл[править]

Webalizer по-русски

Представляем вашему вниманию перевод на русский язык конфигурационного файла программы Webalizer, которая используется для обработки лог-файлов веб-серверов Apache и прокси-сервера Squid.

#
# Sample Webalizer configuration file
# Copyright 1997-2000 by Bradford L. Barrett (brad@mrunix.net)
# Перевод на русский язык by Alexey Kazakovsky
#
# Distributed under the GNU General Public License.  See the
# files "Copyright" and "COPYING" provided with the webalizer
# distribution for additional information.
#
# This is a sample configuration file for the Webalizer (ver 2.01)
# Lines starting with pound signs '#' are comment lines and are
# ignored.  Blank lines are skipped as well.  Other lines are considered
# as configuration lines, and have the form "ConfigOption  Value" where
# ConfigOption is a valid configuration keyword, and Value is the value
# to assign that configuration option.  Invalid keyword/values are
# ignored, with appropriate warnings being displayed.  There must be
# at least one space or tab between the keyword and its value.
#
# Начиная с версии 0.98, Webalizer ищет файл конфигурации "по-умолчанию"
# в файле с названием webalizer.conf в текущей директории. Если такой
# файл не найден, Webalizer будет пытаться найти файл /etc/webalizer.conf
# Параметр LogFile определяет название лог-файла веб(прокси) сервера. # Если он не определен здесь или не указан в командной строке, то он # будет прочитан со стандартного устройства ввода (STDIN). Если название # лог-файла заканчивается на .gz (что означает gzip-сжатие), то он будет # распакован "на лету" перед обработкой.
#LogFile /var/lib/httpd/logs/access_log
# LogType определяет тип обрабатываемого лог-файла. Обычно, Webalizer # ожидает на входе файл формата CLF или Combined web server log. # Определив этот параметр, вы можете обрабатывать другие типы лог-файлов: # ftp (xperlog созданные wu-ftp или другими FTP-серверами) или Squid # лог-файлы. LogType может принимать значения 'clf', 'ftp' или 'squid' # (по умолчанию, 'clf').
#LogType clf
# OutputDir задает папку, где вы хотите получить созданные файлы отчетов. # Желательно задавать полный путь, хотя относительные пути тоже должны # работать. Если параметр OutputDir не задан, то созданные файлы будут # появляться в текущей папке.
#OutputDir /var/lib/httpd/htdocs/usage
# HistoryName позволяет указывать название файла "history", # создаваемый Webalizer. "History" файл хранит данные за последние 12 # месяцев, которые были использованы для формирования главной HTML # страницы (index.html). По-умолчанию, название файла принимается # "webalizer.hist" и хранится в папке с отчетами (OutputDir). Если вы # укажите просто имя файла (без пути), он будет храниться в папке с # отчетами (OutputDir). Кроме того, возможно указать полный путь к имени # файла "history" (как абсолютный, так и относительный).
#HistoryName webalizer.hist
# "Incremental processing" означает обработку множества лог-файлов # вместо одного большого лог-файла. Это обычно бывает полезным для # больших веб-сайтов, которые вынуждены делать более одной ротации # лог-файлов в месяц. Webalizer будет сохранять свое внутреннее состояние # перед завершением работы и восстанавливать каждый раз при новом запуске # для того, чтобы продолжить обработку с того места, где она остановилась. # Значение этого параметра может принимать 'yes' или 'no' (по-умолчанию, 'no'). # Файл 'webalizer.current' используется для хранения текущего состояния, # и расположен в папке с отчетами (OutputDir) (если вы не изменили опцию # IncrementalName описание которой находится ниже по тексту). Пожалуйста, # прочитайте секцию "Incremental processing" в файле README перед тем, # как включить эту опцию.
#Incremental no
# IncrementalName позволяет вам указать название файла для хранения # состояния при "Incremental proccessing". Это очень похоже на опцию # HistoryName, где имя файла относительно заданной папке с отчетами # (OutputDir) (если, конечно, вы не указали абсолютный путь к файлу). # По-умолчанию, файл называется "webalizer.current" и хранится в папке # с отчетами (OutputDir). Если вы не определили параметр Incremental # как 'yes', эту опцию конфигугировать нет необходимости.
#IncrementalName webalizer.current
# ReportTitle это строка, который будет показываться в заголовке отчета. # Название имени хоста будет добавляется к концу данной строки через пробел # для формирования полного заголовка. По-умолчанию, # этот параметр равен ""Usage Statistics for".
#ReportTitle Usage Statistics for
# HostName определяет имя хоста для формирования заголовка отчетов. # Этот параметр важен, когда вы формируете отчеты для виртуального # веб-сервера. Если параметр не определен здесь (или не задан в командной # строке), webalizer будет пытаться получить имя хоста через системный # вызов. Если он не приведет к успеху, то данный параметр будет # установлен в "localhost".
#HostName localhost
# HTMLExtension позволяет вам указать расширение имени файлов # для создаваемых HTML-отчетов. По-умолчанию, этот параметр принимает # значение 'html'.
#HTMLExtension html
# PageType позволяет указать Webalizer'у какие типы URL'ов # будут рассматриваться как "страница".
PageType htm* PageType cgi PageType phtml PageType php* PageType pl* PageType asp*
# Параметр UseHTTPS должен быть использован, когда анализ # выполняется для "безопасного" веб-сервера и все линки и URL # должны использовать 'https://' вместо стандартного 'http://'. # Если вам такое необходимо, установите этот параметр в 'yes' # По-умолчанию, данный параметр равен 'no'.
#UseHTTPS no
# DNSCache определяет имя файла, который будет использоваться для # хранения кэша DNS обратных DNS-запросов. Этот файл должен быть # определен, если вы хотите выполнять обратное DNS-преобразование # для всех IP-адресов, которые будут найдены в лог-файле. # Если не указан абсолютный путь, то название будет относительно # по отношению к папке с отчетами (OutputDir). См. файл DNS.README # для дополнительной информации. # # Примечение: DNSCache не поддерживается в Windows-порте программы webalizer.
#DNSCache dns_cache.db
# DNSChildren позволяет вам указать сколько "дочерних" процессов # будут выполнять DNS-преобразования, чтобы создать и обновлять # файл кэша DNS. Если указан номер в данном параметре, то файл кэша # DNS будет создаваться/обновляться каждый раз при запуске Webalizer'a # путем запуска указанного количества дочерних процессов для # DNS-преобразований. Если этот параметр определен, то НЕОБХОДИМО # определить параметр DNSCache. Значение по-умолчанию 0, что отключает # создание/обновление кэша DNS. Количество дочерних процессов может # быть любым от 1 до 100, однако большое количество дочерних процессов # может повлиять на загрузку CPU. Разумное значение колеблется в пределах # от 5 до 20. См. файл DNS.README для дополнительной информации.
#DNSChildren 0
# HTMLPre определяет HTML код для вставки в самое начало файла отчета. # По-умолчанию, это DOCTYPE как показано ниже. Максимальная длина # строки 80 символов, поэтому вы можете использовать несколько HTMLPre # строк одновременно.
#HTMLPre <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
# HTMLHead определяет HTML код для вставки в блок между тэгами <HEAD></HEAD> # сразу после строки <TITLE>. # Максимальная длина строки 80 символов, поэтому, при необходимости, # данный параметр можно разбивать на несколько строк.
#HTMLHead <META NAME="author" CONTENT="The Webalizer">
# HTMLBody определяет код HTML, который будет вставлен вместе с # тэгом <BODY>. Если данный параметр не определен, то по-умолчанию # будет использоваться тот, который показан ниже. # Максимальная длина строки 80 символов, поэтому, при необходимости, # данный параметр можно разбивать на несколько строк.
#HTMLBody <BODY BGCOLOR="#E8E8E8" TEXT="#000000" LINK="#0000FF" VLINK="#FF0000">
# HTMLPost определяет HTML код, который будет вставлен непосредственно
# перед первым тэгом
в документе. Данный код будет следовать
# сразу после заголовком и фразой "summary period"-"Generated on:".
# Так же как и с HTMLHead, вы можете определить столько параметров,
# сколько вы хотите и они будут появляться в выходном документе в
# том порядке, в котором определите их здесь.
# Максимальная длина строки 80 символов, поэтому, при необходимости,
# данный параметр можно разбивать на несколько строк.
#HTMLPost

# HTMLTail определяет HTML код, который будет вставлен в конец каждого # HTML документа (обычно для включения ссылки на вашу домашную # страницу или для добавления немного графики). Он вставляется как элемент # таблицы (т.е. <TD> HTMLкод </TD>) и выровнен по правому краю страницы. # Максимальная длина строки 80 символов, поэтому, при необходимости, # данный параметр можно разбивать на несколько строк.
#HTMLTail <IMG SRC="msfree.png" ALT="100% Micro$oft free!">
# HTMLEnd определяет HTML код, который будет добавлен в самый конец # формируемых отчетов. По-умолчанию, он равен тому, что показано # ниже. Если вы определили HTMLEnd, то вы ДОЛЖНЫ определить тэги # </BODY> и </HTML> в своем коде. # Максимальная длина строки 80 символов, поэтому, при необходимости, # данный параметр можно разбивать на несколько строк.
#HTMLEnd </BODY></HTML>
# Опция Queit выключает все выдаваемые сообщения. Полезна, # когда webalizer запускается через cron, чтобы не рассылать # ненужные email-письма. Опция может принимать значения # "yes" или "no" (по-умолчанию, "no"). Примечание: эта опция # не выключает сообщения о предупреждениях или ошибках (которые # выводятся на stderr).
#Quiet no

# ReallyQuiet выключает все выдаваемые сообщения, включая ошибки # и предупреждения. Опция может принимать значения "yes" или "no" # (по-умолчанию, "no"). Если здесь определено "yes", то данная опция # не может быть переопределена через командную строку. Значение "no" # такого эффекта не дает.
#ReallyQuiet no
# TimeMe позволяет выдавать информацию на экран о времени # после формирования отчетов.
#TimeMe no
# GMTTime позволяет формировать отчеты со временем GMT (UTC), # вместо локального времени. По-умолчанию, отчеты формируются # для зоны времени компьютера на котором выполняется webalizer. # Используйте эту опцию когда вы действительно хотите получать # отчеты в формате UTC, т.к. это может искажать отчетные периоды # на несколько часов (в зависимости от разницы времени между # местной временной зоной и UTC).
#GMTTime no
# Параметр Debug определяет, стоит ли выводить дополнительную # информацию для сообщений об ошибках. Таким образом webalizer # будет показывать ошибочные записи или поля вместо того, чтобы # просто сообщать о найденной ошибке. Значение может принимать # "yes" или "no" (по-умолчанию, "no"). Т.е. этот параметр не следует # определять, если вы не хотите начать получать подробную информацию # о предупреждениях или ошибках. (Примечание: предупреждения и ошибочные # сообщения выводятся на stderr, обычные сообщения выводятся на stdout).
#Debug no
# FoldSeqErr сообщает Webalizer'у игнорировать "ошибки следования". # Это может быть полезно для Netscape или других веб-серверов, # которые кэшируют лог-записи и таким образом не гарантируется, # что лог-записи появляются в лог-файле в правильном хронологическом # порядке. Если этот параметр установлен, то все лог-записи с # неправильным порядком следования будут обрабатываться с меткой времени # последней правильной лог-записи. По-умолчанию, лог-записи с неправильным # порядком следования игнорируются.
#FoldSeqErr no
# Параметр VisitTimeout позволяет вам установить таймаут визитов # (иногда называемый "сессия"). По-умолчанию, данный параметр принимается # 30 минутам, что должно быть разумным для большинства IP-адресов. # Визиты определяются путем поиска времени текущего запроса # и поиска времени предыдущего запроса с одного и того же IP-адреса. # Если разница во времени больше чем параметр VisitTimeout, # это рассматривается как новый визит и счетчик посещений увеличивается. # Параметр измеряется в секундах (по умолчанию, 1800=30 минут).
#VisitTimeout 1800
# Параметр IgnoreHist не должен использоваться в конфигурационном файле, # однако он все-таки может быть полезен в некоторых ситуациах. Если # IgnoreHist установлен в "yes", главый файл "index.html" будет содержать # отчет за содержимое текущих лог-файлов. Это полезно, когда вы хотите # заново сформировать отчеты (например, в случае когда они испортились). # ИСПОЛЬЗУЙТЕ ЭТУ ОПЦИЮ С ОСТОРОЖНОСТЬЮ! # Параметр может принимать значения "yes" или "no". По-умолчанию, "no".
#IgnoreHist no
# Параметр CountryGraph позволяет выключить показ отчета по странам. # Параметр может принимать значения "yes" или "no". По-умолчанию, "yes".
#CountryGraph yes
# Параметры DailyGraph и DailyStats позволяют управлять показом # дневного графика и дневной статистики (в виде таблицы) соответственно. # Параметры могут принимать значения "yes" или "no". По-умолчанию, "yes".
#DailyGraph yes #DailyStats yes
# Параметры HourlyGraph и HourlyStats позволяют управлять показом # часового графика и часовой статистики (в виде таблицы) соответственно. # Параметры могут принимать значения "yes" или "no". По-умолчанию, "yes".
#HourlyGraph yes #HourlyStats yes
# GraphLegend позволяет включать/выключать цвет легенды на графиках # (сами легенды не отключаются). По-умолчанию, цвет включен.
#GraphLegend yes
# GraphLines allows you to have index lines drawn behind the graphs. # I personally am not crazy about them, but a lot of people requested # them and they weren't a big deal to add. The number represents the # number of lines you want displayed. Default is 2, you can disable # the lines by using a value of zero ('0'). [max is 20] # Note, due to rounding errors, some values don't work quite right. # The lower the better, with 1,2,3,4,6 and 10 producing nice results.
#GraphLines 2
# Опция "Top" определяет количество строк в каждой таблице. # По-умолчанию, принимается: # TopSites=30 # TopKSites=10 # TopURLs=30 # TopKURLs=10 # TopReferres=30 # TopAgents=15 # TopCountries=30 # TopEntry=10 # TopExit=10 # TopSearch=20 # TopUsers=20 # Показ таблиц может быть выключен, если параметр установлен в "0".
#TopSites 30 #TopKSites 10 #TopURLs 30 #TopKURLs 10 #TopReferrers 30 #TopAgents 15 #TopCountries 30 #TopEntry 10 #TopExit 10 #TopSearch 20 #TopUsers 20
# Параметры All* позволяет формировать полные отчеты, включающие все # URL, IP-адреса (sites), Referres, User Agents, Search Strings и Usernames. # Если опция включена, то отдельная HTML страница будет создана и ссылка на # нее будет добавлена в конец соответствующей "Top" таблицы. # Есть пара моментов, о которых необходимо упомянуть. Во-первых, количество # элементов в полном отчете должно быть больше, чем в "Top" таблице # (в противном случае, полный отчет будет просто полностью совпадать # с уже имеющимся). Во-вторых, полный отчет будет сформирован для тех таблиц, # которые не выключены. Значения параметров могут принимать "yes" или "no" # (по-умолчанию, "no"). # Будьте осторожны в использовании этой опции - полные отчеты могут быть # очень большими по размеру, особенно отчеты по URL или по IP-адресам (sites).
#AllSites no #AllURLs no #AllReferrers no #AllAgents no #AllSearchStr no #AllUsers no
# Перед обработкой, Webalizer по-умолчанию, удаляет с конца адреса слово # 'index.', чтобы привести URL к единому виду. Например, URL вида # /somedir/index.html будет преобразован в /somedir/ (что на самом # деле означает один и тот же URL). Эта опция позволяет вам указать # дополнительные строки, которые будут интерпретироваться по такому-же # принципу. Вам не нужно указывать здесь 'index.', поскольку в Webalizer # уже встроена эта обработка. Эта опция нужна для определения _дополнительных_ # строк. Пожалуйста, не указывайте здесь ненужные строки, поскольку они # могут сильно снизить производительность. Кроме того, поиск строки # производится в любом месте URL. Так например, строка 'home' преобразует # URL /somedir/homepages/brad/home.html в /somedir/ что, скорее всего, # будет не то, что хотелось.
#IndexAlias home.htm #IndexAlias homepage.htm
# Опции Hide*, Group*, Ignore*, Include* позволяют вам изменить # способ обработки IP-адресов (sites), URL, Referrers, User Agents # и Usernames. # Опция Ignore* укажет Webalizer'у полностью игнорировать # такие записи как будто они вообще не существуют (и таким образом, # они не будут учитываться во всех счетчиках). # Опция Hide* будет препятствовать появлению этих записей в 'Top' # таблицах, однако эти записи будут учитыватся во всех счетчиках. # Опция Group* позволит группировку одинаковых объектов. Группировка # объектов происходит на основе заданных шаблонов. Группированные # объекты показываются в 'Top' таблицах и опционально могут быть # выделены жирным (BOLD) и/или затемнены (shaded). Группы не могут быть # спрятаны и они не считаются в общих счетчиках. Опции Group* не прячут # (по-умолчанию) все элементы, которые группируют. Если вы хотите # спрятать все сгруппированные записи, примените опцию Hide* с идентичными # параметрами (см. пример ниже). Кроме того, Group* опция может иметь # дополнительную (необязательную) метку, которая будет показываться вместо # шаблонов группировки. Такая метка должна быть отделена от шаблона одним # пробелом или символом табуляции. # # Параметры (шаблоны) могут начинаться или заканчиваться символом '*', # что означает любую последовательность символов. Например, для строки # www.yourmama.com, шаблоны "*mama.com" и "www.your*" будут производить # совпадения.
# Ваш собственный сайт должен быть hidden #HideSite *tmeter.ru #HideSite localhost
# Ваш собственный сайт дает больше всего реферралов #HideReferrer tmeter.ru/
# А это скрывает запросы без реферралов (т.е. прямые запросы) #HideReferrer Direct Request
# Обычно, это требуется спрятать из отчета HideURL *.gif HideURL *.GIF HideURL *.jpg HideURL *.JPG HideURL *.png HideURL *.PNG HideURL *.ra
# Hiding agents is kind of futile #HideAgent RealPlayer
# Также можно скрывать пункты отчетов по имени пользователя #HideUser root #HideUser admin
# Опции группировки #GroupURL /cgi-bin/* CGI Scripts #GroupURL /images/* Images
#GroupSite *.aol.com #GroupSite *.compuserve.com
#GroupReferrer yahoo.com/ Yahoo! #GroupReferrer excite.com/ Excite #GroupReferrer infoseek.com/ InfoSeek #GroupReferrer webcrawler.com/ WebCrawler
#GroupUser root Admin users #GroupUser admin Admin users #GroupUser wheel Admin users
# Следующие опции помогут сформировать отчет только # по браузерам и не выводить все остальные отчеты.
#GroupAgent MSIE Micro$oft Internet Exploder #HideAgent MSIE #GroupAgent Mozilla Netscape #HideAgent Mozilla #GroupAgent Lynx* Lynx #HideAgent Lynx*
# HideAllSites позволяет скрыть индивидуальные сайты (IP-адреса) # из отчетов. Это, в частности, полезно в сочетании с опцией # GroupDomain (а также в других ситауациях) когда вы хотите получить # отчет только по сгруппированным сайтам (IP адресам) (с опцией # GroupSite...) Значение этого параметра может быть 'yes' или 'no' # (по-умолчанию, 'no', что позволяет выводить в отчеты индивидуальные # сайты (IP адреса)
#HideAllSites no
# Параметр GroupDomains позволяет вам группировать отдельные имена # хостов в соответвующие домены. Значение данного параметра определяет # уровень группировки и может быть истолкован как "количество точек" # которые будут отображены. Для примеры, если посещенный хост называется # cust1.tnt.mia.uu.net и параметр GroupDomains установлен в 1, то в # результате в отчетах будет отображаться "uu.net". Если GroupDomains # установлен в 2, то в результате получим "mia.uu.net". # Значение по умолчанию "0" отключает эту функцию. Домены будут # сгруппированы только в том случае, если они не попадают под действие # параметров "GroupSite", которые имеют более высокий приоритет.
#GroupDomains 0
# GroupShaing включает отображение теней в отчетах для подсветки # сгруппированных строк. Полезно, когда у вас есть много групп # и индивидуальных записей, которые перемешаны в отчеты и вы хотите # выделить группы чтобы они "бросались в глаза". Значение может быть # 'yes' или 'no' (по-умолчанию, 'yes')
#GroupShading yes
# GroupHighlight включает жирный шрифт для отображения сгруппированных # записей в отчетах. Значение может быть 'yes' или 'no' (по-умолчанию, # 'yes').
#GroupHighlight yes
# Ignore* параметр позволяет вам полностью игнорировать записи в лог-файлах # при совпадении имени хоста, URL, user agent, refferer или username. # Webalizer спроектирован для формирования точных отчетов, поэтому # пользоваться данной опцией нужно с особенной аккуратностью. # Использование этой опции подобно параметру Hide*, где значение может # начинаться или оканчиваться на '*'.
#IgnoreSite bad.site.net #IgnoreURL /test* #IgnoreReferrer file:/* #IgnoreAgent RealPlayer #IgnoreUser root
# Параметр(ы) Include* позволяет вам принудительно включать в отчеты # лог-записи в которых найдены совпадения на основе hostname, URL, # user agent, referrer или username. Этот параметр обычно используется # в сочетании с параметром Ignore*. Внимание! Использование Ignore/Include # комбинаций для выборочной обработки частей веб-сайта крайне неэффективно! # Избегайте использование этой функции если возможно (лучше предварительно # фильтруйте записи командой grep в отдельный лог-файл).
# Пример: Показываем статистику только для страницы Joe User #IgnoreURL * #IncludeURL ~joeuser*
# или на основе имени аутентифицированного пользователя #IgnoreUser * #IncludeUser someuser
# MangleAgents позволяет вам указать как Webalizer будет преобразовывать # имена user agent'ов. Это позволяет иметь несколько уровней детализации # для отображения имен user agents в статистике. Существует шесть уровней # которые можно указать, которые определяют различные уровни отображения. # Уровень 5 показывает только название браузера (MSIE или Mozilla) и # старший номер версии. Уровень 4 добавляет младший номер версии (с одной # цифрой). Уровень 3 показывает младший номер с двумя цифрами. Уровень 2 # добавляет остальные названия в под-уровне версии браузера (например, # Mozilla/3.01Gold or MSIE 3.0b). Уровень 1 включает показ типа операционной # системы пользователя. Уровень 0 (по-умолчанию) показывает полное поле # user agent без изменений. Имена user agent, которые не могут быть # преобразованы, остаются без изменений.
#MangleAgents 0
# Параметры SearchEngine позволяют описать поисковые системы и их URL # запросы. Это используется для построения отчетов какие запросы от # поисковых систем используются чтобы найти ваш сайт. Первое слово в # параметре - это подстрока, используемая для поиска совпадений в поле # referrer чтобы определить поисковую систему. Второе слово в параметре - # переменная URL, которая используется поисковой системой для определения # предмета поиска.
SearchEngine yahoo.com p= SearchEngine altavista.com q= SearchEngine google.com q= SearchEngine eureka.com q= SearchEngine lycos.com query= SearchEngine hotbot.com MT= SearchEngine msn.com MT= SearchEngine infoseek.com qt= SearchEngine webcrawler searchText= SearchEngine excite search= SearchEngine netscape.com search= SearchEngine mamma.com query= SearchEngine alltheweb.com query= SearchEngine northernlight.com qr=
# Параметры Dump* позволяют создавать так называемые "файлы дампов" # отчетов которые, по-сути, являются текстовыми файлами с символом # табуляции в качестве разделителя. Файлы дампов могут использоваться # для экспорта финальных отчетов в различные базы данных или электронные # таблицы.
# DumpPath определяет путь к файлам дампов. Если он не указан, # по-умолчанию будет использоваться директория для отчетов. Для определения # директории, не используйте завершающий слэш ('\').
#DumpPath /var/lib/httpd/logs
# Параметр DumpHeader указывает, будет ли заголовочная запись # выводится в файл дампов. Заголовочная запись - это первая строка, # которая содержит описание столбцов. Обычно, файлы дампов предназначены # для дальнейшего экспорта в базы данных и в такой заголовочной записи # не нуждаются. Параметр может принимать значение 'yes' или 'no' # (по-умолчанию 'no')
#DumpHeader no
# DumpExtension позволяет вам указать расширение для имени файлов дампов. # По-умолчанию, расширение для таких файлов принимается "tab" (однако, # если вы предпочитаете "csv", то можете изменить этот параметр).
#DumpExtension tab
# Эти параметры определяют вывод в дамп отдельных таблиц. Значение # может быть 'yes' или 'no' (по-умолчанию, 'no')
#DumpSites no #DumpURLs no #DumpReferrers no #DumpAgents no #DumpUsers no #DumpSearchStr no
# Конец файла конфигурации. Удачи!