Гультяев Алексей Константинович
Шрифт:
ПРИМЕЧАНИЕ: Если помимо предоставления информации сайт обеспечивает доступ к нескольким сервисам Интернета (электронной почте, рассылкам новостей, электронному магазину), то его обычно называют порталом.
Как правило, физически сайт размещается в одной папке на жестком диске компьютера, подключенного к Сети. Эта папка может содержать другие вложенные папки для более удобной работы с файлами сайта. Например, может быть создана отдельная папка для рисунков, включаемых в HTML-страницы, еще одна – для звуковых файлов или для флэш-фильмов и т. д. (рис. 1.10). В отдельной папке также хранятся файлы с программами-сценариями, обеспечивающими интерактивность сайта.
Если посетители Интернета имеют доступ к единственному сайту, размещенному на данном компьютере, то можно считать (с некоторыми оговорками), что адрес сайта совпадает с доменным именем компьютера. Например, если на компьютере, имеющем имя bank и входящем в домен. spb, который, в свою очередь, является частью домена. ru, размещен единственный сайт, то адресом сайта можно считать доменное имя bank.spb.ru. Обычно компьютер, на котором размещен сайт, называют веб-сервером, поскольку он «обслуживает» запросы, поступающие от клиентов– посетителей Интернета (точнее, от браузеров посетителей).
Рис. 1.10. Типовая структура небольшого сайта.
ПРИМЕЧАНИЕ: Следует отметить, что на таком компьютере должно быть установлено дополнительное программное обеспечение, предназначенное для обработки поступающих запросов (отправки запрошенных страниц). Кроме того, серверное программное обеспечение выполняет ряд дополнительных задач. Например, оно может проверять, разрешен ли данному пользователю доступ к конкретной странице сайта.
В большинстве случаев начальная (главная) страница сайта размещается непосредственно в корневой папке сайта, и веб-сервер при поступлении адреса сайта от клиента пересылает браузеру в качестве ответа на запрос именно эту страницу. Обычно такой файл называется Index.html, Default.html или Home.html (см. рис. 1.10).
Чтобы обратиться к конкретному ресурсу (файлу), входящему в состав сайта, недостаточно доменного имени компьютера. Необходимо указать специальный адрес, который называется Uniform Resource Locator (универсальный адрес ресурса), сокращенно URL.
Поскольку физическим носителем (точнее, хранителем) ресурса является компьютер, то основу URL составляет доменное имя этого компьютера. Однако для обращения к конкретному файлу-ресурсу требуется указывать дополнительные сведения – маршрут доступа к необходимому файлу. Маршрут доступа отделяется от доменного имени наклонной чертой (слэшем). Например, обращение к файлу Cat.gif, находящемуся в папке Images, может выглядеть так: bank.spb.ru/Images/Cat.gif.
Наряду с адресом ресурса URL обычно содержит также наименование протокола, который должен использоваться при работе с запрашиваемым ресурсом.
Вот наиболее распространенные протоколы (методы) доступа к ресурсам Интернета:
• http – сокращение от Hypertext Transfer Protocol (протокол пересылки гипертекста); применяется для доступа к гипертекстовым документам;
• ftp – сокращение от File Transfer Protocol (протокол передачи файлов); применяется для обращения к файлам, хранящимся в FTP-архивах;
• news – применяется для доступа к новостям системы Usenet;
• file – применяется для доступа к локальным файлам.
Например, для обращения к упоминавшемуся выше графическому файлу Cat.gif, расположенному в FTP-архиве public, может использоваться такой URL: ftp://public.spb.ru/Images/Cat.gif.
Подробнее о поиске информации, отличающейся от гипертекстовых документов, будет рассказано в главах 2 и 3.
Итак, в общем случае URL выглядит следующим образом (рис. 1.11):
[тип протокола]:// [доменное имя компьютера]/[маршрут доступа].
Рис. 1.11. Структура URL.
ПРИМЕЧАНИЕ: Иногда (при наличии соответствующего сетевого оборудования) компьютер может быть не только подключен к Интернету, но и включен в состав одной или нескольких локальных сетей. В этом случае целесообразно указывать в URL наименование входного порта, используемого для подключения к Интернету. Например, URLport1/path/file.htm означает, что ресурс расположен на компьютере с доменным именем www.wired.com и что для доступа к нему необходимо использовать протокол HTTP через IP-порт с именем port1.
В заключение отметим, что далеко не всегда имена папок и файлов, используемые в URL, совпадают с именами физических папок и файлов, расположенных на веб-сервере. Одна из причин – попытка владельцев сайта защитить информацию от злоумышленников. Другая причина состоит в том, что современные программные средства позволяют создавать запрашиваемые документы динамически. То есть до тех пор, пока документ не понадобится посетителю сайта, он вообще может не существовать. Характерный пример использования такой технологии – поиск и выдача информации из базы данных.