14. 5. Интернет как единая система ресурсов

Работать в Сети и не использовать все ее ресурсы просто неразумно. Благодаря развивающимся с огромной скоростью технологиям Интернета, информационные ресурсы Сети связываются все теснее. Если раньше компьютерные сети в основном служили для обмена письмами по электронной почте, то сегодня мы рассматриваем Интернет как единую систему ресурсов. Это и комнаты для бесед — чаты, и телеконференции, и сетевые новости, и форумы, и служба пересылки файлов FTP, и электронная почта, и IP-телефония, и даже электронная коммерция.

14.5.1. Гипертекстовая система WWW

«Всемирная паутина» (WWW — World Wide Web) — самый популярный и интересный сервис Интернета, популярное и удобное средство работы с информацией. Самое распространенное имя для компьютера в Интернете сегодня — www, больше половины потока данных Интернета приходится на долю WWW. Количество серверов WWW сегодня нельзя оценить точно, но по некоторым

305

оценкам их более 30 млн. Скорость роста WWW даже выше, чем у самой сети Интернет.

WWW — это всемирное хранилище информации, в котором информационные объекты связаны структурой гипертекста. Гипертекст — это прежде всего система документов с перекрестными ссылками, способ представления информации при помощи связей между документами. Поскольку система WWW позволяет включить в эти документы не только тексты, но и графику, звук и видео, гипертекстовый документ превратился в гипермедиа-документ.

Гипертекст или гипертекстовые ссылки являются «ключевой фигурой» в способе представления информации в WWW.

Немного истории WWW. «Всемирная паутина» (WWW) — одна из важных составных частей всемирной сети. И у нее — своя история.

Это интересно

В Швейцарии находится Европейская лаборатория по изучению физических частиц (CERN). В 1980 г. человек по имени Тим Бернес-Ли, работавший в то время в Церне, начал разработку проекта глобальной компьютерной сети, которая обеспечивала бы физикам всего мира доступ к различной информации. На это ушло девять лет.

В 1989 г. после многолетних технических экспериментов мистер Тим предложил конкретный вариант, который и явился началом World Wide Web, или сокращенно WWW.

Со временем многие поняли, что такими услугами смогут пользоваться разные люди, не только физики. WWW стала быстро расти. Многие люди помогали ей в этом: одни разрабатывали аппаратные средства, другие создавали программное обеспечение, развивающее WWW, третьи улучшали линии связи. Все это позволило ей стать тем, чем она сейчас является — «всемирной паутиной».

Принципы работы клиента и сервера. WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипермедийный документ — документ, состоящий из частей с разнообразным представлением информации (текст, звук, графика, трехмерные объекты и т.д.), в котором каждый элемент может являться ссылкой на другой документ или его часть. Ссылки в документах WWW организованы таким образом, что каждый информационный ресурс в глобальной сети Интернет однозначно адресуется, и документ, который вы читаете в данный момент, способен ссылаться как на другие документы на этом же сервере, так и на документы (и вообще на ресурсы Интернета) на других компьютерах Интернета. Причем пользователь не замечает этого и

306

работает со всем информационным пространством Интернета как с единым целым.

Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Интернета. Более того, большинство программ-клиентов WWW (браузеры, навигаторы) не просто понимают такие ссылки, но и являются программами-клиентами соответствующих сервисов: FTP, gopher, сетевых новостей Usenet, электронной почты и т.д. Таким образом, программные средства WWW являются универсальными для различных сервисов Интернета, а сама информационная система WWW играет интегрирующую роль. Перечислим некоторые термины, использующиеся в WWW.

Первый термин — html (hypertext markup language — язык разметки гипертекста). Это формат гипермедийных документов, использующихся в WWW для предоставления информации. Формат этот не описывает то, как документ должен выглядеть, он описывает структуру и связи документа. html — это набор управляющих последовательностей команд, содержащихся в html-документе и определяющих те действия, которые программа просмотра (браузер) должна выполнить при загрузке этого документа. Это означает, что каждая страница является обычным текстовым файлом, содержащим текст, который виден всем, и некоторые инструкции для программы, невидимые для людей. Эти инструкции условно можно разделить на два типа: описание внешнего вида документа и ссылки на другие ресурсы (другие страницы, изображения, серверы). Именно эти ссылки и делают из текста гипертекст.

Внешний вид документа на экране пользователя определяется навигатором. Если вы работаете за графическим или текстовым терминалами, то в каждом случае документ будет выглядеть посвоему, но структура его останется неизменной, поскольку она задана форматом html. Имена файлов в этом формате обычно оканчиваются на html (или имеют расширение htm в случае, если сервер работает под MS DOS или Windows).

Второй термин — URL (uniform resource locator — универсальный указатель на ресурс). Так называются те самые ссылки на информационные ресурсы Интернета.

Еще один термин — http (hypertext transfer protocol — протокол передачи гипертекста). Это название протокола, по которому взаимодействуют клиент и сервер WWW.

WWW — сервис прямого доступа, требующий полноценного подключения к Интернету и, более того, часто требующий быстрых линий связи в случае, если документы, которые вы читаете, содержат много графики или другой нетекстовой информации. Однако существуют мосты, позволяющие получать информацию, содержащуюся в WWW, посредством электронной почты.

307

Возможность такая есть, но таких мостов мало, да и толку от них немного. Чтобы успешно использовать возможности WWW, требуется прямой доступ в Интернет, а при его отсутствии теряются многие плюсы, создавшие WWW сегодняшнюю популярность. Кроме того, некоторые возможности, имеющиеся при обычной работе, просто недоступны через электронную почту. Это, в основном, относится к элементам интерактивности в WWW. Например, в языке html поддерживаются формы. Пользователь вводит в них некоторую информацию, которая затем может передаваться на сервер. Таким образом заполняются анкеты, регистрационные карты, проводятся социологические опросы.

Практически любая информация, которая предоставляется в публичный доступ, отображается средствами WWW. Если какаято информация не может быть помещена в WWW, то это обусловлено некоторыми ограничениями и недостатками WWW. Во-первых, соединение между клиентом и сервером WWW одноразовое: клиент посылает запрос, сервер выдает документ, и связь прерывается. Это значит, что сервер не имеет механизма уведомления клиента об изменении или поступлении новых данных.

Проблема решается сегодня несколькими способами, в частности, разрабатывается новая версия протокола http, которая будет позволять длительное соединение, передачу данных в несколько потоков, разделение каналов передачи данных и управление ими.

Побродим по WWW. Браузер — это своего рода окно в WWW.

Чтобы увидеть несметные богатства Сети, необходимо иметь специальное окно, которое «прорубает» программа просмотра — браузер (иногда в литературе ее называют «броузер»). Как окно, которое русский царь Петр I в свое время прорубил в Европу. И хоть физические размеры окна браузера невелики, «петровское» окно в Европу — лишь узенькая щелочка по сравнению с ним.

Это интересно

Browser (англ.) означает посетитель магазина, рассматривающий товары, перелистывающий книги, так трактует это слово весьма авторитетный «Англо-русский словарь» под ред. Ю. Апресяна.

На вопрос: какие браузеры используются чаще! — нет однозначного ответа. Сейчас чаще других используются браузеры фирм Netscape и Microsoft. Они фактически стали стандартами для Интернета. Правда, это произошло совсем недавно.

Это интересно