|
Технология гипермедиа world wide web и её компоненты
СОДЕРЖАНИЕ ВВЕДЕНИЕ 3 1. СИСТЕМА ГИПЕРМЕДИА WWW 5 2. ОСНОВНЫЕ ПРИНЦИПЫ РАБОТЫ WEB 10 2.1. Основные компоненты WWW-технологии. 10 2.2. Язык разметки гипертекста HTML. 10 2.3. Web-страницы (документы HTML). 12 2.4. Унифицированные локаторы ресурсов (URL). 13 2.5. HTTP- протокол передачи гипертекста. 17 2.6. Общий шлюзовой интерфейс CGI. 18 2.7. Структура программного обеспечения WWW-технологии. 19 2.8. Обмен информацией в Internet/intranet с использованием WWW-технологии. 21 3. НОВЫЕ ТЕХНОЛОГИИ И ТЕНДЕНЦИИ РАЗВИТИЯ 23 3.1. Java. 23 3.2. VRML. 27 ЗАКЛЮЧЕНИЕ 29 ЛИТЕРАТУРА 31 ВВЕДЕНИЕ В конце двадцатого века компьютерная революция вступила в новую фазу, что привело к значительным изменениям жизни людей. Компьютеры остаются одним из важнейших инструментов технического прогресса, широко используемым в научной работе и для автоматизации производственных процессов. Однако в последнее время еще большее распространение персональные компьютеры находят в повседневной жизни. Компьютерные игры, электронная почта, всемирная сеть Internet и многие другие новые реалии вошли в жизнь людей также, как телефон, радио и телевидение. Эти изменения во многом обусловлены успехами двух новых информационных технологий, которые быстро развиваются с начала 90-х годов - технологий мультимедиа и телекоммуникаций. Термином мультимедиа (multimedia) обозначаются интерактивные компьютерные системы, обеспечивающие работу с разнообразными типами данных - неподвижными и движущими изображениями (включая видео), а также с текстом, речью и высококачественным звуком. В соответствующих базах данных хранится не только текстовая информация, но и оцифрованные видеоклипы, звуки и музыка, факсимильные изображения и многое другое. Современные системы управления мультимедийными базами данных поддерживают технологию клиент /сервер, а сами базы данных оказываются, распределенными по узлам всемирной компьютерной сети. При этом возникает новая ситуация, которая в ближайшие годы будут определять развитие цивилизации - большинство знаний, накопленных человечеством, оказывается интегрированным в глобальную информационную систему, а доступ к этим знаниям открыт для каждого члена общества. С развитием технологий мультимедиа появились также системы, обеспечивающие возможность установления гиперсвязей для изображений. Они позволяют рассматривать фрагменты изображений, хранящиеся как отдельные изображения, полученные с большей детализацией, а также устанавливать связи фрагментов изображений с другими изображениями, поясняющим текстом, звуком и т. п. Такие системы иногда называют "гипермедиа", но чаще используют прежний термин - "гипертекст". 1. СИСТЕМА ГИПЕРМЕДИА WWW WWW (World Wide Web - всемирная паутина) - самый популярный и интересный сервис Интернет сегодня, самое популярное и удобное средство работы с информацией. Самое распространенное имя для компьютера в Интернет сегодня - www, больше половины потока данных Интернет приходится на долю WWW. Количество серверов WWW сегодня нельзя оценить сколько-либо точно, но по некоторым оценкам их более 30 тысяч. Скорость роста WWW даже выше, чем у самой сети Интернет. Сегодня WWW - самая передовая технология Интернет, и она уже становится массовой технологией - возможно, недалек тот день, когда каждый человек, знающий, что такое телефон, будет знать, что такое WWW. Некоторые люди, особенно журналисты, думают, что Web - это и есть Internet. Но это совершенно неверно, так как Web - только одна из многих служб, использующихся в Internet. Web такая, какой мы ее знаем, была изобретена в 1980 году в CERN (европейской лаборатории физики элементарных частиц). Сотрудник этой лаборатории Тим Бернерс Ли создал программу под названием Enquire Within Upon Everything (Enquire), чтобы отследить связи между документами, включив в них ссылки друг на друга. И, как сказал Тим в 1994 году, давая интервью корреспондентам издания Internet World, он хотел найти более удобный и логичный способ представления информации. В 1989 году Бернерс Ли предложил глобальное обобщение этой идеи - связать гипертекстовые документы по всему миру. Информация должна содержаться на серверах, а для ее просмотра нужно использовать особые программы-броузеры. С тех пор началось бурное развитие Web. В первые же месяцы использования она обошла по популярности службу Gopher. Для работы в Web необходима программа-клиент, которая называется Web-броузером. Одним из первых броузеров была программа Mosaic, разработанная основателем фирмы Netscape Марком Эндрисеном (Маге Andreesen). Первая версия Mosaic была выпущена центром NCSA (National Center for Supercomputing Applications - Национальный центр суперкомпьютерных приложений) в 1993 году. В 1994 году Эндрисен покинул NCSA, чтобы основать фирму Mosaic Communications, ныне известную под именем Netscape. С тех пор бьыо выпущено четыре версии броузера Netscape Navigator, и в настоящее время он конкурирует на равных с броузером фирмы Microsoft - Internet Explorer. Подробное описание WWW невозможно в рамках этой работы, поэтому здесь будут приведены самые общие понятия и представления, которые нужно иметь о WWW, как об одном из сервисов Интернет. WWW - информационная система, которой весьма непросто дать корректное определение. Вот некоторые из эпитетов, которыми она может быть обозначена: гипертекстовая, гипермедийная, распределенная, интегрирующая, глобальная. Ниже будет показано, что понимается под каждым из этих свойств в контексте WWW. WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипермедийный документ - документ, состоящий из частей с разнообразным представлением информации (текст, звук, графика, трехмерные объекты и т.д.), в котором каждый элемент может являться ссылкой на другой документ или его часть. Ссылки эти в документах WWW организованы таким образом, что каждый информационный ресурс в глобальной сети Интернет однозначно адресуется, и документ, который читается в данный момент, способен ссылаться как на другие документы на этом же сервере, так и на документы (и вообще на ресурсы Интернет) на других компьютерах Интернет. Причем пользователь не замечает этого, и работает со всем информационным пространством Интернет как с единым целым. Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Интернет. Более того, большинство программ-клиентов WWW (browsers, навигаторы) не просто понимают такие ссылки, но и являются программами-клиентами соответствующих сервисов: ftp, gopher, сетевых новостей Usenet, электронной почты и т.д. Таким образом, программные средства WWW являются универсальными для различных сервисов Интернет, а сама информационная система WWW играет интегрирующую роль. Вот некоторые термины, использующиеся в WWW - конечный пользователь может их и не знать, но рано или поздно они встретятся и они не должны вызвать недоумение. Первый термин - html (hypertext markup language, язык разметки гипертекста). Это формат гипермедийных документов, использующихся в WWW для предоставления информации. Формат этот не описывает то, как документ должен выглядеть, но его структуру и связи. Внешний вид документа на экране пользователя определяется навигатором - если Вы работаете за графическим или текстовым терминалом, то в каждом случае документ будет выглядеть по-своему, но структура его останется неизменной, поскольку она задана форматом html. Имена файлов в формате html обычно оканчиваются на html (или имеют расширение htm в случае, если сервер работает под MS-DOS или Windows). Второй термин - URL (uniform resource locator, универсальный указатель на ресурс). Так называются те самые ссылки на информационные ресурсы Интернет. Еще один термин - http (hypertext transfer protocol, протокол передачи гипертекста). Это название протокола, по которому взаимодействуют клиент и сервер WWW. WWW - сервис прямого доступа, требующий полноценного подключения к Интернет, и более того, часто требующий быстрых линий связи, в случае, если документы, которые Вы читаете, содержат много графики или другой нетекстовой информации. Однако существуют мосты, позволяющие получать информацию, содержащуюся в WWW, посредством электронной почты. Возможность такая есть, но таких мостов мало, да и толку от них немного - чтобы успешно использовать возможности WWW, требуется прямой доступ в Интернет, а при его отсутствии теряются многие плюсы, создавшие WWW сегодняшнюю популярность. Кроме того, некоторые возможности, имеющиеся при обычной работе, просто недоступны через электронную почту. Это, в основном, относится к элементам интерактивности в WWW. Например, в языке html поддерживаются формы. Пользователь вводит в них некоторую информацию, которая затем может передаваться на сервер. Таким образом заполняются анкеты, регистрационные карты, проводятся социологические опросы. Например, на сервере CNN можно было передать свое отношение к делу Симпсона, а в электронном журнале SunWorld OnLine можно выразить свою удовлетворенность статьями: не слишком ли коротко, достаточно ли информативно и т. д. Практически любая информация, которая предоставляется в публичный доступ, отображается средствами WWW. Если какая-та информация не может быть помещена в WWW, то это обусловлено некоторыми ограничениями и недостатками WWW. Во-первых, соединение между клиентом и сервером WWW одноразовое: клиент посылает запрос, сервер выдает документ, и связь прерывается. Это значит, что сервер не имеет механизма уведомления клиента об изменении или поступлении новых данных. Проблема решается сегодня несколькими способами: разрабатывается новая версия протокола http, которая будет позволять длительное соединение, передачу данных в несколько потоков, разделение каналов передачи данных и управления ими. Если она будет реализована и станет поддерживаться стандартным программным обеспечением WWW, то это решит снимет вышеописанные недостатки. Другое путь предлагается с использованием навигаторов, которые смогут локально исполнять программы на интерпретируемых языках - как это сделано в проекте Java компании Sun Microsystems, о котором будет рассказано ниже. Следующая проблема WWW - недостаточность языка описания документов html для решения многих задач. Например, html не предусматривает вывод математических символов, и текста уменьшенного по сравнению со стандартным размера. Эта задача решается тем же образом, что и предыдущая - разработкой новых версий языка html и новых типов навигаторов, расширяемых произвольным образом. Усилия эти затруднены децентрализованностью WWW - например, сегодня стандартом становятся не те расширения языка html, которые лучше, но те, которые привносятся самыми популярными навигаторами, такими как Netscape Navigator. Децентрализованность несет и множество других проблем: отсутствие общего каталога серверов и средств тотального поиска по ним. Однако и эта проблема решается, причем более успешно, чем предыдущие - сегодня есть и каталоги, и поисковые системы, которые, если и не являются глобальными, то тем не менее охватывают достаточно большую часть документов WWW, чтобы быть полезными и успешно применяться для поиска информации. 2. ОСНОВНЫЕ ПРИНЦИПЫ РАБОТЫ WEB 2.1. Основные компоненты WWW-технологии. WWW представляет собой информационную систему, базирующуюся на использовании понятий гипертекст и гипермедиа. Гипертекст - это текст со встроенными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, графические изображения и т.д. Выделенные в гипертексте слова называются гипертекстовыми ссылками (гиперссылками). Дальнейшим развитием понятия гипертекста является гипермедиа - синтез гипертекста и мультимедиа. Гипермедиа-документ включает не только гипертекст, но и анимацию, аудио- и видеоинформацию. Структура гипертекстовой системы WWW задается гиперссылками. Гиперссылка - это адрес другого Web-документа, который тематически, логически или каким-либо другим способом связан с Web-документом, в котором определена ссылка. Основу WWW-технологии составляют четыре компонента: язык разметки гипертекста HTML (HyperText Markup Language); универсальный способ адресации ресурсов в сети в виде универсального (унифицированного) указателя ресурса URL (Uniform Resource Locator); протокол передачи гипертекста HTTP (HyperText Transfer Protocol); общий шлюзовой интерфейс CGI (Common Gateway Interface). 2.2. Язык разметки гипертекста HTML. В качестве стандарта для разработки Web-документов принят язык разметки гипертекста HTML (последняя версия 4.0) - язык компоновки документов и спецификации гиперссылок, используемый для кодирования документов в WWW. Он предназначен для создания форматированного текста, который может включать графические изображения, аудио- и видеоданные, анимацию и гипертекстовые ссылки на другие документы, разбросанные по всему Web-пространству. В основе HTML лежит теговая модель описания совокупностей элементов, содержащихся в документе. HTML-документ состоит из текста, который представляет собой содержимое документа, и тегов, определяющих структуру и внешний вид документа при его отображении WWW-броузером. Теги - это управляющие маркеры документа, содержащие указания о способе отображения текста и используемые WWW-броузером. С помощью тегов создаются ссылки на файлы, содержащие графику, звук, видеоданные, и обозначаются гиперссылки, связывающие одни документы с другими. Гипертекстовая база данных в WWW представляет собой набор текстовых файлов (HTML-документов), написанных на языке HTML и имеющих расширение html (или htm), например, data.html, index.htm. Теоретически гипертекст - это всего лишь удобный способ представления информации. Но на практике гипертекст - это возможность сделать ссылки на другие документы с помощью слов и фраз. Вы знакомы с гипертекстом, так как, без сомнения, пользовались электронной справочной системой (help). Возьмем, к примеру, документ, содержащий краткое описание нескольких различных мест, которые являются конечной целью путешествия. Имя каждого из этих мест можно связать с другим документом, в котором содержится более подробная информация. Когда пользователь щелкает на ссылке в первом документе, броузер открывает второй документ с более подробными сведениями. У гипертекста есть две важные особенности. • Информация никак не упорядочивается - документы просто связываются друг с другом с помощи ссылок. Хотя главной целью многих методов является именно упорядочение информации тем и иным образом (например, в виде иерархии), в гипертексте основное внимание уделяется созданию информационных связей. Таким образом, гипертекст - это попытка создания модели, описывав щей способ представления информации в мозге человека (во всяком случае Бернерс Ли представл это себе именно так). • Информационные связи могут существовать между самыми разными документами. Создавая упоряд ченный список или схему, вы помещаете на каждое место в списке или иерархии (т.е. в структур только один элемент. А в гипертексте каждый информационный фрагмент (или элемент) может н холиться во многих, причем совершенно разных, местах структуры. Например, можно связать док мент, посвященный Шотландии, с другими документами, в которых говорится о путешествиях, игры в гольф, истории кельтов и т.д. 2.3. Web-страницы (документы HTML). Термин гипермедиа (hypermedia) используется для описания того, что вы находите в Web. Гипермедиа это естественное обобщение понятия гипертекста, относящееся к документам, в которых содержится только текст, но и мультимедиа, т.е. изображения, видеозаписи и звук. Многие из перечисленных элементов можно связывать с другими документами гипермедиа. Например, на Web-странице можно связать изображения с документами так, что если пользователь щелкнет на изображении, броузер откроет соответствующий документ. Web-страница - это документ гипермедиа. Но это особое явление, имеющее собственные, неповторимые характеристики. HTML (Hypertext Markup Language - язык гипертекстовой разметки) служит для описания Web страницы, которая сохраняется в виде обычного текстового файла с расширением *.htm или *.html . Главная цель HTML - описать формат содержимого Web-страницы. Дескрипторы (lag) HTML определяю способы форматирования текста, например, выделение его курсивом, оформление в виде заголовка и т. д. Некоторые дескрипторы HTML служат для Web-броузера опознавательными знаками изображений или таблиц. Но самое важное, что дескрипторы HTML позволяют связывать слова или фразы с другими доку ментами в Internet. Короче говоря, Web-страница - это комбинация текста и дескрипторов HTML, описывающих способы форматирования этого текста. Если на Web-сервере используется технология ASP фирмы Microsoft (Active Server Page - активные страницы сервера), то вместо HTML-страниц на сервере хранятся ASP-файлы. ASP-файл содержит сценарии, по которому Web-сервер динамически создает HTML-страницу в момент обращения к нему броузера. ASP позволяет представлять информацию в более динамичном виде, давая возможность обращаться к базам данных или к другой информации, которую невозможно представить в виде обычных HTML-документов. HTML - это стандарт, принятый Консорциумом Всемирной информационной сети (W3C - World Wide Web Consortium). Последняя рекомендация HTML (W3C не использует термин "стандарт") имеет номер 3.2. (Многие фирмы-изготовители, например Microsoft и Netscape, определяют собственные расширения для HTML-файлов.) Ассоциация W3C несет также ответственность за определение таких стандартов, как HTTP (Hypertext Transport Protocol - протокол передачи гипертекста) и PICS (Platform for Intt Content Selection - платформа выбора информации в Internet). Термин Web-страница обозначает документы в Web, в которых для описания используется язык HTML. HTML-документ - это еще одно название Web-страницы, причём более точное, поскольку HTML используется не только в Web. Этот язык применяется также создания электронной справочной системы (help), форматирования сообщений электронной почты Internet и при использовании технологии Active Desktop, принятой в Internet Explorer 4.0/5.0, - для отображения содержимого папки. 2.4. Унифицированные локаторы ресурсов (URL). Универсальный (или унифицированный) указатель ресурса URL (Uniform Resource Locator) - это адрес в системе WWW, с помощью которого однозначно определяется каждый документ. Он используется для записи гиперссылок и для обеспечения доступа к распределенным ресурсам сети Internet. URL - это стандарт, принятый для определения местонахождения любого ресурса в Internet, будь это документ или служба. URL состоит из трех частей. Схема. Схема описывает протокол, который должен использовать клиент для доступа к ресурс протоколом обычно ставятся символы ://. Но из этого правила есть исключения. Если ресурсом является файл, то схема имеет вид file://, если адрес электронной почты, то - mailto:, a новости - то news :. Хост. Хост - это доменное имя компьютера (или сервера) в Internet, на котором находится ре Домен третьего уровня в имени хоста обычно говорит о том, какого рода информация находит сервере. Например, на сервере www.host.com находятся Web-страницы, а на сервере ftp. host. corn - файлы, которые можно загрузить через FTP. Путь. Эта часть URL представляет собой полный путь к документу и, возможно, имя файла. личие от протокола и хоста, путь не является обязательным элементом URL. Если ввести URL сервера, не указав при этом путь на HTML-документ, то сервер откроет свою начальную страницу появляющуюся по умолчанию при обращении к этому серверу. Синтаксис URL имеет такой вид: схема://хост/путь где хост - это имя хост-машины (сервера), с которой необходимо установить соединение; схема - это протокол, используемый для соединения с данным сервером (для Web-серверов - это протокол http); путь - полное имя документа, затребованного с данного сервера. Так, например, в конструкции
элемент "А", называемый в HTML якорем (anchor), использует атрибут "HREF", который обозначает гипертекстовую ссылку (Hypertext REFerence), для записи этой ссылки в форме URL. Данная ссылка указывает на документ "fond_pp.html" в каталоге "FOND_PP" на сервере "www.riis.ru", доступ к которому осуществляется по протоколу "http". В настоящее время разработан механизм MIME-типов для идентификации классов внешних ресурсов, поэтому, используя спецификацию URL, в гиперссылке можно указать адрес не только файла HTML, но и файла любого другого формата, для которого есть внешняя программа просмотра. Таким образом, на любой информационный объект можно сослаться из HTML-документа, вызвав его через внешнюю программу просмотра. Универсальный локатор ресурса используется также для задания адреса какого-либо ресурса в Internet. Имеется несколько схем адресации ресурсов в Internet: HTTP, FTP, FILE, GOPHER, MAILTO, NEWS, NNTP, TELNET, WAIS. Наиболее часто применяются первые три схемы. Схема HTTP является основной схемой для WWW. В схеме указывается ее идентификатор, адрес машины, TCP-порт (задавать явно необязательно), путь в каталоге сервера, поисковый критерий и метка. На практике обычно используется наиболее простая форма задания адреса с указанием схемы адресации (в данном случае http), доменного имени или IP-адреса машины, имени HTML-файла с указанием полного пути к каталогу, в котором он размещен. Например: http://имя.ru/OI/rosniiis.html или http://194.226.45.45/OI/rosniiis.html где http - протокол обмена информацией в WWW между клиентской машиной и Web-сервером; имя.ru - доменное имя Web-сервера; 194.226.45.45 - IP-адрес Web-сервера; /OI/rosniiis.html - полное имя затребованного HTML-файла. Схема FTP позволяет адресовать файловые архивы FTP из программ-клиентов WWW (WWW-броузеров), поддерживающих протокол FTP. В данной схеме возможно указание не только имени схемы и адреса архива, но также идентификатора пользователя и его пароля. Наиболее часто схема FTP используется для доступа к публичным архивам FTP, например: ftp://ftp.riis.ru/pub/index.txt Этот вариант адреса соответствует идентификатору "anonymous" или "ftp" (анонимный доступ). Идентификатор пользователя и его пароль задаются перед адресом машины: ftp://gsg:password@ftp.riis.ru/etc В этом примере имя пользователя - gsg , его пароль - password , а после знака @ указано имя сервера - ftp.riis.ru и каталог - /etc. WWW-технология может использоваться как в сетевом, так и в локальном режимах. Для локального режима применяется схема FILE. Следующий пример иллюстрирует обращение к локальному документу (файл index.html), размещенному на ПК с операционной системой MS-DOS или MS Windows в каталоге cop на диске C : file:///C:/cop/index.html Термин "Web-страница" в равной степени подходит для всех HTML-документов в Internet. A заметку термин "начальная страница" имеет два разных определения. Во-первых, начальная страница - это страница самого верхнего уровня на большом Web-сервере. Именно эта Web-страница открывается в случае, если пользователь вводит URL без указания пути или имени файла. В подобном случае Web-сервер открывает файл с именем Index, htm или default, htm и отображает начальную страницу. Во-вторых, термин "начальная страница" используется для описания персональных Web-страниц, которые помещают в Internet отдельные пользователи. 2.5. HTTP- протокол передачи гипертекста. HTTP расшифровывается как Hyper Text Transport Protocol (протокол передачи гипертекста) и используется в Web с 1990 года. Он служит для определения способов формирования запросов клиентов и способов ответа Web-серверов на эти запросы. Короче говоря, HTTP описывает способы передачи Web-страниц. HTTP - это простой текстовый протокол, т.е. вы можете прочитать и понять каждую команду, посылаемую на сервер (попробуйте связаться с портом 80 Web-cepaepa с помощью teinet). Броузер посылает на Web-сервер запрос, а тот, в свою очередь, выдает ответ. Первой строкой запроса является команда, обычно GET (Получить) или POST (Послать), содержащая URL ресурса (файла, сценария, программы и т.д.) и версию HTTP, используемую броузером. За командой следуют заголовки, в которых содержится дополнительная информация, необходимая Web-серверу. Все заголовки имеют одинаковый формат: имя: значение. Например, заголовок user-agent сообщает серверу тип броузера пользователя. HTTP обеспечивает передачу гипертекстовой информации с учетом ее специфики. Этот протокол предоставляет пользователю возможность в процессе взаимодействия с сервером получить новый адрес сетевого ресурса, запросить встроенную графику, принять и передать параметры и т.п. Управление в HTTP реализовано с помощью встроенных команд. При работе в Internet для обслуживания HTTP-запросов используется транспортный протокол TCP. Протокол HTTP относится к так называемым "запрос-ориентированным" протоколам. Это означает, что во время сеанса клиент устанавливает соединение и ждет ответа. После отправки ответа сервер инициирует разрыв соединения. Поэтому при передаче сложных гипертекстовых страниц соединение может устанавливаться несколько раз. 2.6. Общий шлюзовой интерфейс CGI. Спецификация CGI (Common Gateway Interface) была специально разработана для расширения возможностей WWW-технологии за счет подключения всевозможного внешнего программного обеспечения. Основное ее назначение - это обеспечение единообразного потока данных между сервером и прикладной программой, которая запускается сервером. CGI - это компонент программного обеспечения Web-сервера, который может взаимодействовать с другими программами, работающими на этом сервере. CGI-скрипты - это программы, написанные в соответствии со спецификацией CGI на любом языке программирования (C, С++, Pascal и т.д.) или командном языке (Shell, Cshell, Perl и т.д.). CGI - это интерфейс, обеспечивающий вызов Web-сервером внешних программ. С помощью CGI Web-сервер может вызвать внешнюю программу и передать в нее пользовательские данные (например, информацию о том, с какой хост-машины пользователь установил соединение, или данные, введенные пользователем в HTML-форму). Эта программа затем обрабатывает полученные данные, а сервер передает результаты ее работы обратно в WWW-броузер. CGI обеспечивает возможность создания сценариев, которые позволяют разрабатывать интерактивные Web-приложения, управляемые пользователем. CGI дает средства динамического создания Web-страниц на основе информации, вводимой пользователем или получаемой из баз данных. Для расширения возможностей HTML-документов активно используются язык описания сценариев JavaScript и очень перспективный объектно-ориентированный язык программирования Java (для написания всевозможных программ, от анимации до электронных таблиц, которые можно загружать в локальные машины через WWW). 2.7. Структура программного обеспечения WWW-технологии. Internet-сервис, предоставляемый на основе WWW-технологии, как уже упоминалось, базируется на архитектуре "клиент-сервер". Поэтому структура программного обеспечения поддержки WWW-сервиса включает две основные части: программу-клиента протокола HTTP (WWW-броузер) и программу-сервер протокола HTTP. Они представляют собой минимально необходимый набор программ поддержки WWW-сервиса. Кроме основного программного обеспечения для расширения функциональных возможностей WWW-систем и организации доступа к сетевым ресурсам, отличным от WWW, используются CGI-скрипты, JavaScript-сценарии и Java-аплеты. Если серверное и клиентское программное обеспечение (ПО) WWW-систем - это, как правило, стандартное ПО, разрабатываемое известными фирмами (Netscape, Microsoft, Sun и др.), то CGI-скрипты, JavaScript-сценарии и Java-аплеты разрабатываются и пишутся пользователями и администраторами систем. В WWW функции интерпретатора языка HTML разделены между WWW-сервером и WWW-клиентом. Сервер, кроме доступа к документам и обработки гипертекстовых ссылок, осуществляет также препроцессорную обработку документов. Программа-клиент WWW выполняет интерпретацию конструкций языка HTML, связанных с представлением информации, и позволяет обмениваться данными с сервером по протоколу HTTP. Программа-клиент WWW предназначена для того, чтобы соединяться по Internet с удаленными машинами, запрашивать определенные документы, а затем форматировать полученные документы для просмотра на локальной машине. В настоящее время в качестве WWW-клиентов чаще всего используются бесплатные, свободно распространяемые программы-броузеры Netscape Communicator 4.04 (пакет Netscape Navigator) и Microsoft Internet Explorer 4.0 с графическим интерфейсом доступа в WWW, реализованные как для большинства UNIX-систем, так и для систем Wintel. Они обладают прекрасными функциональными возможностями и очень удобны в работе. Программа-сервер WWW - это программа, которая принимает запросы от WWW-клиентов и отвечает на них. В качестве ответа может быть возвращен HTML-документ, графическое изображение, аудио- и видеоданные или ответ внешней программы. В настоящее время WWW-серверы существуют для всех типов компьютерных платформ и операционных систем. Наиболее распространенным среди некоммерческих пакетов для UNIX-систем является сервер Apache фирмы Apache Digital. Хотя этот сервер является некоммерческим, тем не менее, он реализован с учетом спецификаций защиты данных от несанкционированного доступа. Наиболее популярным пакетом, включающим WWW-сервер для Wintel-систем, является IIS (Internet Information Server) фирмы Microsoft, работающий в среде ОС Windows NT 4.0 Server и поставляемый в комплекте с этой ОС. Пакет IIS, кроме WWW-сервера, включает также и другие серверы, в частности, FTP. Среди коммерческих пакетов WWW-серверов наиболее привлекательными являются FastTrack Server (стоимость $400) и Enterprise Server (стоимость $1000) фирмы Netscape. Enterprise Server является более мощным сервером. Он обладает высокой производительностью и степенью защиты, средствами управления содержанием и системами кэширования запросов, допускает большое число одновременных подключений. 2.8. Обмен информацией в Internet/intranet с использованием WWW-технологии. Система WWW обеспечивает быстрый и удобный доступ к различным сервисам Internet, например, E-mail, FTP, NFS, Gopher, Telnet, телеконференциям новостей Usenet и др. Она позволяет организовать удобное взаимодействие через гипертекстовую среду с другими информационными системами, например, с базами данных. Привлекательность WWW заключается также в наличии встроенных в ней возможностей идентификации пользователей и защиты передаваемой информации. Работа WWW базируется на использовании семейства протоколов межсетевого обмена TCP/IP (Internet Protocol). Разнообразная гипертекстовая и гипермедиа информация, расположенная на тысячах WWW-серверов во всем мире, является одним из основных информационных ресурсов Internet. Разработано множество Web-приложений, предназначенных для практического применения WWW-сервиса в различных областях человеческой деятельности (образование, наука, бизнес, электронная торговля, банковская сфера и т.д.). Наглядным примером перспективного применения WWW-технологии в сфере образования является ее использование в процессе дистанционного обучения. На WWW-серверах многих вузов и научных организаций высшей школы, наиболее активно использующих возможности WWW-технологии, можно найти ценную и полезную информацию образовательного и познавательного характера, компьютерные учебные пособия, обучающие программы, системы тестирования знаний и другие учебные и методические материалы, которые могут быть использованы в процессе обучения. Например, на WWW-сервере РосНИИ ИС (www.riis.ru) представлена разнообразная информация о Фонде компьютерных обучающих программ, распространяемых РосНИИ ИС, о методике и практике использования компьютерных технологий в реальном учебном процессе, о технологии создания компьютерных обучающих программ и инструментальной системе HM-Card, обеспечен удобный доступ к иллюстрированным аннотациям и архивным файлам Фонда свободно распространяемых программных продуктов для информатизации образования. Все стандарты, имеющие отношение к WWW-технологии, разрабатываются под эгидой консорциума World Wide Web Consortium (W3C). На его Web-узле (www.w3.org) можно найти спецификации этих стандартов и проекты новых предложений. 3. НОВЫЕ ТЕХНОЛОГИИ И ТЕНДЕНЦИИ РАЗВИТИЯ Интернет - очень быстро развивающаяся сеть. Причина этого заключена не в свойствах самой Интернет, но в общих тенденциях развития компьютерной индустрии. Поэтому не будет лишним рассказать о том, что может ожидать завтра глобальные компьютерные сети, какие технологии сегодня еще не стали общеупотребительными сервисами, но уже подают большие надежды. Первой и, пожалуй, самой перспективной из них является Java. Основными инструментами гипертекстовых технологий для мультимедиа-систем и сети Internet стали языки HTML и Java. 3.1. Java. Сегодня самым многообещающим направлением развития Интернет и сетевых технологий в целом является проект Java компании Sun Microsystems. Именно с ним связаны сегодня самые интересные новости и проекты, именно Java у всех на устах. Java - интерпретируемый язык с синтаксисом C++, специально рассчитанный на работу в открытой сетевой среде. Текст программы на Java может компилироваться в бинарный псевдокод и передаваться по сети для исполнения на виртуальной машине в удаленном интерпретаторе. При этом доступ к ресурсам машины, на которой он работает, для Java-программы может быть ограничен с целью обеспечения безопасности. Такие передаваемые по сети маленькие программы на языке Java называются аплетами. С серверов Интернет могут вызываться не только программы, но и описания объектов или форматов данных. Чтобы пользоваться возможностями, предоставляемыми языком Java, ваш WWW-навигатор должен уметь вызвать для исполнения аплетов Java-интерпретатор. Первый такой навигатор был выпущен компанией Sun для операционной системы Solaris и назывался HotJava. Для первой тестовой версии он работал очень хорошо и позволял, например, смотреть страницы с анимацией и звуком. Первая страница WWW-сервера Sun, рассчитанная на использование hotJava, и сегодня является лучшей демонстрацией возможностей мультимедиа и глобальных сетей. Вскоре и Netscape Navigator, занимающий больше трех четвертей рынка WWW-навигаторов, стал поддерживать Java на ряде платформ, и, в частности, в Windows 95 и NT. Это обеспечило еще больший успех Java. Сегодня появляются новые навигаторы с поддержкой Java - как, например, PowerBrowser компании Oracle. Такое внимание со стороны крупнейшего производителя СУБД ясно показывает, что проект Java имеет очень хорошие перспективы. Вполне вероятно, что скоро поддержку этого сетевого языка будут обеспечивать все WWW-навигаторы, а значит и многие серверы. А если Java сможет приобрести достаточную популярность и стать стандартом де-факто, то весь Интернет и вся компьютерная технология вообще выйдут на качественно новый уровень развития, когда ресурсы компьютеров всего мира будут объединены в один компьютер под названием Сеть. Проект Java вырос из проекта под названием Oak. Когда использование WWW еще не было столь распространенным, в лабораториях Sun велись работы над созданием языка, предназначенного для управления бытовой электроникой. Язык должен был быть удобным, компактным, эффективным и переносимым. Тогда получить искомое решение не удалось, вероятно потому, что рынок еще не был готов использовать технологии, которые и сегодня похожи на фантастику. Но работы были начаты, и дело не погибло - с появлением WWW и развитием компьютерных сетей вообще проект получил второе дыхание. Технология Java оказалась ровно тем, чего не хватало World Wide Web. У истоков Java стояли такие легендарные личности, как Билл Джой (Bill Joy), один из крестных отцов BSD UNIX, и Джеймс Гослинг (James Gosling), создатель сетевой оконной технологии NeWS (которая, вероятно, была лучше всех, существующих сегодня, но не получила распространения по коммерческим причинам). Java позволяет решить самые глубокие проблемы WWW: отсутствие интерактивности, ограниченный контроль вида документа, ограниченный набор форматов встроенной графики и других объектов мультимедиа. Если Вы создаете документ в Интернет и используете Java, то, включив в документ картинку в придуманном Вами формате, Вы можете также указать ссылку на программу, которая умеет читать Ваш формат и рисовать картинку. Если Вас не устраивают существующие протоколы передачи данных в Интернет, то Вы можете определить свой протокол и передавать данные по нему, предварительно указав ссылку, откуда брать программу для его поддержки. WWW-навигатор, поддерживающий Java, неограниченно расширяем и позволяет реализовать все, что угодно. При этом замечательна та особенность, что с точки зрения пользователя все предельно просто - он пользуется стандартным интерфейсом, не замечая никаких сложностей с форматами, протоколами и т.д. Сегодня Java применяется для передачи через Интернет аплетов, маленьких программ, обычно реализующих простые вещи для украшения WWW-страниц. Однако возможности и перспективы проекта Java уходят далеко за горизонты WWW. Принципиально новой идеей является передача через Интернет не просто данных, но приложений. Новая технология сделала документы объектами, вместе с которыми стали передаваться и методы их обработки. Это предоставляет возможность построения средствами Java больших программных продуктов, полностью использующих возможности современных корпоративных информационных сред, построенных на базе высокоскоростных сетей и мощных серверов баз данных в архитектуре клиент-сервер. Одной из самых последних новостей стало сообщение, что компания Sun Microsystems собирается начать выпуск Java-терминалов, компактных и дешевых устройств, состоящих из дисплея, устройств ввода (клавиатуры, мыши и т.п.), простого процессора со встроенным оптимизированным интерпретатором Java и сетевой карты. Давайте попробуем заглянуть в завтра. Используя такие устройства, можно построить практически идеальную корпоративную информационную систему, где данные хранятся на одном сервере, обрабатываются на другом, а отображаются на Java-терминалах. Такая схема наиболее экономична и практична: пользовательские рабочие места дешевы, поскольку их ресурсы и архитектура специализированы и адекватны возлагаемым на них задачам; сеть минимально загружена, поскольку по ней не передается информация о том, как рисовать изображение практически по точкам (как это делается сегодня в X Window System), но передаются методы отображения объектов и данные, а значит трафик гораздо ниже; вычислительные ресурсы централизованы, а значит более эффективно используются, данные также централизованы и проще управляются, резервируются и надежней защищены. Не секрет, что в последнее время продажи мейнфреймов стали вновь увеличиваться - а вышеописанная архитектура позволила бы соединить лучшее из технологий мейнфрейм и клиент-сервер. Но пока это все лишь замки на песке - Java-терминалы еще никто не видел, ни одного реального примера реализации технологии еще нет, а значит нельзя сказать, какие сложности могут ожидать технологию Java. Но давайте будем оптимистами. Конечно, все примеры использования технологии Java находятся сегодня на уровне программы "Hello World", но все больше и больше пользователей и разработчиков Интернет начинают использовать Java, каждый день появляются новые аплеты. Примеров больших решений еще нет, но скорость движения дает повод для положительных прогнозов. Проект взял хороший старт и имеет все, что нужно для успеха: поддержку компьютерного гиганта, открытость, доступность исходных текстов программ, легкую переносимость (один из добровольцев, адаптировавших Java под ОС Linux, писал, что исходные коды Java написаны очень добротно и специально подготовлены для переноса на другие платформы), поддержку самой популярной платформы персональных компьютеров - Windows 95, совместимость с C++ (а значит и большое число программистов, способных писать на нем программы), поддержку независимых производителей программного обеспечения (например, Borland обещает выпустить среду разработки программ на Java), поддержку самого популярного WWW-навигатора - Netscape, а главное - энтузиазм и поддержку миллионов пользователей Интернет. Компания Sun Microsystems рассчитывает с помощью Java шагнуть в следующее тысячелетие первой, создав новый рынок с новой парадигмой: "Сеть - это компьютер". Как прошли времена мейнфреймов, так пройдут времена неоправданно мощных персональных компьютеров, и что же придет тогда? Sun предлагает Java и имеет хорошие шансы на успех. Было бы нечестно не рассказать и о недостатках этой технологии. Отсутствие реальных решений уже было упомянуто выше, но оно не является принципиальным недостатком. Следующей проблемой является недоработанность либо недостаточная стабильность WWW-навигаторов, поддерживающих Java. Но ведь когда маленький ребенок начинает говорить, не выговаривая букву "р" - это вполне нормально. Еще одной полупроблемой является тяжелое наследие C++. Поддержка старого языка - всегда палка о двух концах - все ухабы и рытвины сохранились, но зато они уже известны. Хуже то, что виртуальная машина Java построена в расчете на идеологию C++, и построение компиляторов из других языков в псевдокод Java может быть очень сложным, хотя возможность такая и существует. Так, в сетевых новостях обсуждаются возможности создания компиляторов JavaPascal, JavaBasic и т.д. Пожалуй, основной проблемой Java является поддержка безопасности: защита локального компьютера от вирусов, возможно содержащихся в аплетах, защита передаваемых по сети данных и т.д. Беда в том, что для любого алгоритма существует вероятность появления способа его взлома. Это вопрос очень тонкий и мы не будем обсуждать его здесь, но общий принцип подтверждается: что один человек построил, то другой всегда может сломать, вопрос только в том, сколько понадобится сил и времени. Кроме теоретических проблем математических алгоритмов шифрования, существуют еще, к сожалению, вопросы практической их реализации. Поскольку программ без ошибок не бывает, то уязвимым может оказаться программное воплощение самой лучшей теории. 3.2. VRML. Аббревиатура VRML расшифровывается как "язык описания виртуальной реальности". Это язык описания трехмерных сцен и объектов. Через World Wide Web пользователь может получить файл в формате VRML, и, если программа-клиент обладает такой возможностью, просматривать сцену с разных точек зрения. При этом картинка на экране остается плоской, но, перемещая точку обзора, пользователь может наблюдать вид трехмерного объекта с разных сторон. Если WWW-броузер поддерживает формат VRML, то можно заглянуть на эту страничку , выбрать сервер и попробовать: WELCOME TO THE BEST RESOURCE FOR LOCATING VRML WORLDS ON THE WWW! Основная проблема этой технологии заключается в том, что обработка VRML-файлов происходит на компьютере пользователя и требует значительных вычислительных и графических ресурсов. Поэтому, с одной стороны, программ-клиентов, поддерживающих VRML, не так уж много, и до сих пор нет стандартной программы для этого, доступной на различных платформах. С другой стороны, использование значительных ресурсов компьютера пользователя противоречит идеологии развития технологии по пути дешевых и легких Интернет-терминалов, способных только отображать информацию, полученную по сети. С третьей стороны, индустрия движется по законам рынка - существует огромное количество персональных компьютеров, в которые вложены большие деньги, и они, вероятно, будут развиваться в этом направлении и дальше. А коль это так, VRML - хорошее средство утилизации ресурсов ПК, по мощности переросших понятие "персональный". Долгосрочные прогнозы здесь делать нельзя, поживем - увидим. ЗАКЛЮЧЕНИЕ В последнее время все актуальнее становится овладение навыками пользования технологией гипертекста и гипермедиа. Сегодня гипертекстовые системы не являются чем-то необычным. По принципу гипертекста организованы многие электронные учебники, справочники, встроенные подсказки в компьютерных системах. Гипермедиа состоит из узлов, которые являются основными единицами хранения информации и могут включать в себя страницы текста, графику, звуковую информацию, видеоклипы и т. д. Пользователь может добавлять или изменять информацию в узле или создавать свои собственные узлы информации. Доступ к узлам осуществляется через связи, которые соединяют между собой узлы. Связи в гипермедиа перемещают пользователя через информационное пространство в выбранные им узлы. Активные гипермедийные среды являются удобным средством планирования и организации. Мощный импульс формированию глобальной гипермедиа информационной среды был придан широким развитием Web-технологии. Применение ее в среде как бизнеса, так и образования тем эффективнее, чем выше степень реализуемой интерактивности. Стандартные средства HTML в сочетании с возможностями программ CGI (Common Gateway Interface) являются достаточно надежным и хорошо зарекомендовавшим себя инструментом придания Web-документам указанного свойства. Серьезной проблемой при использовании Web-технологий является реализация возможности создания виртуальных лабораторий и совместной работы над техническими проектами в распределенных группах. Перспективным решением этой проблемы представляется объединение достоинств Web- и JAVA-технологий. Их синтез позволяет включать в WWW-материалы динамические модели процессов и устройств, необходимые для изучения различных явлений или для управления определенными процессами. И все же зарубежный и отечественный опыт использования гипермедиа показывает, что гипермедиа в качестве инструмента познания следует использовать скорее не как перечень инструкций, являющихся источником информации, а как инструмент. В заключение - простой совет: если Вы еще не работаете с WWW, то начните. В подавляющем большинстве случаев это лучшее решение задач при работе с глобальными информационными сетями. ЛИТЕРАТУРА Иванников А.Д., Ижванов Ю.Л., Кулагин В.П. Перспективы использования WWW-технологии в России // Информационные технологии, 1996. № 2. С. 24-29. Информатика: учебник / под. ред. проф. Н.В. Макаровой. - М.: Финансы и статистика, 1997. Использование Интернет: Пер. с англ. / Дж. Хоникат, М.Р. Браун, Т. Фронцковяк и др. - 4-е изд. - К.; М.; СПб: Издат. дом "Вильямс", 1998. - 592с.: ил. Левин Д., Бароди К. Секреты Internet: Пер. с англ. К.: "Диалектика", 1996. 544 с. Норенков И.П. По WWW-страницам учебных серверов. Компьютерное учебное пособие "Телекоммуникационные технологии и вычислительные сети" на сервере Центра дистанционного обучения МГТУ им. Н.Э. Баумана // Информационные технологии, 1999. № 3. С. 44-45. Семенов Ю.А. Протоколы и ресурсы Internet. М.: Радио и связь, 1996. 320 с. Спейнаур С., Куэрсиа В. Справочник Web-мастера: Пер. с англ. К.: BHV, 1997. 368 с. Эпштейн В.Л. Гипертекст - новая парадигма информатики, //Автоматика и Телемеханика, / № 11, 1991
2
Работа на этой странице представлена для Вашего ознакомления в текстовом (сокращенном) виде. Для того, чтобы получить полностью оформленную работу в формате Word, со всеми сносками, таблицами, рисунками, графиками, приложениями и т.д., достаточно просто её СКАЧАТЬ.
|
|