Реферат: HTML и создание сайтов
программы просмотра; согласно этим инструкциям программа располагает текст на
экране, включает в него рисунки, хранящиеся в отдельных графических файлах, и
формирует гиперсвязи с другими документами или ресурсами Internet. Таким
образом, файл на языке HTML приобретает облик WWW-документа только тогда, когда
он интерпретируется программой просмотра. О языке HTML мы подробно расскажем в
соответствующих разделах книги, поскольку без знания основ этого языка
невозможно создать свой собственный гипертекст для публикации в WWW.
2.3. Как в WWW задается местонахождение документа?
Виртуальный мир WWW населен миллионами документов, обитающих на сотнях тысяч
серверов. Задача WWWпутешественника - найти среди них тот, который содержит
необходимую информацию, и прочитать его при помощи программы просмотра, - а для
этого программа просмотра должна знать точное местонахождение данного документа.
Оно однозначно определяется адресом сервера, номером порта, именем директории и
именем файла с этим документом. Для успешной загрузки требуемого документа
сервера программе просмотра также нужно указать протокол, используемый этим
сервером. Это связано с тем, то кроме WWW-серверов, программы просмотра могут
обращаться к серверам пересылки файлов (так называемым FTPсерверам), серверам
телеконференций, серверам электронной почты и некоторым другим типам серверов.
Комбинация протокола, адреса сервера, номера порта, имени директории и имени
файла получила название Uniform Resource Locator, или сокращенно URL. Синтаксис
URL показан ниже:
протокол://адрес_сервера:номер_порта/имя_директории/имя_файла
Протокол, как уже было сказано выше, это совокупность правил, по которым
происходит взаимодействие клиент-сервер. Мы уже знаем, что “родной” протокол WWW
называется http. Кроме http, WWWклиенты могут общаться с серверами,
поддерживающими протоколы ftp, gopher и некоторыми другими, на которых я здесь
останавливаться не буду, а расскажу о них далее.
Название протокола отделяется от остальной части URL двоеточием. В названии
протокола прописные латинские буквы и соответствующие им строчные буквы
эквивалентны.
Начало адреса отмечается двумя косыми чертами // Он состоит из нескольких частей
- так называемых поддоменов. Поддомены, представляющие собой сочетания букв и
цифр, разделяются точками, причем, “уточнение координат адресата” от более
крупных к более мелким поддоменам происходит справа налево. Так же как и в
названии протокола, в адресе сервера прописные латинские буквы и соответствующие
им строчные буквы эквивалентны.
Номер порта выражается целым положительным числом и отделяется от адреса
двоеточием. Порт - это как бы “дверь”, через которую можно зайти в сервер.
Сервер может иметь несколько доступных портов; если номер порта WWW-сервера
равен 80, то в URL его можно не указывать.
Файлы с документами, публикуемыми в WWW, часто имеют суффиксы .html или .htm.
Эти суффиксы являются аббревиатурой от названия языка, на котором пишут
WWW-документы, HyperText Markup Language, о котором будет подробно рассказано
далее.
Если имя директории начинается с символа ~ (тильда), это означает, что это - так
называемая домашняя директория (home directory) пользователя данной компьютерной
системы. На компьютерах с многопользовательской операционной системой UNIX
каждому пользователю присваивается имя пользователя, под которым он
регистрируется в системе, и выделяется собственная “домашняя” директория,
предназначенная для хранения принадлежащих ему файлов. Имя домашней директории
совпадает с именем пользователя. Вместо абсолютного имени домашней директории с
указанием всех ее поддиректорий можно использовать имя пользователя, которому
предшествует символ ~ (тильда).
Обратите внимание на следующие особенности задания имен директорий и файлов в
URL:
Директория, указанная в URL, как правило, не совпадает с истинной директорией в
файловой системе на том сервере, где находится требуемый файл. Преобразование
директорий, заданных в URL, в истинные директории в файловой системе
осуществляется WWW-сервером согласно правилам, заданным при его установке и
настройке.
Если в URL указано только имя директории, а имя файла не задано, то сервер на
такой запрос вышлет файл с определенным именем, зависящим от настройки сервера.
Если же такого файла в заданной директории нет, то большинство серверов
автоматически вышлют вам список всех файлов в данной директории.
2.4. Программы просмотра
Мы уже знаем, что, программа, с которой непосредственно общается пользователь
при работе с ресурсами WWW, называется программой просмотра WWW-документов.
Напоминаем, что работа такой программы заключается в посылке запроса к заданному
серверу, интерпретации полученной информации и представления ее пользователю.
Кроме того, она выполняет ряд вспомогательных задач, например, поддерживает
список прочитанных документов, чтобы пользователь мог к ним вернуться в
дальнейшем.
В настоящее время получили распространение более десяти программ просмотра
WWW-документов. Из графических программ просмотра наибольшего внимания, на наш
взгляд, заслуживают NCSA Mosaic, Netscape Navigator и Microsoft Internet
Explorer.
Программа NCSA Mosaic была создана в Национальном Центре Суперкомпьютерных
Приложений Университета штата Иллинойс в Урбана-Шампэйн в начале 1993 года
группой программистов, возглавляемых студентом по имени Марк Андреессен. В то
время Mosaic являлась единственной программой просмотра, написанной на
профессиональном уровне, дружественной по отношению к пользователю и работающей
на многих типах компьютеров. Не вызывает сомнений, что именно Mosaic открыла
World Wide Web для большинства пользователей. В настоящее время в NCSA группа
разработчиков (в основном, студентов старших курсов) продолжает трудиться над
новыми версиями Mosaic, несмотря на то, что по своим возможностям эта программа
уже существенно уступает более новым программам. Mosaic является некоммерческим
программным продуктом, доступным для пользователей бесплатно. Исходный код
программы Mosaic открыт и активно используется разработчиками многих других
программ просмотра.
Netscape Navigator (сокращенно - Netscape) - это в настоящий момент, пожалуй,
самая популярная программой просмотра, работающая на тех же типах компьютеров,
что и Mosaic. Netscape - детище компании Netscape Communications Corporation,
основанной в начале 1994 года Джимом Кларком, который в свое время основал
крупную компанию Silicon Graphics, знаменитую своими графическими станциями.
Джиму Кларку удалось переманить в Netscape Communications Corporation
первоначальных разработчиков программы Mosaic из Иллинойса, в том числе и самого
Марка Андреессена. Netscape - это коммерческий продукт, за пользование которым
надо платить. Однако, для пользователей в университетах Netscape доступна
бесплатно. Кроме версий, работа над которыми завершена, компания периодически
выпускает отладочные версии Netscape (так называемые бетаверсии), которыми можно
пользоваться бесплатно до наступления определенной даты, после которой программа
перестает функционировать.
Microsoft Internet Explorer (сокращенно - IE) - творение фирмы Microsoft
Corporation. По функциональным возможностям и удобству использования IE примерно
эквивалентен упомянутой выше программе Netscape Navigator. В отличие от
последней, IE работает на значительно меньшем количестве компьютерных платформ.
IE распространяется бесплатно для всех пользователей.
Кроме Mosaic, Netscape и IE, стоит упомянуть такие программы как Lynx, IBM Web
Explorer и AOL Browser.
Анализ доступа на сервер Engineering показывает, что наиболее широко
используется Netscape Navigator. В настоящее время между Microsoft Corporation и
Netscape Corporation идет острейшая борьба за первенство на рынке программного
обеспечения для Internet, и весьма вероятно, что Microsoft вскоре существенно
потеснит Netscape и остальных своих конкурентов.
2.5. Основные команды программ просмотра
Оконный интерфейс графических программ просмотра прост и интуитивно понятен всем
пользователям, знакомым с Microsoft Windows. В полосе заголовка окна, которая
располагается вдоль верхней границы окна, выводится название программы просмотра
- Netscape - и название текущего документа. Далее в верхней части окна
расположены элементы управления программой: меню и экранные кнопки. Большую
часть окна занимает собственно область, в которой выводится содержание
просматриваемых WWW-документов. В нижней части окна расположена строка
состояния. В этой строке Netscape отображает такую информацию, как, например,
процентную долю от полного размера загружаемого в данный момент файла или URL
документа, на который указывает гиперссылка, если курсор мыши поместить на
соответствующий участок документа.
В таблице ниже приведены команды, необходимые для выполнения простейших действий
при просмотре документов в WWW при помощи Netscape Navigator 3.0. Система команд
и меню в других графических программах ненамного отличается от принятой в
Netscape. Следует учесть, что авторы программ просмотра из какихто таинственных
побуждений используют различные термины для обозначения одних и тех же понятий.
ДействиеКоманда в Netscape 3.0
Открыть документ с известным URL на WWW-сервере.Меню: File Open Location
Затем впечатать URL в появившемся диалоговом окне и “нажать” экранную
кнопку OK.
Или: Впечатать URL в поле “Location:”, расположенное в верхней части окна,
и нажать клавишу Enter.
Открыть домашнюю страницу (homepage).“Нажать” экранную кнопку с
изображением домика Home
Прервать загрузку документа.“Нажать” экранную кнопку Stop
Открыть документ, находящийся в файле на локальном компьютере.Меню: File
Open File
Перезагрузить текущий документ.“Нажать” экранную кнопку Reload.
Сохранить текущий документ в файле.Меню: File Save As
Перейти к просмотру документа, с которым имеется гиперсвязь в текущем
документе.Переместить указатель мыши в выделенный подчеркиванием и/или
контрастным цветом участок на экране и щелкнуть левой клавишей мыши.
Двигаться назад по цепочке документов, просмотренных в текущем сеансе
работы.“Нажать” экранную кнопку << Back
Вернуться к произвольному документу, просмотренному в текущем сеансе
работы.Меню: Go, затем указать название необходимого документа из списка.
Двигаться вперед по цепочке просмотренных документов.“Нажать” экранную
кнопку >> Forward
Запомнить URL текущего документа в списке “закладок” для последующего
возврата к немуМеню: Bookmark Add Bookmark
Открыть документ из списка “закладок”.Меню: Bookmark
Выбрать документ из спускающегося меню
Программы просмотра способны правильно отобразить содержимое файлов самых
различных форматов, начиная от простейших текстовых и заканчивая графическими,
звуковыми и другими специализированными форматами; при этом, как мы уже знаем,
“родным” форматом для WWW является HyperText Markup Language (HTML). А что же
происходит, когда программа просмотра “не понимает” формата загружаемого файла?
В первый раз столкнувшись с этой нередкой ситуацией, можно и растеряться,
поэтому мы кратко опишем два возможных варианта развития событий:
1. Программа просмотра знает, какая из других программ, установленных на вашем
компьютере, понимает формат данного файла. - В этом случае программа просмотра
запустит требуемую программупомощника или программуприставку и передаст ей
полученный файл для обработки. Как правило, программа просмотра, прежде чем
запустить программупомощника, спрашивает вашего разрешения. Это делается по той
причине, что даже самый невинный на первый взгляд файл может быть потенциально
опасен для вашего компьютера. В частности, документы в формате Word for Windows
6.0 могут содержать макрокоманды, способные уничтожать или переписывать файлы на
вашем жестком диске!
2. Программа просмотра не знает, у какой программы попросить помощи при
интерпретации данного файла. - В этом случае вам будет предложено четыре
альтернативы:
More Info... - дать дополнительную информацию о возникшей ситуации и предложить
установить программу-приставку (plugin), которая понимает данный формат файла,
Pick App... - выбрать программу-помощника, уже установленную на вашем
компьютере, для обработки данного файла,
Save File... - сохранить файл на локальном диске,
Cancel - отменить загрузку данного файла. Часто команду Save File... используют
для того, чтобы получить программное обеспечение и документацию из коллекций
(“архивов”).
Проблема русификации
Создатели программного обеспечения для работы в WWW первоначально не были
слишком озабочены нуждами людей, желающих публиковать и читать информацию на
своих родных языках, не использующих латинский алфавит, в том числе и на русском
языке. В последнее время ситуация начинает заметно изменяться к лучшему, но все
же просмотр и публикация документов на русском языке сопряжена с некоторыми
трудностями.
2.6. Коды и символы
Файл, содержащий гипертекстовый WWW-документ, представляет собой текстовый файл.
“Внутри” компьютера современной архитектуры и при передаче по сетям каждый
символ текста представляется в виде целого числа, которое, в свою очередь,
кодируется комбинацией из восьми двоичных разрядов, называемых битами. Такая
комбинация из восьми бит, обрабатываемых ЭВМ как одно целое, получила название
байт. Каждый бит в байте может иметь ровно два состояния: “включен” и
“выключен”, или “1” и “0”.
Легко убедиться, что существует ровно 256 комбинаций из восьми бит, каждый из
которых может быть занят -либо нулем, -либо единицей. Таким образом получается,
что восемью битами (то есть, одним байтом) могут быть представлены числа, или
коды, от 0 до 255 (то есть, от 00000000 до 11111111 в двоичной системе
счисления). Каждому коду можно поставить в соответствие определенный текстовый
символ, например, букву или цифру, или управляющий символ, такой как возврат
каретки, переход на новую строку и т. п. Чтобы текст выглядел одинаково на
мониторах разных компьютеров, необходим определенный стандарт на соответствие
кодов и представляемых ими символов для текстовой информации. Такой стандарт,
принятый в настоящее время на подавляющем большинстве компьютерных систем,
получил название American Standard Code for Information Interchange (ASCII,
произносится как “аски”). Этот стандарт охватывает лишь коды от 0 до 127. В
кодовой таблице ASCII не нашлось места для многих часто используемых специальных
символов. Также, из буквенных символов там присутствуют только символы
английского алфавита. Чтобы закодировать буквы национальных алфавитов, в том
числе русского, сохранив при этом совместимость с таблицей ASCII, необходимо
использовать коды в диапазоне от 128 до 255. Вот тутто и начинаются сложности.
Кодовые таблицы для кодировки букв русского алфавита (кириллицы)
Существует довольно много различных кодовых таблиц, совпадающих в диапазоне
кодов от 0 до 127 со стандартом ASCII и использующих диапазон кодов от 128 до
255 для специальных символов и букв русского алфавита. Среди них наиболее
распространены следующие четыре:
1. Microsoft Windows Cyrillic code page 1251
Известна также как CP1251 или Windows1251. Наиболее широко применяется в