WWW, Детальна інформація

WWW
Тип документу: Реферат
Сторінок: 20
Предмет: Комп`ютерні науки
Автор: Олексій
Розмір: 101.8
Скачувань: 2123


Програми перегляду здатні правильно відобразити вміст файлів самих різних форматів, починаючи від найпростіших текстових і закінчуючи графічними, звуковими і іншими спеціалізованими форматами; при цьому, як ми вже знаємо, «рідним» форматом для WWW є HyperText Markup Language (HTML). А що ж відбувається, коли програма перегляду «не розуміє» формату файла, що завантажується? У перший раз зіткнувшись з цією нерідкою ситуацією, можна і розгубитися, тому нижче буде стисло описано два можливих варіанти розвитку подій:

1. Програма перегляду знає, яка з інших програм, встановлених на вашому комп'ютері, розуміє формат даного файла. - В цьому випадку програма перегляду запустить необхідну програму-помічника або програму-префікс і передасть їй отриманий файл для обробки. Як правило, програма перегляду, перш ніж запустити програму-помічника, питає вашого дозволу. Це робиться по тій причині, що навіть самий невинний на перший погляд файл може бути потенційно небезпечний для вашого комп'ютера. Зокрема, документи в форматі Word for Windows 6.0 можуть містити макрокоманди, здатні знищувати або переписувати файли на вашому жорсткому диску.

2. Програма перегляду не знає, в якої програми попросити допомоги при інтерпретації даного файла. - В цьому випадку вам буде запропоновано чотири альтернативи:

More Info... - дати додаткову інформацію про ситуацію, що виникла і запропонувати встановити програму-префікс (plug-in), який розуміє даний формат файла,

Pick App... - вибрати програму-помічника, вже встановлену на вашому комп'ютері, для обробки даного файла,

Save File... - зберегти файл на локальному диску,

Cancel - відмінити завантаження даного файла. Часто команду Save File... використовують для того, щоб отримати програмне забезпечення і документацію з колекцій («архівів»).

Проблема русифікації

Творці програмного забезпечення для роботи в WWW спочатку не були дуже стурбовані потребами людей, бажаючих публікувати і читати інформацію на своїх рідних мовах, що не використовують латинський алфавіт, в тому числі і на російській мові. Останнім часом ситуація починає помітно змінюватися до кращого, але все ж перегляд і публікація документів на російській мові зв'язана з деякими труднощами.

1.6. Коди і символи

Файл, що містить гіпертекстовий WWW-документ, являє собою текстовий файл. «Всередині» комп'ютера сучасної архітектури і при передачі по мережах кожний символ тексту представляється у вигляді цілого числа, яке, в свою чергу, кодується комбінацією з восьми двійкових розрядів, званих бітами. Така комбінація з восьми біт, що обробляються ЕОМ як одне ціле, отримала назву байт. Кожний біт в байті може мати рівно два стани: «включений» і «вимкнений», або «1» і «0».

Легко пересвідчитися, що існує рівно 256 комбінацій з восьми біт, кожний з яких може бути зайнятий або нулем, або одиницею. Таким чином виходить, що вісьма бітами (тобто, одним байтом) можуть бути представлені числа, або коди, від 0 до 255 (тобто, від 00000000 до 11111111 в двійковій системі числення). Кожному коду можна поставити у відповідність певний текстовий символ, наприклад, букву або цифру, або керуючий символ, такий як повернення каретки, перехід на новий рядок і т. п. Щоб текст виглядав однаково на моніторах різних комп'ютерів, необхідний певний стандарт на відповідність кодів і символів, що представляються ними для текстової інформації. Такий стандарт, прийнятий в цей час на переважній більшості комп'ютерних систем, отримав назву American Standard Code for Information Interchange (ASCII, вимовляється як «аскі»). Цей стандарт охоплює лише коди від 0 до 127. У кодовій таблиці ASCII не знайшлося місця для багатьох спеціальних символів, що часто використовуються. Також, з буквених символів там присутні тільки символи англійського алфавіта. Щоб закодувати букви національних алфавітів, в тому числі російського, зберігши при цьому сумісність з таблицею ASCII, необхідно використати коди в діапазоні від 128 до 255. Ось тут-то і починаються складності.

Кодові таблиці для кодування букв російського алфавіта (кирилиця)

Існує досить багато різних кодових таблиць, співпадаючих в діапазоні кодів від 0 до 127 зі стандартом ASCII і використовуючих діапазон кодів від 128 до 255 для спеціальних символів і букв російського алфавіта. Серед них найбільш поширені наступні чотири:

1. Microsoft Windows Cyrillic code page 1251

Відома також як CP-1251 або Windows-1251. Найбільш широко застосовується в «русифікованих» системах Microsoft Windows 3.1, 95, 98 і NT.

2. KOI8-r

Базується на державному стандарті Коду Обміну Інформацією КОІ8 (ГОСТ 19768-74). Застосовується в основному на комп'ютерах з операційною системою UNIX. Прийнята за стандарт кодування російськомовних текстів при обміні по електронній пошті. Більшість WWW-серверів зберігають російськомовні документи в цьому кодуванні. У цей час є набори шрифтів для Microsoft Windows в кодуванні KOI8-r. Вони були розроблені спеціально для мережевих програм, працюючих під Windows.

3. CP-866 Microsoft/IBM code page 866

Відома також як «альтернативне кодування ГОСТа» (в деяких документах її означають Alt-GOST або alt). Застосовується в основному на персональних комп'ютерах IBM PC з операційною системою MS-DOS при роботі в текстовому режимі. Програми перегляду під DOS практично не використовуються (звичайно на IBM-сумісних машинах вони працюють під Microsoft Windows). Однак, ми згадуємо це кодування, оскільки текст WWW-документа можна створювати в текстовому редакторі, працюючому під DOS.

4. ISO-8859-5

Розташування російських букв в ній практично співпадає з так званим «основним кодуванням ГОСТа» (іноді можна зустріти її позначення як Main-GOST). Застосовується рідко, хоч і є міжнародним стандартом кодування російського алфавіта, зареєстрованим International Standards Organization (ISO).

Декілька особняком від вищепереліченого кодування стоїть кодування Unicode, яке, за задумом її розробників, що входять в так званий консорціум Unicode, повинне раз і назавжди вирішити проблему зберігання в текстових файлах символів будь-кого з існуючих на Землі систем писемності. На жаль, поки ще Unicode використовується вельми рідко.

При перенесенні файлів з текстами на російській мові з одного комп'ютера на інший, або навіть з однієї програми в іншу, досить часто виникає необхідність перекодування таких файлів. Для перекодування файлів використовують спеціальні програми.

Для читання документів на російській мові ви повинні встановити в програмі перегляду шрифт, що використовує одну з кодових таблиць, що містять букви російського алфавіта (кирилиця).

Узгодження кодування сервера і програми перегляду

Якщо спробувати прочитати російськомовний WWW-документ, закодований за допомогою однієї кодової таблиці, програмою перегляду, що використовує шрифти, розраховані на іншу таблицю, то російський текст буде виглядати як безглуздий набір знаків. Наприклад, слово Привіт!, вислане сервером в кодуванні KOI8-r, при використанні програмою перегляду шрифту в кодуванні Windows-1251 виглядає на екрані як рТЙЧіФ! Як же примусити сервер і програму перегляду настроїтися на яке-небудь одне кодування?

Іноді турботу про відповідність кодових таблиць сервера і програми перегляду бере на себе сервер. При цьому він повинен визначити кодування, на яке настроєна програма перегляду, і висилати документи саме в цьому кодуванні. Для автоматичного визначення використовується можливість протоколу HTTP 1.0 передавати в заголовку запиту перелік допустимих форматів документів і наборів символів MIME content-type і charset. З багатьох причин цей підхід досить часто не спрацьовує. У такому випадку автори документів, розміщених на сервері, часто вдаються до більш універсального прийому, пропонуючи читачеві з декількох гіперпосилань вибрати ту, яка вказує на потрібний документ в бажаному кодуванні.

Деякі програми перегляду уміють самі підстроюватися під кодування документа, що висилається сервером, якщо кодування правильно вказане в заголовку відповіді WWW-сервера в спеціальному полі charset, передбаченому протоколом HTTP 1.0. На жаль, багато які сервери не настроєні так, щоб додавати це поле автоматично.

The online video editor trusted by teams to make professional video in minutes