- HTML Meta Charset – прописываем кодировку сайта
- Что такое кодировка сайта и как она работает
- Самые распространенные кодировки
- Проблемы с кодировкой не только в HTML-странице
- META Charset HTML-документа
- Все о мета тегах
- Мета теги делятся на две группы: NAME и HTTP-EQUIV.
- Группа информационных мета тегов
- Мета тег Description
- Мета тег Document-state
- Мета тег Generator
- Мета тег Keywords
- Мета тег Resource-type
- Мета тег Revisit
- Мета тег Robots
- Мета тег Subject
- Мета тег URL
- Мета тег Content-Language
- Meta тег Content-Script-Type
- Тег meta, кодировка страницы
- Сайт начинающего верстальщика
- Мета-теги для браузера в HTML
HTML Meta Charset – прописываем кодировку сайта
Автор статьи: Сергей Каминский
При создании сайта у начинающих веб-мастеров часто появляются вопросы: в какой кодировке делать сайт, чем отличается UTF-8 от windows-1251 и как ее прописывать в META Charset HTML-страницы сайта. Ответы на все эти вопросы в данной статье.
Что такое кодировка сайта и как она работает
Кодировку можно представить в виде таблицы, состоящей из разных букв, цифр и других символов понятных человеку, которые закодированы определенным образом. Когда вы открываете текстовый файл, к которым относятся в том числе HTML-страницы, то компьютер считывает из заголовка файла в какой кодировке он был сохранен и выводит текст в соответствующей кодировке преобразовывая компьютерные данные в вид понятный человеку сопоставляя эти данные с таблицей кодировки. Если информация о кодировке из заголовка файла совпадает с кодировкой в которой сохранены данные в HTML-странице, то пользователь видит привычные ему буквы, цифры и другие символы. Если же есть несовпадение, то в результате пользователю выводится непонятный набор символов, особенно часто это происходит в старых почтовых программах. Если пользователь получил письмо с непонятными крякозябрами, то просто перебирая разные кодировки, обычно получается угадать и выбрать ту, в которой написано письмо, и в результате непонятный набор символов превращается в понятный человеку текст.
То же самое происходит и с HTML-страницами сайта. Если документ был сохранен, например, в кодировке UTF-8, а в самом документе прописан META-тег указывающий что это кодировка windows-1251, то браузер опять же будет сопоставлять сохраненные в файле данные с таблицей указанной ему кодировки и так как символы закодированы по-разному, то браузер выведет вместо привычного текста непонятный набор символов или же часть букв может быть в нормальном виде, а другие буквы или символы могут выводиться, например, в виде знаков вопроса. Все выше сказанное относится в том числе и к отображению имен файлов.
Создавая новый документ в текстовом редакторе лучше сразу убедиться что выбрана нужная кодировка. Современные редакторы позволяют преобразовать текст открытого документа из одной кодировки в другую, а стандартный Блокнот позволяет выбрать кодировку только при сохранении файла.
Самые распространенные кодировки
Из предыдущего пункта вы уже знаете что такое кодировка и почему настолько важно правильно прописать ее в коде страниц сайта. Давайте теперь выясним какую из множества кодировок лучше выбрать для будущего сайта. Поскольку самой распространенной и наиболее понятной в освоении всегда была операционная система Windows, то большинство веб-разработчиков создавали HTML-страницы в кодировке windows-1251 (ANSI), которая использовалась по-умолчанию. Но windows-1251 поддерживает не очень большое количество букв и символов, а разработчики хотят использовать в своих текстах различные стрелочки, сердечки, квадратики и другие символы, в том числе есть необходимость совмещать слова из разных языков в одном документе, поэтому на смену ей уже давно пришла более расширенная UTF-8 и большинство разработчиков используют именно эту кодировку.
Проблемы с кодировкой не только в HTML-странице
Сайт, независимо от того является ли он просто набором статических HTML-документов или сложных динамических скриптов генерирующих страницы на лету, размещается на веб-сервере, который также работает с определенной кодировкой. И если сервер выдает информацию в одной кодировке, а ваши страницы или скрипты сохранены в другой кодировке, то опять же могут быть проблемы с отображением страниц в браузере пользователя. Многие хостинги позволяют менять настройки и выбрать кодировку в соответствии с той, которая используется в файлах сайта, через панель управления или же прописать ее в файле .htaccess, если на хостинге используется популярный веб-сервер Apache.
Практически ни один современный сайт не обходится без использования базы данных MySQL и она также может стать источником проблем с кодировкой. Если файлы сайта сохранены в одной кодировке, а информация в базе данных в другой, то на странице та часть информации, которая выводится из базы данных может отображаться в виде все тех же знаков вопросов или других непонятных символов. Чтобы избежать проблем с кодировкой она должна быть одинаковой для веб-сервера, базы данных MySQL, в скриптах, в HTML-страницах сайта и в META-теге, который прописывается в HTML-коде. Если есть проблемы с отображением текста, то проверяйте на наличие проблемы все выше перечисленное.
META Charset HTML-документа
Чтобы сообщить браузеру и поисковым системам в какой кодировке сохранены страницы сайта в их коде прописывается META Charset.
Для кодировки windows-1251:
Для кодировки UTF-8:
Теперь вы знаете что такое кодировка сайта и где искать проблемы если в какой-либо части сайта неправильно отображается текст.
Другие записи по теме в разделе статьи по HTML и CSS
Все о мета тегах
Мета теги используются для описания свойств HTML документа и должны находится в рамках тега HEAD. Если в документе используется тег TITLE, то мета теги рекомендуется вставлять в документ после него.
Мета теги имеют очень широкую функциональную направленность, но многое еще не стандартизировано или находится на стадии разработки.
Мета теги могут идентифицировать авторство HTML документа, его адрес и как часто он обновляется. Поисковые системы используют мета теги для индексации и формирования заголовков HTML документов.
Мета теги могут влиять на режим отображения HTML документов, хотя сами на экран не выводятся.
Далее будут описаны мета теги, принятые большинством поставщиков услуг и программ для сети интернет.
Мета теги делятся на две группы: NAME и HTTP-EQUIV.
Мета теги типа NAME содержат текстовую информацию о документе, его авторе и некоторые рекомендации для поисковых машин. Например: Robots, Description, Keywords, Author, Copyright.
Мета теги типа HTTP-EQUIV влияют на формирование заголовка документа и определяют режим его обработки.
Группа информационных мета тегов
Эти теги не отражаются броузерами, но обрабатываются некоторыми поисковыми машинами. Как правило, нет необходимости использовать эти теги одновременно. В большинстве случаев достаточно одного информационного тега, позволяющего идентифицировать автора или принадлежность документа.
Тег Author должен содержать имя автора, если сайт принадлежит организации, имеет смысл использовать тег Copyright. Информация обязательно должна заключаться в кавычки, например:
Дополнительно информационные теги могут содержать атрибут «Lang», указывающий язык, на котором написано значение свойства. Пример:
Мета тег Description
Мета тег Description — служит для краткого описания странички.
Он используется поисковыми машинами для индексации и в качестве краткой аннотации при ссылке в ответе на запрос. И именно по содержанию этого тега пользователь поисковой системы будет оценивать, соответствует ваш сайт его ожиданиям или нет.
Если тег Description отсутствует, то в качестве описания поисковые машины используют первую строку текста или отрывок из текста с найденным ключевым словом.
Желательно чтобы длина описания не превосходила 80 символов. Пример:
Мета тег Document-state
Мета тег Document-state — предназначен для управления индексацией поисковых роботов. Может иметь два значения:
Static — Нет необходимости индексировать эту страницу в будущем.
Dynamic — Индексировать эту страницу регулярно (по умолчанию).
Режим «Static» предназначен для страниц, которые не меняются в принципе. Если содержание вашей страницы периодически меняется, то использовать этот тег необязательно. Пример:
Мета тег Generator
Мета тег Generator — это всего лишь один из «славного» семейства тегов широко используемых генераторами HTML кода в своих целях. Как правило, для владельца сайта эти теги не несут полезной нагрузки.
Мета тег Keywords
Мета тег Keywords используется поисковыми машинами для оценки релевантности.
Слова, содержащиеся в теге Keywords, рассматриваются поисковыми машинами как рекомендация, но иногда именно этой капли не хватает, чтоб перевесить чашу.
При формировании списка ключевых слов для мета тега Keywords необходимо использовать слова, содержащиеся в тексте документа. Слова, не содержащиеся в тексте, можно использовать в очень небольших количествах, два — три слова. Вставлять их надо в конец списка.
Ключевые слова не должны повторятся в теге Keywords, в крайнем случае, не более двух раз.
В мета теге Keywords имеет смысл использовать не более 10 слов, большее количество релевантности не увеличит.
В Большинстве случаев поисковые машины находят ключевые слова, стоящие во множественном числе (cats), даже если поиск задан в единственном числе (cat). Поэтому рекомендуется в тег Keywords заносить английские существительные во множественном числе.
Роботы некоторых поисковых машин не переходят к новой строке при анализе мета тега Keywords, поэтому не рекомендуется разбивать его на несколько строк.
Если документ написан на нескольких языках, можно использовать добавочный атрибут lang для выбора кодировки (смотри описание мета тега Content-Language).
Но более предпочтительно сделать отдельные страницы, каждая на своем языке с переходами с одной на другую, с помощью тегов и
.
Мета тег Resource-type
Мета тег Resource-type — описывает состояние данного документа. Если его значение отлично от “Document”, то поисковые системы не будут его индексировать.
Предназначен для использования в крупных проектах, с множеством документов разного типа.
Некоторые возможные значения:
Build
Classification
Creation
Document — Принимается по умолчанию.
Formatter
Host
Operator
Random text
Rating
Site-languages
Subject
Template
Version
Мета тег Revisit
Мета тег Revisit — указывает поисковому роботу, через сколько дней ему нужно вернуться и переиндексировать данный документ.
Пример (приходить раз в неделю):
Мета тег Robots
Мета тег Robots — содержит указания для роботов поисковых машин, собирающих информацию о HTML документах в сети.
Значение свойства Robots может состоять из следующих директив, разделенных запятыми:
Index — эта страница должна быть индексирована.
Noindex — эта страница не должна индексироваться.
Follow — прослеживать гиперссылки на странице.
Nofollow — не прослеживать гиперссылки на странице.
All — = index, follow (принято по умолчанию).
None — = noindex, nofollow.
Тег ничего не меняет в работе робота поисковой машины, так как значение «all» принято по умолчанию.
Но если эта страница создается динамически или очень часто обновляется, то нет смысла ее индексировать, так как информация о странице в поисковой машине и ее истинное содержание будут разными.
В этом случае можно рекомендовать поисковой машине не индексировать эту страницу, а только отслеживать на ней гиперссылки, что бы проиндексировать остальную часть сайта
При использовании тега, запрещающего отслеживание гиперссылок
часть сайта может остаться не проиндексированной, так как внутри сайта роботы перемещаются по гиперсылкам. И те страницы, переход на которые заблокирован, не будут индексированы.
Мета тег Robots имеет приоритет над директивами управления, заданными в файле robots.txt.
Мета тег Subject
Мета тег Subject используется поисковыми машинами для определения тематики документа. Но до тех пор, пока поисковые системы не согласуют классификационные таблицы, использование этого тега не всегда оправдано.
Мета тег URL
Мета тег URL — служит для исключения из индексации генерируемых страниц и зеркал. Встретив этот тег, робот поисковой машины должен прекратить индексацию текущего документа и перейти по указанной ссылке. Пример:
Мета тег Content-Language
Мета тег Content-Language — это указание языка документа. Используется поисковыми машинами при индексировании. Хотя большинство из них умеют различать язык по тексту.
Некоторые возможные значения (стандарт [ISO639], [ISO3166]): de, el, en, en-GB, en-US, en-cockney, es, fr, it, i-navajo, ja, he, nl, ru, pt.
В спецификации HTML 4.0 есть альтернативная возможность явного указания языка —
Meta тег Content-Script-Type
Meta тег Content-Script-Type — Определение языка программирования сценариев.
Некоторые из возможных значений: text/javascript, text/perlscript, text/tcl, text/vbscript.
Если тег Content-Script-Type не используется, то тип языка программирования сценариев, отличный от принятого по умолчанию, должен быть указан непосредственно в каждом теге
Тег meta, кодировка страницы
Отлично! С разметкой контента мы закончили. Снова возвращаемся к тегу .
Важный тег, который включается в — тег . Он одиночный, то есть не требует парного закрывающего тега в конце.
С помощью можно сообщать браузеру, поисковому роботу или другому устройству различную служебную информацию (или метаинформацию) о вашем сайте: кодировку текста, описание контента и так далее. Для этого используются теги с разными атрибутами и их значениями. Вот некоторые из атрибутов: charset , content , http-equiv , name и scheme .
С помощью атрибута charset указывается кодировка текста HTML-страницы:
Лучше всегда указывать кодировку явно. Если этого не делать, браузер может неправильно угадать её, и вместо текста будут отображаться «иероглифы».
Самая распространённая современная кодировка — utf-8 . Используйте её во всех своих проектах. Раньше часто использовали кодировку windows-1251 , стандартную кодировку для кириллицы в Windows. Но сейчас это считается плохой практикой.
,
, и другие теги, включаемые в , имеют особый тип содержимого — метасодержимое. Они не отображаются на странице напрямую, а служат для хранения информации о документе и для взаимосвязи документа с другими документами и системами.
Сайт начинающего верстальщика
Всем привет! Добро пожаловать на мой первый сайт. Ещё недавно я понятия не имел, кто такой верстальщик, а теперь я нашёл тренажёры по HTML и CSS и поставил перед собой цель — стать им. У меня даже появился инструктор — Кекс, который не позволит мне расслабиться и будет следить за моими успехами.
Моё первое задание — вести дневник и честно писать обо всех своих свершениях.
Мета-теги для браузера в HTML
В этой статье мы с Вами обсудим различные мета-теги для браузера в HTML . Их значение гораздо выше мета-тегов, которые мы рассматривали в статье по мета-тегам для страницы , поэтому с данным материалом необходимо ознакомиться каждому.
Сначала давайте разберём то, как вставляются мета-теги для браузера . Как и другие типы мета-тегов, они вставляются внутри тега head > по следующему синтаксису:
Процесс вставки мета-тегов для браузера в HTML такой же, как и для мета-тегов для страницы , однако, здесь вместо атрибута » name » используется атрибут » http-equiv «. Теперь перечислю самые важные мета-теги для браузера :
- Content-type — важнейший мета-тег, который содержит тип документа, а также его кодировку. Всегда пишите данный мета-тег!
- Content-language — мета-тег, содержащий язык данной страницы.
- refresh — мета-тег, позволяющий запускать либо автоматическое обновление, либо редирект на другую страницу (сайт) через заданный промежуток времени.
Чтобы стало понятно, как использовать эти мета-теги для браузера в HTML , приведу пример:
Я ещё раз напоминаю о важности мета-тега » Content-type «. Это одна из причин того, почему так много сайтов имеют неправильную кодировку. Я часто читаю в книгах, слышу, что говорят люди о том, что якобы браузер сам правильно определяет кодировку. Это не так! В большинстве случаев, так оно и есть, но он не всегда это делает правильно, поэтому необходимо указывать мета-тег » Content-type » на каждой странице сайта.
Что касается мета-тега » refresh «, то здесь всё просто: число (в примере — 10 ) означает, через какое количество секунд перейти по адресу, указанному в параметре » url «. Если Вы укажите адрес текущей страницы, то у Вас будет просто происходить обновление через заданный промежуток времени, что бывает очень даже полезно и удобно.