- Как поменять кодировку (encoding) в текстовом редакторе?
- Текстовые файлы
- Кодировка файлов
- BOM (Byte Order Mark) — метка порядка байтов
- Смена кодировки файлов в блокноте (notepad)
- Как поменять кодировку в Notepad++
- Заключение
- Кодировка в Notepad++
- Национальные кодировки редактора
- Кодировка UTF-8 без BOM
- Как сменить кодировку файла? Notepad++ редактор с подсветкой синтаксиса, кодировка Utf-8 без BOM
- Чем вообще хорош этот редактор?
- Как сменить кодировку текстового файла с помощью Блокнота в Windows
- Gtalk.kz
- Наверстываю упущенное …
- Урок 6. Кодировка файлов: настройка Notepad++, PhpDesigner, PSpad, Rapid PHP
Как поменять кодировку (encoding) в текстовом редакторе?
Дата создания: 2012-05-07 07:11:41
Последний раз редактировалось: 2012-05-07 07:13:51
Я давно искал, в какой урок засунуть данный материал. В итоге решил немного расширить его и положить в отдельную статью.
Итак, сегодня мы научимся менять кодировку (encoding) в двух текстовых редакторах: стандартный блокнот (notepad) и Notepad++
Но сначала пару слов о текстовых файлах.
Текстовые файлы
Существует два вида текстовых файлов: простые текстовые файлы и текстовые файлы, содержащие информацию о форматировании (так называемый Rich Text Format).
Мы будем работать только с простыми текстовыми файлами.
Кодировка файлов
Все текстовые файлы имеют какую-то кодировку. Основных две: ANSI и Юникод. В ANSI кодировках (а их много) может быть закодировано только 256 символов. Если у вас русифицированная Windows, то блокнот создаёт текстовые документы в кодировке Windows-1251 — это одна из кодировок ANSI. Какая кодировка ANSI используется, зависит от языка операционной системы.
Юникод может содержать гораздо больше символов — примерно 65 тысяч, поэтому в Юникоде закодированы все письменности. Тем не менее, существует несколько вариантов юникода. Unicode LE используется в Windows, UTF-8 — распространён в интернете.
BOM (Byte Order Mark) — метка порядка байтов
Для различия различных версий юникода, в начале текстового файла может ставиться специальная метка — которая и говорит, в какой версии юникода закодирован текст файла.
Метка состоит из 2-4 байтов.
Использование BOM необязательно, а в некоторых случаях и нежелательно — особенно, если речь идёт о файлах с исходным кодом.
Ну а теперь, посмотрим, как менять кодировку в текстовых редакторах:
Смена кодировки файлов в блокноте (notepad)
В стандартном текстовом редакторе кодировку можно поменять только при сохранении файла.
Для этого используется пункт меню Файл -> Сохранить как.
В открывшемся диалоговом окне внизу можно выбрать нужную кодировку. Причём вариантов всего четыре:
ANSI — одна из кодировок ANSI (зависит от текущего языка ОС), Unicode — Little-Endian версия Юникода, которая используется в Windows. Unicode BE — Big-Endian версия Юникода (используется в (*NIX ОС), UTF-8 — Юникод для хранения файлов в интернете.
Как поменять кодировку в Notepad++
В Notepad++ есть возможность сохранить текст в UTF-8 без BOM метки. А также можно сохранить файл в различных версиях ANSI (пункт меню Кодировки -> Кодировки).
Заключение
Зачем нам знать, как менять кодировку в текстовых редакторах? IDE Visual C++ сама выбирает кодировку. Если вы откроете любой файл с исходным кодом (.cpp или .h) в простом текстовом редакторе, то увидите, что кодировка этого файла — ANSI.
В программах на ассемблере мы тоже будем использовать ANSI — этого требует компилятор. А вот когда будем разбирать скриптовые языки, то файлы с исходниками можно будет сохранять в UTF-8.
Кодировка в Notepad++
Довольно часто приходится менять кодировку в документах, лично мне в PHP файлах, эта заметка о том, как поменять кодировку в Notepad++.
- ANSI,
- UTF-8 без BOM,
- UTF-8,
- UCS-2 Big Endian,
- UCS-2 Litte Endian,
- Национальные кодировки.
Если у вас не правильная кодировка в документе, вы увидите кракозябры (они же иероглифы и т. д ., по факту – непонятный и бессмысленный набор символов). Для преобразования символов в читаемый текст (как правило в кракозябры преобразуется Кириллица) смените кодировку документа. Текущая кодировка указанна в нижнем правом углу редактора. Для изменения кодировки перейдите на вкладку Кодировки — Преобразовать в (и выберите нужную кодировку).
Национальные кодировки редактора
В редакторе Notepad++ есть несколько национальных кодировок, но мне не приходилось ими пользоваться, думаю, вам тоже не придется, но если вы хотите что бы я сделал их обзор – напишите мне об этом в форме обратной связи.
Кодировка UTF-8 без BOM
Не буду вдаваться в подробности, в целом можно сохранять различные файлы как с BOM (Byte Order Mark, BOM – маркер последовательности байтов), так и без. Исключение – PHP файлы, рекомендую сохранять их без BOM.
Как сменить кодировку файла? Notepad++ редактор с подсветкой синтаксиса, кодировка Utf-8 без BOM
Notepad++ — отличный текстовый редактор!
В статье о кодировках текста я описал основные моменты, показывающие, почему необходимо учитывать кодировку файла (например, при создании html-страницы). Здесь же я опишу простой способ выставления нужной кодировки текста с помощью простого и быстрого редактора Notepad++.
Чтобы скачать данную программу, заходим на официальный сайт — Notepad-plus-plus.org — далее ищем ссылку «download», кликаем по ней и выбираем «Notepad++ v*** Installer», где вместо звёздочек будет текущая версия редактора. Скачиваем и устанавливаем, никаких сложностей при установке нет.
Чем вообще хорош этот редактор?
Во-первых , подсветка синтаксиса — редактор Notepad++ неплохо понимает разные языки программирования (тип языка определяется по расширению файла, например file.php — php-файл, index.html — html-файл) и производит автоматическую подсветку управляющих конструкций языка.
Notepad++ понимает php и подсвечивает синтаксис языка. Кликабельно
Во-вторых , в нём можно легко изменить кодировку текстового файла на нужную ( чтобы быстро её сменить, щёлкаем вкладку «Кодировки», затем «Преобразовать в …» — кликайте рисунок ниже ) и, что самое главное, отредактировать любой файл без изменения текущей кодировки (кодировка не «слетает»).
Последняя особенность очень важна, например, при редактировании шаблонов движка вашего сайта (напр., WordPress). Почему? Потому что все файлы WP по умолчанию имеют кодировку Utf-8. Если менять их стандартным блокнотом Windows, то к кодировке Utf-8 добавляется специальная BOM-последовательность. Необязательно знать, что это такое, но из-за неё некоторые функции движка работать вообще не будут. Поэтому так важно, чтобы все файлы шаблонов WP были сохранены в кодировке Utf-8 без BOM.
Преобразование в кодировку Utf-8 без BOM
Теперь, чтобы открыть текстовый файл данным редактором, надо кликнуть по нему правой кнопкой мышки и выбрать соответствующий пункт меню:
Открытие .txt файлов Notepad++
Таким образом, установив на свой компьютер программу Notepad++ можно получить многофункциональный редактор текста с подсветкой синтаксиса и возможностью манипуляций с кодировками.
Как проверить уникальность текста на сайте? 3 способа Я уже писал про важность уникальных текстов на сайте — это и правда имеет зн.
Как перенести сайт с одного хостинга на другой? Перенос сайта на другой хостинг PHP MySQL Недавно написал я статью про конец света, и вскоре с данным сайтом стало твор.
12 марта 2014 — Яндекс официально отключил влияние ссылок для коммерческих запросов по Москве . но. Яндекс и ссылки — что на самом деле? То, что я написал выше — это что-то вроде
Где купить домен — лучше у регистратора или сразу на хостинге? В данной статье решил высказать свои размышления на тему где покупать.
SE Ranking – удобный инструмент для анализа сайта Любому вебмастеру и оптимизатору требуются различные сервисы, с помощью которы.
Спасибо! Хорошая статья. Утвердился в том, чтобы преобразовывать всегда на «без BOM», раньше постоянно мучился: «Что же использовать?». Ещё раз, спасибо.
Огромное спасибо.
Со своим сайд баром замучался, еще не финиш, но когда читаешь и видишь … Спасибо.. Звонок другу не понадобился… =)
у меня часто не с кодировками а со шрифтами возникают проблемы.открываешь текстовый файл нотепадом скопированный и сохранённый из командной строки, а там крякозябры. потому что шрифт терминал, а у нотепада сегое уи и не как не сохранить этот файл в сегои уи, хотя изменять шрифт в нотепад можно и читать, но сохранить текст в другом шрифте нельзя =-O
а где скачать нормальный нотепад. чтобы без виросов всяких?
я, а чего вы с официального сайта не качаете? Там же без вирусов.
Как сменить кодировку текстового файла с помощью Блокнота в Windows
Фишка кодировки текстовых фалов в том, что хранятся не сами буквы (символы), а ссылки на них в таблице кодировок. Если с латинским буквами, арабскими цифрами и основными символами типа точек, тире и запятых никаких проблем не возникает: во многих таблицах кодировок все эти буквы, цифры и символы находятся в одних и тех же ячейках, то с кириллицей всё сложно. Например, в разных кодировках буква Ы может находиться в ячейке 211, 114 и 69.
Именно поэтому на заре интернета чтобы посмотреть разные сайты с разными кодировками приходилось подбирать кодировку. (Но кто это помнит?) Сейчас кодировка страницы обычно прописана в заголовке страницы, что позволяет браузеру «автоматически» подбирать отображение символов на наших мониторах.
То есть сервер отдаёт не просто HTML-страничку, а указывает, что у неё кодировка Windows-1251 . Браузер таким образом, считывая информацию о кодировке полученного файла, подставляет символы из указанной кодировки.
Но и это ещё не всё веселье. Например, если на сервере установлена операционная система из семейства *nix (с кодировкой по умолчанию UTF-8 ), а мы шлём файл из нашей любимой ОС Windows, где кодировка текстовых фалов по умолчанию стоит почему-то ANSI , то как вы думаете сервер будет работать с текстом, кодировка которой не совпадает с его? Правильно! Как-то будет работать! Но результат работы может быть непредсказуемым и удивительным. =)
Надеюсь, что мотивация для обращение необходимого внимания на кодировку достаточная и можно перейти к сути вопроса: «Как же, чёрт возьми, сохранить файл в нужной кодировке?!»
В этой статье речь пойдёт как раз о том, как сохранить текстовый файл с помощью программы Блокнот (Notepad) в Windows в нужной кодировке.
Для того, чтобы изменить кодировку текстового файла, конечно же сперва его нужно создать. А после того, как файл создан, нужно ещё суметь его открыть. Самый простой способ отрыть файл — это двойной клик левой кнопкой мыши по его иконке в проводнике:
Если до этого настройки Windows не менялись, то файлы с расширением .txt открываются в Блокноте. (Это ещё один способ, как отрыть Блокнот (Notepad).)
Чтобы поменять кодировку в открывшемся файле, нужно в меню «Файл» текстового редактора Блокнот выбрать пункт «Сохранить как. »:
Откроется диалоговое окно сохранения файла. Для смены кодировки, нужно выбрать из списка предлагаемых необходимый:
После того, как нужная кодировка выбрана, можно кликнуть на кнопку «Сохранить» или просто нажать Enter:
Так как мы не изменили имя файла, то будет перезаписан тот же самый файл. Поэтому возникает справедливый вопрос: «Файл с таким именем уже существует. Заменить?» Ну да, мы к этому и стремимся! Поменять кодировку у этого файла. Поэтому его нужно перезаписать с новой кодировкой. Соглашаемся:
Всё! Миссия по смене кодировки в текстовом файле выполнена! Файл сохранён с новой кодировкой. Можно закрыть текстовый редактор и устроить празднование этого решающего события! =D
Gtalk.kz
Наверстываю упущенное …
Урок 6. Кодировка файлов: настройка Notepad++, PhpDesigner, PSpad, Rapid PHP
Как всегда приветствую Вас, ищущего полезную информацию по верстке сайтов. Сегодня мы поговорим о кодировке файлов. Данную тему важно запомнить один раз и больше к ней не возвращаться. Сегодня мы будем говорить о том, как сохранить файл в кодировке utf-8, почему необходимо использовать utf-8?
Что же такое юникод, utf-8, преимущества и минусы можно почитать на Wikipedia, так и на других сайтах, например, мне понравилась статья Дмитрия, в ней интересно описано откуда и почему появились кодировки ASCII, юникод и UTF 8, расширенная ASCII (Windows 1251, CP866, KOI8-R).
Давайте, перейдем к нашей теме и начнем разбираться с проблемами во время нашей верстки сайта.
Основной проблемой неправильной кодировки это отображение текста как кроказябли, непонятные символы и т.д. Так же в кодировке window-1251 отсутствуют специальные символы (что-то типа копирайтов §, ©, ‰) и другие пинтограммы (♥, ☺).
Все это от того, что в cp1251, например, всего 256 символов (что в принципе достаточно для кирилицы), а в Unicode более 100 000 символов. Поэтому я советую создавать html каркас (как html верстальщик) и вообще сайты с кодировкой utf-8. Вы скажите мне достаточно window-1251, так как я использую кириллицу. Полностью согласен с Вами, но если Вы захотите использовать специальные символы, или сделать мультиязычный сайт? Ну, а в связи с тем, что я верстаю для Казахстана, то кодировки cp1251 изначально не подходит, так как обычно используется казахский, русский и английский языки. Лучше запостись символами .
Как сохранить файл в кодировке utf-8 без BOM? (utf-8 without BOM)
Именно так и надо сохранять без BOM (Byte Order Mark или— сигнатура – три символа, которые все портят).
Не все программы способны сохранять файлы в кодировке utf-8 без BOM. Яркий пример – Блокнот от Windows.
Программа Notepad++
Программа шикарная и очень полезная как для верстальщика, так и для программистов, веб-разработчиков. Посетите официальный сайт, там же можно скачать редактор совершенно бесплатно.
Откройте файл и выберите преобразовать в utf-8 без BOM.
Если нажмете кодировать в utf-8 без BOM, то произойдет следующее.
Если сомневаетесь и, чтобы не рисковать всегда делайте backup – резервное копирование!
Программа PhpDesigner
PhpDesigner – удобный редактор. Программа платная.
Немного сложней будет. Для начала проведем настройки для браузеров:
1. Откройте выпадающее меню: Создать новый файл -> Изменить шаблон (Edit template) либо Файл -> Новый… -> Edit templates
2. Выберите Html и вставьте туда следующий код и поставьте галочку на «Использовать данный шаблон для HTML/XHTML» (Use this template for HTML/XHTML):
Установка кодировки:
– Пройдите: Инструменты -> Установки (или вызовите через CTRL + E) и выставите соответствующую кодировку.
Для преобразования отдельного файла используйте:
Файл -> Кодировка файла -> utf-8
Текущую кодировку можно увидеть в нижней части программы слева.
Можно, конечно, пойти другим путем. Создать файл, после открыть файл в Notepad++ и сделать соответствующие настройки.
Программа PSpad
Pspad — еще один неплохой текстовый редактор. Кстати, полностью бесплатный. Функций больше чем у Notepad++.
Поменять кодировку текущего файла в Pspad очень просто: Вкладка Формат -> Выбрать необходимую кодировку (например, utf-8)
Кодировка для браузеров по умолчанию:
Создать новый файл (Ctrl + N) -> Из шаблона -> Html -> Html 4.01 Transitional -> Правка…
В charset впишите необходимую кодировку, например:
Сохраните и закройте шаблон.
Теперь, создавая новый файл из шаблона все будет готово.
Программа Rapid PHP (2010)
Rapid PHP – платный текстовый редактор.
Для настройки кодировки сделайте следующее:
Опции -> Настройки… -> Файл -> utf-8 без BOM (либо другая кодировка)
По умолчанию файл html создается без meta данных. Вставить кодировку (charset) для браузеров можно так:
Вставка -> Кодировка -> Unicode (utf-8) (либо другая необходимая)
Кодировка с помощью .htaccess
С помощью файла .htaccess можно заставить браузер отобразить нужную кодировку. Не советую пользоваться данным методом на работающих сайтах (я обычно использую только для html на локалке, ), но все же метод работающий. Добавьте в файл:
Внимание! Ваш хостинг может не поддерживать данные настройки.
Сообщение кодировки для браузеров
Как браузеры понимают, в какой кодировке Вы писали свой файл? Для этого и существует строка (мета данные):
Т.е. браузер по умолчанию «читает» страницу в кодировке utf-8. Это Вы в принципе, должны знать еще из школьной программы.
В принципе, это основные настройки. Если остались вопросы, отписывайтесь в комметариях, чтобы закрыть эту тему с кодировкой и сохранить себе нервы .
Надеюсь информация была полезной. Спасибо за Ваши like и ретвиты.
Постовой: Если Ваш интернет магазин не приносит доходы, то пора сделать полный анализ интернет магазина. Хватит терять потенциальных клиентов!
На десерт сегодня вирусное видео про Светлакова. Но все же мне понравилось, обязательно надо сходить на его фильм