Windows utf по умолчанию

Настройка UTF8 в качестве кодировки символов по умолчанию в Windows 7

Есть ли способ настроить Windows 7 на глобальное использование UTF-8 в качестве стандарта?
это действительно раздражает, чтобы каждый текстовый редактор использовал его.

Краткий ответ — нет, это невозможно .

Чтобы уточнить, я боюсь, что вы не найдете глобальную опцию кодирования в Windows 7, которая позволит вам обоим 1) установить глобальное значение по умолчанию, которому будут подчиняться 2) все приложения, которые вы перечислили.

Кроме того, я хотел бы спросить, какую проблему здесь вы пытаетесь решить?

Приложение самостоятельно выбирает, используют ли они Юникод для представления данных. Хотя использование Юникода приветствуется , вы никогда не можете быть уверены, что все ваши приложения действительно поддерживают его.

Однако вы можете изменить кодировку символов по умолчанию для каждого из перечисленных приложений:

  • Для Eclipse кодировка по умолчанию для новых файлов может быть установлена ​​в Windows> «Установки»> «Основные»> «Типы содержимого» (см. Сообщение в Eclipse Community Forms ).
  • Для Notepad ++ перейдите в « Настройки»> «Установки»> «Новый документ / По умолчанию / Каталог» и установите для «Кодировка» значение UTF-8.
  • Что касается Thunderbird, я уверен, что он уже использует UTF-8 в качестве кодировки по умолчанию? (см. эти заметки о кодировке символов )
  • В случае OpenOffice (и LibreOffice) вам даже не нужно заботиться о кодировании, поскольку документы, сохраненные OpenOffice, основаны на XML, в котором кодировка указана внутри в XML-файлах (а UTF-8 уже по умолчанию там тоже)
  • С точки зрения UTF-8 PowerShell сложен. Он имеет кодировку по умолчанию UTF-16LE .
    • Для вывода файлов из PowerShell в UTF-8 см. Этот ответ
    • Для изменения кодировки по умолчанию см. Этот ответ

Это невозможно в основном потому, что Windows не допускает UTF-8 в качестве системной кодовой страницы ANSI, даже если она имеет кодовую страницу ANSI для UTF-8, кодовую страницу 65001 . Кажется, есть несколько причин для этого:

  • Когда Unicode был новым, Microsoft решила, что UCS-2 будет лучшим способом поддержки Unicode. В то время Unicode был 16-битным.
  • В Windows есть одна кодовая страница ANSI для каждого поддерживаемого языка , в отличие от Unix и Linux, где язык и кодировка могут быть установлены независимо.
  • Кодовая страница 65001 не работает везде. В частности, он не работает с некоторыми из поддержки многобайтовости в Windows, где многобайтовые символы требуют один или два байта, тогда как UTF-8 требует от одного до четырех байтов. WriteFile() API , например , возвращает неправильный результат при кодировке 65001 , которая пузырится через все библиотеки кода , опираясь на него , такие как write() .

У покойного Майкла Каплана, который работал над интернационализацией в Microsoft, был блог «Sorting it all Out» , с несколькими постами на смежные темы. Я отправил ему электронное письмо о некоторых из этих проблем в тот день.

Изменить кодовую страницу консоли Windows по умолчанию на UTF-8

В настоящее время я использую Windows 7 x64, и обычно я хочу, чтобы все консольные инструменты работали с UTF-8, а не с кодовой страницей по умолчанию 850.

chcp 65001 Помогает запуск в командной строке перед использованием каких-либо инструментов, но есть ли способ установить его как кодовую страницу по умолчанию?

Обновить:

Изменение HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage\OEMCP значения, чтобы 65001 появилось, чтобы система не могла загрузиться в моем случае.

Предлагаемое изменение, HKEY_LOCAL_MACHINE\Software\Microsoft\Command Processor\Autorun чтобы @chcp 65001>nul служить просто хорошо для моей цели. (спасибо Ole_Brun )

Чтобы изменить кодовую страницу только для консоли, выполните следующие действия:

  1. Пуск -> Выполнить -> regedit
  2. Перейти к [HKEY_LOCAL_MACHINE\Software\Microsoft\Command Processor\Autorun]
  3. Измените значение на chcp 65001

Лично мне не нравится смена реестра. Это может вызвать много проблем. Я создал командный файл:

Я сохранил C:\Windows\System32 как switch.bat.

Я создал ссылку для cmd.exe на рабочем столе.

В свойствах ярлыка cmd изменил место назначения на: C:\Windows\System32\cmd.exe /k switch

Вуаля, когда мне нужно набрать UTF-8, я использую эту ссылку.

  1. Значение должно быть в шестнадцатеричном
  2. Верхняя строка должна быть включена в точности как есть
  3. HKEY_CURRENT_USER не может быть сокращено
  4. меч не может быть опущен
  1. Значение может быть в декабре или шестнадцатеричном
  2. % SystemRoot% должен быть экранирован
  3. REG_DWORD нельзя опускать
  1. Значение может быть в декабре или шестнадцатеричном
  2. -Type DWord предполагается с PowerShell 3+
  3. Можно использовать ni -> New-Item
  4. Можно использовать sp -> Set-ItemProperty
  5. Можно использовать -ea 0 -> -ErrorAction Ignore
  1. Значение может быть в декабре или шестнадцатеричном
  2. Можно использовать / -> \
  3. Можно использовать HKCU -> HKEY_CURRENT_USER
  4. Можно использовать user -> HKEY_CURRENT_USER
Читайте также:  Устанавливать драйвера linux ubuntu

Команда для изменения кодовой страницы есть chcp . Пример: chcp 1252 . Вы должны напечатать это в окне Powershell. Чтобы избежать необходимости набирать его каждый раз (если вам всегда приходится менять кодовую страницу), вы можете добавить его в командную строку программы. Для этого выполните следующие действия:

  1. Щелкните правой кнопкой мыши значок Powershell в меню «Пуск» и выберите «Дополнительно»> «Расположение файла».
  2. Щелкните правой кнопкой мыши ярлык Powershell и выберите «Свойства».
  3. Добавьте следующее в конец командной строки «Target»: -NoExit -Command «chcp 1252»

Будь счастлив. Не суетитесь с реестром Windows, если у вас нет другого выбора.

Это можно сделать, создав профиль PowerShell и добавив в него команду «chcp 65001> $ null»:

Это не требует редактирования реестра и, в отличие от редактирования ярлыка, будет работать, если PowerShell запускается в определенной папке с помощью контекстного меню проводника Windows.

В 1809 сборке Windows 10 мне удалось решить эту проблему навсегда, перейдя в систему Language settings , выбрав Administrative language settings , нажав Change system locale. и установив Beta: Use Unicode UTF-8 for worldwide language support флажок, а затем перезагрузив мой компьютер.

Таким образом, это относится ко всем приложениям, даже к тем, которые я не запускаю из командной строки!
(Что было необходимо для меня, так как я пытался редактировать код Agda из Atom.)

Настройка UTF8 в качестве кодировки символов по умолчанию в Windows 7

Есть ли способ настроить Windows 7 на глобальное использование UTF-8 в качестве стандарта?
это действительно раздражает, чтобы каждый текстовый редактор использовал его.

2 ответа 2

Краткий ответ — нет, это невозможно.

Чтобы уточнить, я боюсь, что вы не найдете глобальную опцию кодирования в Windows 7, которая позволит вам обоим 1) установить глобальное значение по умолчанию, которому будут подчиняться 2) все приложения, которые вы перечислили.

Кроме того, я хотел бы спросить, какую проблему здесь вы пытаетесь решить?

Приложение самостоятельно выбирает, используют ли они Юникод для представления данных. Хотя использование юникода приветствуется, вы никогда не можете быть уверены, что все ваши приложения действительно поддерживают его.

Однако вы можете изменить кодировку символов по умолчанию для каждого из перечисленных приложений:

  • Для Eclipse кодировка по умолчанию для новых файлов может быть установлена в Windows> «Установки»> «Основные»> «Типы содержимого» (см. Публикацию в Eclipse Community Forms).
  • Для Notepad++ перейдите в « Настройки»> «Установки»> «Новый документ / По умолчанию / Каталог» и установите для «Кодировка» значение UTF-8.
  • Что касается Thunderbird, я уверен, что он уже использует UTF-8 в качестве кодировки по умолчанию? (см. эти заметки о кодировке символов)
  • В случае OpenOffice (и LibreOffice) вам даже не нужно заботиться о кодировке, поскольку документы, сохраненные OpenOffice, основаны на XML, в котором кодировка указана внутри в XML-файлах (а UTF-8 уже по умолчанию там тоже)
  • С точки зрения UTF-8 PowerShell сложен. Он имеет кодировку по умолчанию UTF-16LE .
    • Для вывода файлов из PowerShell в UTF-8 см. Этот ответ
    • Для изменения кодировки по умолчанию смотрите этот ответ

Это невозможно в основном потому, что Windows не допускает UTF-8 в качестве системной кодовой страницы ANSI, даже если она имеет кодовую страницу ANSI для UTF-8, кодовую страницу 65001. Кажется, есть несколько причин для этого:

  • Когда Unicode был новым, Microsoft решила, что UCS-2 будет лучшим способом поддержки Unicode. В то время Unicode был 16-битным.
  • В Windows есть одна кодовая страница ANSI для каждого поддерживаемого языка, в отличие от Unix и Linux, где язык и кодировка могут быть установлены независимо.
  • Кодовая страница 65001 не работает везде. В частности, он не работает с некоторыми из поддержки многобайтовости в Windows, которые ожидают, что многобайтовые символы требуют один или два байта, тогда как UTF-8 требует от одного до четырех байтов. Например, API WriteFile() возвращает неверный результат под кодовой страницей 65001, которая всплывает через весь библиотечный код, полагаясь на него, такой как write() .

У покойного Майкла Каплана, который работал над интернационализацией в Microsoft, был блог «Sorting it all Out», с несколькими постами на смежные темы. Я отправил ему электронное письмо о некоторых из этих проблем в тот день.

Читайте также:  Как приукрасить windows 10

Выбор кодировки текста при открытии и сохранении файлов

Как правило, при совместной работе с текстовыми файлами нет необходимости вникать в технические аспекты хранения текста. Однако если необходимо поделиться файлом с человеком, который работает с текстами на других языках, скачать текстовый файл из Интернета или открыть его на компьютере с другой операционной системой, может потребоваться задать кодировку при его открытии или сохранении.

Когда вы открываете текстовый файл в Microsoft Word или другой программе (например, на компьютере, язык операционной системы на котором отличается от того, на котором написан текст в файле), кодировка помогает программе определить, в каком виде нужно вывести текст на экран, чтобы его можно было прочитать.

В этой статье

Общие сведения о кодировке текста

То, что отображается на экране как текст, фактически хранится в текстовом файле в виде числового значения. Компьютер преобразует числические значения в видимые символы. Для этого используется кодикон.

Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.

Различные кодировки для разных алфавитов

Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке «Кириллица (Windows)» знаку «Й» соответствует числовое значение 201. Когда вы открываете файл, содержащий этот знак, на компьютере, на котором используется кодировка «Кириллица (Windows)», компьютер считывает число 201 и выводит на экран знак «Й».

Однако если тот же файл открыть на компьютере, на котором по умолчанию используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в этой кодировке. Например, если на компьютере используется кодировка «Западноевропейская (Windows)», знак «Й» из исходного текстового файла на основе кириллицы будет отображен как «É», поскольку именно этому знаку соответствует число 201 в данной кодировке.

Юникод: единая кодировка для разных алфавитов

Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.

Так как Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).

Выбор кодировки при открытии файла

Если в открытом файле текст искажен или выводится в виде вопросительных знаков либо квадратиков, возможно, Word неправильно определил кодировку. Вы можете указать кодировку, которую следует использовать для отображения (декодирования) текста.

Откройте вкладку Файл.

Нажмите кнопку Параметры.

Нажмите кнопку Дополнительно.

Перейдите к разделу Общие и установите флажок Подтверждать преобразование формата файла при открытии.

Примечание: Если установлен этот флажок, Word отображает диалоговое окно Преобразование файла при каждом открытии файла в формате, отличном от формата Word (то есть файла, который не имеет расширения DOC, DOT, DOCX, DOCM, DOTX или DOTM). Если вы часто работаете с такими файлами, но вам обычно не требуется выбирать кодировку, не забудьте отключить этот параметр, чтобы это диалоговое окно не выводилось.

Закройте, а затем снова откройте файл.

В диалоговом окне Преобразование файла выберите пункт Кодированный текст.

В диалоговом окне Преобразование файла установите переключатель Другая и выберите нужную кодировку из списка.

В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.

Если почти весь текст выглядит одинаково (например, в виде квадратов или точек), возможно, на компьютере не установлен нужный шрифт. В таком случае можно установить дополнительные шрифты.

Чтобы установить дополнительные шрифты, сделайте следующее:

Нажмите кнопку Пуск и выберите пункт Панель управления.

Выполните одно из указанных ниже действий.

На панели управления выберите раздел Удаление программы.

В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

В Windows Vista

На панели управления выберите раздел Удаление программы.

В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

Читайте также:  Linux nautilus как установить

На панели управления щелкните элемент Установка и удаление программ.

В списке Установленные программы щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.

В группе Изменение установки Microsoft Office нажмите кнопку Добавить или удалить компоненты и затем нажмите кнопку Продолжить.

В разделе Параметры установки разверните элемент Общие средства Office, а затем — Многоязыковая поддержка.

Выберите нужный шрифт, щелкните стрелку рядом с ним и выберите пункт Запускать с моего компьютера.

Совет: При открытии текстового файла в той или иной кодировке в Word используются шрифты, определенные в диалоговом окне Параметры веб-документа. (Чтобы вызвать диалоговое окно Параметры веб-документа, нажмите кнопку Microsoft Office, затем щелкните Параметры Word и выберите категорию Дополнительно. В разделе Общие нажмите кнопку Параметры веб-документа.) С помощью параметров на вкладке Шрифты диалогового окна Параметры веб-документа можно настроить шрифт для каждой кодировки.

Выбор кодировки при сохранении файла

Если не выбрать кодировку при сохранении файла, будет использоваться Юникод. Как правило, рекомендуется применять Юникод, так как он поддерживает большинство символов большинства языков.

Если документ планируется открывать в программе, которая не поддерживает Юникод, вы можете выбрать нужную кодировку. Например, в операционной системе на английском языке можно создать документ на китайском (традиционное письмо) с использованием Юникода. Однако если такой документ будет открываться в программе, которая поддерживает китайский язык, но не поддерживает Юникод, файл можно сохранить в кодировке «Китайская традиционная (Big5)». В результате текст будет отображаться правильно при открытии документа в программе, поддерживающей китайский язык (традиционное письмо).

Примечание: Так как Юникод — это наиболее полный стандарт, при сохранении текста в других кодировках некоторые знаки могут не отображаться. Предположим, например, что документ в Юникоде содержит текст на иврите и языке с кириллицей. Если сохранить файл в кодировке «Кириллица (Windows)», текст на иврите не отобразится, а если сохранить его в кодировке «Иврит (Windows)», то не будет отображаться кириллический текст.

Если выбрать стандарт кодировки, который не поддерживает некоторые символы в файле, Word пометит их красным. Вы можете просмотреть текст в выбранной кодировке перед сохранением файла.

При сохранении файла в виде кодированного текста из него удаляется текст, для которого выбран шрифт Symbol, а также коды полей.

Выбор кодировки

Откройте вкладку Файл.

Выберите пункт Сохранить как.

Чтобы сохранить файл в другой папке, найдите и откройте ее.

В поле Имя файла введите имя нового файла.

В поле Тип файла выберите Обычный текст.

Нажмите кнопку Сохранить.

Если появится диалоговое окно Microsoft Office Word — проверка совместимости, нажмите кнопку Продолжить.

В диалоговом окне Преобразование файла выберите подходящую кодировку.

Чтобы использовать стандартную кодировку, выберите параметр Windows (по умолчанию).

Чтобы использовать кодировку MS-DOS, выберите параметр MS-DOS.

Чтобы задать другую кодировку, установите переключатель Другая и выберите нужный пункт в списке. В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.

Примечание: Чтобы увеличить область отображения документа, можно изменить размер диалогового окна Преобразование файла.

Если появилось сообщение «Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке», можно выбрать другую кодировку или установить флажок Разрешить подстановку знаков.

Если разрешена подстановка знаков, знаки, которые невозможно отобразить, будут заменены ближайшими эквивалентными символами в выбранной кодировке. Например, многоточие заменяется тремя точками, а угловые кавычки — прямыми.

Если в выбранной кодировке нет эквивалентных знаков для символов, выделенных красным цветом, они будут сохранены как внеконтекстные (например, в виде вопросительных знаков).

Если документ будет открываться в программе, в которой текст не переносится с одной строки на другую, вы можете включить в нем жесткие разрывы строк. Для этого установите флажок Вставлять разрывы строк и укажите нужное обозначение разрыва (возврат каретки (CR), перевод строки (LF) или оба значения) в поле Завершать строки.

Поиск кодировок, доступных в Word

Word распознает несколько кодировок и поддерживает кодировки, которые входят в состав системного программного обеспечения.

Ниже приведен список письменностей и связанных с ними кодировок (кодовых страниц).

Юникод (UCS-2 с прямым и обратным порядком байтов, UTF-8, UTF-7)

Стандартный шрифт для стиля «Обычный» локализованной версии Word

Windows 1256, ASMO 708

Китайская (упрощенное письмо)

GB2312, GBK, EUC-CN, ISO-2022-CN, HZ

Китайская (традиционное письмо)

BIG5, EUC-TW, ISO-2022-TW

Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866

Английская, западноевропейская и другие, основанные на латинице

Оцените статью