I have a Java app which reads CSV files which have been created in Excel (e.g. 2007). Does anyone know what charset MS Excel uses to save these files in?
I would have guessed either:
- windows-1255 (Cp1255)
- ISO-8859-1
- UTF8
but I am unable to decode extended chars (e.g. french accentuated letters) using either of these charset types.
Rick
6,8282 gold badges48 silver badges79 bronze badges
asked Feb 3, 2009 at 19:32
From memory, Excel uses the machine-specific ANSI encoding. So this would be Windows-1252 for a EN-US installation, 1251 for Russian, etc.
answered Oct 1, 2009 at 6:03
devstuffdevstuff
8,2071 gold badge27 silver badges33 bronze badges
3
CSV files could be in any format, depending on what encoding option was specified during the export from Excel: (Save Dialog, Tools Button, Web Options Item, Encoding Tab)
UPDATE: Excel (including Office 2013) doesn’t actually respect the web options selected in the «save as…» dialog, so this is a bug of some sort. I just use OpenOffice Calc now to open my XLSX files and export them as CSV files (edit filter settings, choose UTF-8 encoding).
answered May 17, 2010 at 20:34
TriynkoTriynko
18.6k20 gold badges106 silver badges169 bronze badges
13
Waking up this old thread… We are now in 2017. And still Excel is unable to save a simple spreadsheet into a CSV format while preserving the original encoding … Just amazing.
Luckily Google Docs lives in the right century. The solution for me is just to open the spreadsheet using Google Docs, than download it back down as CSV. The result is a correctly encoded CSV file (with all strings encoded in UTF8).
answered Feb 2, 2017 at 15:21
Albert GodfrindAlbert Godfrind
1,9581 gold badge12 silver badges20 bronze badges
1
I had a similar problem last week. I received a number of CSV files with varying encodings. Before importing into the database I then used the chardet libary to automatically sniff out the correct encoding.
Chardet is a port from Mozillas character detection engine and if the sample size is large enough (one accentuated character will not do) works really well.
answered Feb 3, 2009 at 19:44
pi.pi.
20.9k8 gold badges38 silver badges59 bronze badges
1
Russian Edition
offers CSV
, CSV (Macintosh)
and CSV (DOS)
.
When saving in plain CSV
, it uses windows-1251
.
I just tried to save French word Résumé
along with the Russian text, it saved it in HEX
like 52 3F 73 75 6D 3F
, 3F
being the ASCII
code for question mark
.
When I opened the CSV
file, the word, of course, became unreadable (R?sum?
)
answered Feb 3, 2009 at 19:45
QuassnoiQuassnoi
410k91 gold badges612 silver badges612 bronze badges
1
Excel 2010 saves an UTF-16/UCS-2 TSV file, if you select File > Save As > Unicode Text (.txt)
. It’s (force) suffixed «.txt», which you can change to «.tsv».
If you need CSV, you can then convert the TSV file in a text editor like Notepad++, Ultra Edit, Crimson Editor etc, replacing tabs by semi-colons, commas or the like. Note that e.g. for reading into a DB table, often TSV works fine already (and it is often easier to read manually).
If you need a different code page like UTF-8, use one of the above mentioned editors for converting.
answered Dec 18, 2018 at 9:29
FelixDFelixD
6196 silver badges17 bronze badges
cp1250 is used extensively in Microsoft Office documents, including Word and Excel 2003.
http://en.wikipedia.org/wiki/Windows-1250
A simple way to confirm this would be to:
- Create a spreadsheet with higher order characters, e.g. «Veszprém» in one of the cells;
- Use your favourite scripting language to parse and decode the spreadsheet;
- Look at what your script produces when you print out the decoded data.
Example perl script:
#!perl
use strict;
use Spreadsheet::ParseExcel::Simple;
use Encode qw( decode );
my $file = "my_spreadsheet.xls";
my $xls = Spreadsheet::ParseExcel::Simple->read( $file );
my $sheet = [ $xls->sheets ]->[0];
while ($sheet->has_data) {
my @data = $sheet->next_row;
for my $datum ( @data ) {
print decode( 'cp1250', $datum );
}
}
answered Oct 1, 2009 at 5:47
robbiebowrobbiebow
891 silver badge5 bronze badges
1
While it is true that exporting an excel file that contains special characters to csv can be a pain in the ass, there is however a simple work around: simply copy/paste the cells into a google docs and then save from there.
answered Jun 14, 2012 at 22:18
4
You could use this Visual Studio VB.Net code to get the encoding:
Dim strEncryptionType As String = String.Empty
Dim myStreamRdr As System.IO.StreamReader = New System.IO.StreamReader(myFileName, True)
Dim myString As String = myStreamRdr.ReadToEnd()
strEncryptionType = myStreamRdr.CurrentEncoding.EncodingName
answered Jun 28, 2016 at 14:59
kttiikttii
10713 bronze badges
1
OOXML files like those that come from Excel 2007 are encoded in UTF-8, according to wikipedia. I don’t know about CSV files, but it stands to reason it would use the same format…
answered Feb 3, 2009 at 19:41
rmeadorrmeador
25.4k18 gold badges64 silver badges101 bronze badges
Содержание
- Работа с кодировкой текста
- Способ 1: изменение кодировки с помощью Notepad++
- Способ 2: применение Мастера текстов
- Способ 3: сохранение файла в определенной кодировке
- Вопросы и ответы
С потребностью менять кодировку текста часто сталкиваются пользователи, работающие браузерах, текстовых редакторах и процессорах. Тем не менее, и при работе в табличном процессоре Excel такая необходимость тоже может возникнуть, ведь эта программа обрабатывает не только цифры, но и текст. Давайте разберемся, как изменить кодировку в Экселе.
Урок: Кодировка в Microsoft Word
Работа с кодировкой текста
Кодировка текста – эта набор электронных цифровых выражений, которые преобразуются в понятные для пользователя символы. Существует много видов кодировки, у каждого из которых имеются свои правила и язык. Умение программы распознавать конкретный язык и переводить его на понятные для обычного человека знаки (буквы, цифры, другие символы) определяет, сможет ли приложение работать с конкретным текстом или нет. Среди популярных текстовых кодировок следует выделить такие:
- Windows-1251;
- KOI-8;
- ASCII;
- ANSI;
- UKS-2;
- UTF-8 (Юникод).
Последнее наименование является самым распространенным среди кодировок в мире, так как считается своего рода универсальным стандартом.
Чаще всего, программа сама распознаёт кодировку и автоматически переключается на неё, но в отдельных случаях пользователю нужно указать приложению её вид. Только тогда оно сможет корректно работать с кодированными символами.
Наибольшее количество проблем с расшифровкой кодировки у программы Excel встречается при попытке открытия файлов CSV или экспорте файлов txt. Часто, вместо обычных букв при открытии этих файлов через Эксель, мы можем наблюдать непонятные символы, так называемые «кракозябры». В этих случаях пользователю нужно совершить определенные манипуляции для того, чтобы программа начала корректно отображать данные. Существует несколько способов решения данной проблемы.
Способ 1: изменение кодировки с помощью Notepad++
К сожалению, полноценного инструмента, который позволял бы быстро изменять кодировку в любом типе текстов у Эксель нет. Поэтому приходится в этих целях использовать многошаговые решения или прибегать к помощи сторонних приложений. Одним из самых надежных способов является использование текстового редактора Notepad++.
- Запускаем приложение Notepad++. Кликаем по пункту «Файл». Из открывшегося списка выбираем пункт «Открыть». Как альтернативный вариант, можно набрать на клавиатуре сочетание клавиш Ctrl+O.
- Запускается окно открытия файла. Переходим в директорию, где расположен документ, который некорректно отобразился в Экселе. Выделяем его и жмем на кнопку «Открыть» в нижней части окна.
- Файл открывается в окне редактора Notepad++. Внизу окна в правой части строки состояния указана текущая кодировка документа. Так как Excel отображает её некорректно, требуется произвести изменения. Набираем комбинацию клавиш Ctrl+A на клавиатуре, чтобы выделить весь текст. Кликаем по пункту меню «Кодировки». В открывшемся списке выбираем пункт «Преобразовать в UTF-8». Это кодировка Юникода и с ней Эксель работает максимально корректно.
- После этого, чтобы сохранить изменения в файле жмем на кнопку на панели инструментов в виде дискеты. Закрываем Notepad++, нажав на кнопку в виде белого крестика в красном квадрате в верхнем правом углу окна.
- Открываем файл стандартным способом через проводник или с помощью любого другого варианта в программе Excel. Как видим, все символы теперь отображаются корректно.
Несмотря на то, что данный способ основан на использовании стороннего программного обеспечения, он является одним из самых простых вариантов для перекодировки содержимого файлов под Эксель.
Способ 2: применение Мастера текстов
Кроме того, совершить преобразование можно и с помощью встроенных инструментов программы, а именно Мастера текстов. Как ни странно, использование данного инструмента несколько сложнее, чем применение сторонней программы, описанной в предыдущем методе.
- Запускаем программу Excel. Нужно активировать именно само приложение, а не открыть с его помощью документ. То есть, перед вами должен предстать чистый лист. Переходим во вкладку «Данные». Кликаем на кнопку на ленте «Из текста», размещенную в блоке инструментов «Получение внешних данных».
- Открывается окно импорта текстового файла. В нем поддерживается открытие следующих форматов:
- TXT;
- CSV;
- PRN.
Переходим в директорию размещения импортируемого файла, выделяем его и кликаем по кнопке «Импорт».
- Открывается окно Мастера текстов. Как видим, в поле предварительного просмотра символы отображаются некорректно. В поле «Формат файла» раскрываем выпадающий список и меняем в нем кодировку на «Юникод (UTF-8)».
Если данные отображаются все равно некорректно, то пытаемся экспериментировать с применением других кодировок, пока текст в поле для предпросмотра не станет читаемым. После того, как результат удовлетворит вас, жмите на кнопку «Далее».
- Открывается следующее окно Мастера текста. Тут можно изменить знак разделителя, но рекомендуется оставить настройки по умолчанию (знак табуляции). Жмем на кнопку «Далее».
- В последнем окне имеется возможность изменить формат данных столбца:
- Общий;
- Текстовый;
- Дата;
- Пропустить столбец.
Тут настройки следует выставить, учитывая характер обрабатываемого контента. После этого жмем на кнопку «Готово».
- В следующем окне указываем координаты левой верхней ячейки диапазона на листе, куда будут вставлены данные. Это можно сделать, вбив адрес вручную в соответствующее поле или просто выделив нужную ячейку на листе. После того, как координаты добавлены, в поле окна жмем кнопку «OK».
- После этого текст отобразится на листе в нужной нам кодировке. Остается его отформатировать или восстановить структуру таблицы, если это были табличные данные, так как при переформатировании она разрушается.
Способ 3: сохранение файла в определенной кодировке
Бывает и обратная ситуация, когда файл нужно не открыть с корректным отображением данных, а сохранить в установленной кодировке. В Экселе можно выполнить и эту задачу.
- Переходим во вкладку «Файл». Кликаем по пункту «Сохранить как».
- Открывается окно сохранения документа. С помощью интерфейса Проводника определяем директорию, где файл будет храниться. Затем выставляем тип файла, если хотим сохранить книгу в формате отличном от стандартного формата Excel (xlsx). Потом кликаем по параметру «Сервис» и в открывшемся списке выбираем пункт «Параметры веб-документа».
- В открывшемся окне переходим во вкладку «Кодировка». В поле «Сохранить документ как» открываем выпадающий список и устанавливаем из перечня тот тип кодировки, который считаем нужным. После этого жмем на кнопку «OK».
- Возвращаемся в окно «Сохранения документа» и тут жмем на кнопку «Сохранить».
Документ сохранится на жестком диске или съемном носителе в той кодировке, которую вы определили сами. Но нужно учесть, что теперь всегда документы, сохраненные в Excel, будут сохраняться в данной кодировке. Для того, чтобы изменить это, придется опять заходить в окно «Параметры веб-документа» и менять настройки.
Существует и другой путь к изменению настроек кодировки сохраненного текста.
- Находясь во вкладке «Файл», кликаем по пункту «Параметры».
- Открывается окно параметров Эксель. Выбираем подпункт «Дополнительно» из перечня расположенного в левой части окна. Центральную часть окна прокручиваем вниз до блока настроек «Общие». Тут кликаем по кнопке «Параметры веб-страницы».
- Открывается уже знакомое нам окно «Параметры веб-документа», где мы проделываем все те же действия, о которых говорили ранее.
Теперь любой документ, сохраненный в Excel, будет иметь именно ту кодировку, которая была вами установлена.
Как видим, у Эксель нет инструмента, который позволил бы быстро и удобно конвертировать текст из одной кодировки в другую. Мастер текста имеет слишком громоздкий функционал и обладает множеством не нужных для подобной процедуры возможностей. Используя его, вам придется проходить несколько шагов, которые непосредственно на данный процесс не влияют, а служат для других целей. Даже конвертация через сторонний текстовый редактор Notepad++ в этом случае выглядит несколько проще. Сохранение файлов в заданной кодировке в приложении Excel тоже усложнено тем фактом, что каждый раз при желании сменить данный параметр, вам придется изменять глобальные настройки программы.
Один из простых способов изменить кодировку Excel ANSI на UTF-8 — открыть файл CSV в блокноте и выбрать «Файл»> «Сохранить как». Теперь внизу вы увидите кодировку, установленную на ANSI, измените ее на UTF-8 и сохраните файл как новый файл, а затем все готово.
Как сменить кодировку в блокноте на UTF-8?
Для конвертирования его в кодировку UTF-8, откройте на компьютере приложение Блокнот (Notepad), в блокноте откройте сохраненный Вами CSV-файл, затем выберите пункт меню «Файл» — «Сохранить как» и рядом с кнопкой «сохранить» поменяйте кодировку с ANSI на UTF-8.
Где меняется кодировка в Excel?
Вы можете указать кодировку, которую следует использовать для отображения (декодирования) текста.
- Откройте вкладку Файл.
- Нажмите кнопку Параметры.
- Нажмите кнопку Дополнительно.
- Перейдите к разделу Общие и установите флажокПодтверждать преобразование формата файла при открытии. …
- Закройте, а затем снова откройте файл.
Как открыть UTF-8 в Excel?
Откройте файл в Notepad++ . Перейдите в меню Encoding → Convert to UTF-8 .
…
Не прозрачный, но полезный, если у вас уже есть файл.
- Откройте Microsoft Excel 2007.
- Нажмите на опцию строки меню Данные.
- Нажмите на значок из текста.
- Перейдите к местоположению файла, который вы хотите импортировать.
Какая кодировка в Excel по умолчанию?
По умолчанию Эксель использует кодировку 1251: Кириллица для Windows , но есть и другие форматы. Так, в нашем случае текст закодирован по стандарту UTF-8 . Это распространённая кодировка, поэтому и проблема чтения кириллицы встречается часто. Данные слиплись по строкам тоже не случайно.
Как поменять кодировку в блокноте на юникод?
Что делать, чтобы сменить кодировку в Блокноте по умолчанию с ANSI на другую:
- Открываем Блокнот или создаём новый текстовый документ и потом его открываем в Блокноте
- Меняем кодировку текстового файла
- Сохраняем этот документ (я свой назвал по названию кодировки UTF-8.txt )
Как изменить кодировку текста на юникод?
Откройте страницу с некорректной кодировкой. Нажмите правой кнопкой на экран. Наведите указатель мыши на пункт «Кодировка». В раскрывшемся меню выберите Unicode (UTF-8).
Как изменить кодировку текста в Экселе?
Набираем комбинацию клавиш Ctrl+A на клавиатуре, чтобы выделить весь текст. Кликаем по пункту меню «Кодировки». В открывшемся списке выбираем пункт «Преобразовать в UTF-8». Это кодировка Юникода и с ней Эксель работает максимально корректно.
Как изменить кодировку текста?
Изменить кодировку текстового файла, создаваемого в Windows можно легко с помощью встроенной программы «Блокнот». Для этого достаточно открыть требуемый файл и нажать «Файл» -> «Сохранить как». В выпавшем меню выбрать требуемую кодировку и сохранить текстовой файл.
Как узнать кодировку файла XLSX?
В диалоговом окне Преобразование файла выберите пункт Кодированный текст . В диалоговом окне Преобразование файла установите переключатель Другая и выберите нужную кодировку из списка. В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Как открыть файл в кодировке UTF-8?
Как, чем открыть файл . utf8?
- Блокнот Windows.
- Microsoft WordPad.
- gVim.
- Microsoft Word 2019.
- Любой текстовый редактор
Как сохранить Excel файл в кодировке UTF-8?
Кликните Файл > Сохранить как (File > Save as), введите имя для файла и в выпадающем списке Кодировка (Encoding) выберите UTF-8. Затем нажмите кнопку Сохранить (Save).
Как открыть CSV кодировка?
Исправление кодировки файла формата CSV/XLS/XLSX
- Открываем новый документ Excel.
- Выбираем Данные — из текст:
- Выбираем файл для открытия:
- Выбираем формат данных С разделителями, жмем далее:
- В зависимости от того что за файл выбираем разделитель. Если файл был выгружен из бек-офиса inSales, то разделителем является табуляция.
- Задаем столбцам текстовый формат:
Как восстановить кодировку текста?
Способ второй: во время сохранения документа
- Нажмите «Файл».
- Выберите «Сохранить как».
- В выпадающем списке, что находится в разделе «Тип файла», выберите «Обычный текст».
- Кликните по «Сохранить».
- В окне преобразования файла выберите предпочитаемую кодировку и нажмите «ОК».
Какая кодировка нужна для Excel?
Из памяти, Excel использует машинно-зависимый кодирование ANSI. Таким образом, это будет Windows-1252 для установки EN-US, 1251 для русского языка и т.
Как перевести иероглифы в нормальный текст?
нажать левый ALT — чтобы сверху показалось меню. Нажать меню «Вид»; выбрать пункт «Кодировка текста», далее выбрать Юникод. И, ву-а-ля — иероглифы на странички сразу же стали обычным текстом (скрин ниже )!
Как открыть файл в excel в кодировке utf-8?
Файл в кодировке utf-8 открывается «кракозябами», как открыть нормально?
- Вопрос задан более года назад
- 750 просмотров
- Вконтакте
- Вконтакте
Войдите, чтобы написать ответ
Как перевернуть диаграмму рис.1 так как на рисунке 2?
- 1 подписчик
- 16 июн.
- 51 просмотр
Можно ли в excel отсортировать лист по столбцу похожему на другой столбец?
- 1 подписчик
- 16 июн.
- 30 просмотров
Как в excel удалить все пустые строки?
- 2 подписчика
- 15 июн.
- 37 просмотров
- Visual Basic
- +1 ещё
VBA Excel как правильно сделать макрос определения N – количество xi с чётными номерами, меньшими x1 и xmax/2?
- 1 подписчик
- 12 июн.
- 36 просмотров
- Excel
- +2 ещё
Какая формула в Excel / Google Таблицы для очистки ссылки от лишних символов?
- 2 подписчика
- 10 июн.
- 79 просмотров
- Excel
- +1 ещё
Проблема с ценами в excel?
- 2 подписчика
- 10 июн.
- 68 просмотров
Как в excel включить подсветку в данный момент наведенной мыши строки?
- 1 подписчик
- 10 июн.
- 39 просмотров
Есть ли функция в excel нахождения подстроки в строке?
- 1 подписчик
- 09 июн.
- 33 просмотра
Найти в диапазоне ячейку с максимальным значением, не превышающим заданный критерий?
- 1 подписчик
- 09 июн.
- 19 просмотров
Как правило, при совместной работе с текстовыми файлами нет необходимости вникать в технические аспекты хранения текста. Однако если необходимо поделиться файлом с человеком, который работает с текстами на других языках, скачать текстовый файл из Интернета или открыть его на компьютере с другой операционной системой, может потребоваться задать кодировку при его открытии или сохранении.
Когда вы открываете текстовый файл в Microsoft Word или другой программе (например, на компьютере, язык операционной системы на котором отличается от того, на котором написан текст в файле), кодировка помогает программе определить, в каком виде нужно вывести текст на экран, чтобы его можно было прочитать.
В этой статье
-
Общие сведения о кодировке текста
-
Выбор кодировки при открытии файла
-
Выбор кодировки при сохранении файла
-
Поиск кодировок, доступных в Word
Общие сведения о кодировке текста
То, что отображается на экране как текст, фактически хранится в текстовом файле в виде числового значения. Компьютер преобразует числические значения в видимые символы. Для этого используется кодикон.
Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.
Различные кодировки для разных алфавитов
Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке «Кириллица (Windows)» знаку «Й» соответствует числовое значение 201. Когда вы открываете файл, содержащий этот знак, на компьютере, на котором используется кодировка «Кириллица (Windows)», компьютер считывает число 201 и выводит на экран знак «Й».
Однако если тот же файл открыть на компьютере, на котором по умолчанию используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в этой кодировке. Например, если на компьютере используется кодировка «Западноевропейская (Windows)», знак «Й» из исходного текстового файла на основе кириллицы будет отображен как «É», поскольку именно этому знаку соответствует число 201 в данной кодировке.
Юникод: единая кодировка для разных алфавитов
Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.
Так как Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).
К началу страницы
Выбор кодировки при открытии файла
Если в открытом файле текст искажен или выводится в виде вопросительных знаков либо квадратиков, возможно, Word неправильно определил кодировку. Вы можете указать кодировку, которую следует использовать для отображения (декодирования) текста.
-
Откройте вкладку Файл.
-
Нажмите кнопку Параметры.
-
Нажмите кнопку Дополнительно.
-
Перейдите к разделу Общие и установите флажокПодтверждать преобразование формата файла при открытии.
Примечание: Если установлен этот флажок, Word отображает диалоговое окно Преобразование файла при каждом открытии файла в формате, отличном от формата Word (то есть файла, который не имеет расширения DOC, DOT, DOCX, DOCM, DOTX или DOTM). Если вы часто работаете с такими файлами, но вам обычно не требуется выбирать кодировку, не забудьте отключить этот параметр, чтобы это диалоговое окно не выводилось.
-
Закройте, а затем снова откройте файл.
-
В диалоговом окне Преобразование файла выберите пункт Кодированный текст.
-
В диалоговом окне Преобразование файла установите переключатель Другая и выберите нужную кодировку из списка.
В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Если почти весь текст выглядит одинаково (например, в виде квадратов или точек), возможно, на компьютере не установлен нужный шрифт. В таком случае можно установить дополнительные шрифты.
Чтобы установить дополнительные шрифты, сделайте следующее:
-
Нажмите кнопку Пуск и выберите пункт Панель управления.
-
Выполните одно из указанных ниже действий.
В Windows 7
-
На панели управления выберите раздел Удаление программы.
-
В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
В Windows Vista
-
На панели управления выберите раздел Удаление программы.
-
В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
В Windows XP
-
На панели управления щелкните элемент Установка и удаление программ.
-
В списке Установленные программы щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
-
-
В группе Изменение установки Microsoft Office нажмите кнопку Добавить или удалить компоненты и затем нажмите кнопку Продолжить.
-
В разделе Параметры установки разверните элемент Общие средства Office, а затем — Многоязыковая поддержка.
-
Выберите нужный шрифт, щелкните стрелку рядом с ним и выберите пункт Запускать с моего компьютера.
Совет: При открытии текстового файла в той или иной кодировке в Word используются шрифты, определенные в диалоговом окне Параметры веб-документа. (Чтобы вызвать диалоговое окно Параметры веб-документа, нажмите кнопку Microsoft Office, затем щелкните Параметры Word и выберите категорию Дополнительно. В разделе Общие нажмите кнопку Параметры веб-документа.) С помощью параметров на вкладке Шрифты диалогового окна Параметры веб-документа можно настроить шрифт для каждой кодировки.
К началу страницы
Выбор кодировки при сохранении файла
Если не выбрать кодировку при сохранении файла, будет использоваться Юникод. Как правило, рекомендуется применять Юникод, так как он поддерживает большинство символов большинства языков.
Если документ планируется открывать в программе, которая не поддерживает Юникод, вы можете выбрать нужную кодировку. Например, в операционной системе на английском языке можно создать документ на китайском (традиционное письмо) с использованием Юникода. Однако если такой документ будет открываться в программе, которая поддерживает китайский язык, но не поддерживает Юникод, файл можно сохранить в кодировке «Китайская традиционная (Big5)». В результате текст будет отображаться правильно при открытии документа в программе, поддерживающей китайский язык (традиционное письмо).
Примечание: Так как Юникод — это наиболее полный стандарт, при сохранении текста в других кодировках некоторые знаки могут не отображаться. Предположим, например, что документ в Юникоде содержит текст на иврите и языке с кириллицей. Если сохранить файл в кодировке «Кириллица (Windows)», текст на иврите не отобразится, а если сохранить его в кодировке «Иврит (Windows)», то не будет отображаться кириллический текст.
Если выбрать стандарт кодировки, который не поддерживает некоторые символы в файле, Word пометит их красным. Вы можете просмотреть текст в выбранной кодировке перед сохранением файла.
При сохранении файла в виде кодированного текста из него удаляется текст, для которого выбран шрифт Symbol, а также коды полей.
Выбор кодировки
-
Откройте вкладку Файл.
-
Выберите пункт Сохранить как.
Чтобы сохранить файл в другой папке, найдите и откройте ее.
-
В поле Имя файла введите имя нового файла.
-
В поле Тип файла выберите Обычный текст.
-
Нажмите кнопку Сохранить.
-
Если появится диалоговое окно Microsoft Office Word — проверка совместимости, нажмите кнопку Продолжить.
-
В диалоговом окне Преобразование файла выберите подходящую кодировку.
-
Чтобы использовать стандартную кодировку, выберите параметр Windows (по умолчанию).
-
Чтобы использовать кодировку MS-DOS, выберите параметр MS-DOS.
-
Чтобы задать другую кодировку, установите переключатель Другая и выберите нужный пункт в списке. В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Примечание: Чтобы увеличить область отображения документа, можно изменить размер диалогового окна Преобразование файла.
-
-
Если появилось сообщение «Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке», можно выбрать другую кодировку или установить флажок Разрешить подстановку знаков.
Если разрешена подстановка знаков, знаки, которые невозможно отобразить, будут заменены ближайшими эквивалентными символами в выбранной кодировке. Например, многоточие заменяется тремя точками, а угловые кавычки — прямыми.
Если в выбранной кодировке нет эквивалентных знаков для символов, выделенных красным цветом, они будут сохранены как внеконтекстные (например, в виде вопросительных знаков).
-
Если документ будет открываться в программе, в которой текст не переносится с одной строки на другую, вы можете включить в нем жесткие разрывы строк. Для этого установите флажок Вставлять разрывы строк и укажите нужное обозначение разрыва (возврат каретки (CR), перевод строки (LF) или оба значения) в поле Завершать строки.
К началу страницы
Поиск кодировок, доступных в Word
Word распознает несколько кодировок и поддерживает кодировки, которые входят в состав системного программного обеспечения.
Ниже приведен список письменностей и связанных с ними кодировок (кодовых страниц).
Система письменности |
Кодировки |
Используемый шрифт |
---|---|---|
Многоязычная |
Юникод (UCS-2 с прямым и обратным порядком байтов, UTF-8, UTF-7) |
Стандартный шрифт для стиля «Обычный» локализованной версии Word |
Арабская |
Windows 1256, ASMO 708 |
Courier New |
Китайская (упрощенное письмо) |
GB2312, GBK, EUC-CN, ISO-2022-CN, HZ |
SimSun |
Китайская (традиционное письмо) |
BIG5, EUC-TW, ISO-2022-TW |
MingLiU |
Кириллица |
Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866 |
Courier New |
Английская, западноевропейская и другие, основанные на латинице |
Windows 1250, 1252-1254, 1257, ISO8859-x |
Courier New |
Греческая |
Windows 1253 |
Courier New |
Иврит |
Windows 1255 |
Courier New |
Японская |
Shift-JIS, ISO-2022-JP (JIS), EUC-JP |
MS Mincho |
Корейская |
Wansung, Johab, ISO-2022-KR, EUC-KR |
Malgun Gothic |
Тайская |
Windows 874 |
Tahoma |
Вьетнамская |
Windows 1258 |
Courier New |
Индийские: тамильская |
ISCII 57004 |
Latha |
Индийские: непальская |
ISCII 57002 (деванагари) |
Mangal |
Индийские: конкани |
ISCII 57002 (деванагари) |
Mangal |
Индийские: хинди |
ISCII 57002 (деванагари) |
Mangal |
Индийские: ассамская |
ISCII 57006 |
|
Индийские: бенгальская |
ISCII 57003 |
|
Индийские: гуджарати |
ISCII 57010 |
|
Индийские: каннада |
ISCII 57008 |
|
Индийские: малаялам |
ISCII 57009 |
|
Индийские: ория |
ISCII 57007 |
|
Индийские: маратхи |
ISCII 57002 (деванагари) |
|
Индийские: панджаби |
ISCII 57011 |
|
Индийские: санскрит |
ISCII 57002 (деванагари) |
|
Индийские: телугу |
ISCII 57005 |
-
Для использования индийских языков необходима их поддержка в операционной системе и наличие соответствующих шрифтов OpenType.
-
Для непальского, ассамского, бенгальского, гуджарати, малаялам и ория доступна только ограниченная поддержка.
К началу страницы
Если в таблице вместо нужной информации вы увидели вопросы, иероглифы или другие непонятные знаки, это значит, вам надо разобраться, как поменять кодировку в Excel. Эта функция доступна в самом Microsoft Office. Но избавиться от проблемы можно и другими методами.
Иногда мы получаем непонятные иероглифы
Что такое кодировка?
Компьютер воспринимает любую информацию, как набор цифр. Поэтому у каждого печатного знака есть свой код. Он состоит из чисел и букв латинского алфавита. Символы и соответствующие им числа — это и есть кодировка.
У неё есть несколько стандартов. Например, Koi-8, Unicode, Windows-1251, ASCII. И если файл с текстом сохранён, скажем, в Кои-8, в Excel он будет неправильно отображаться в Юникоде. Так как в этих наборах одним и тем же символам приписаны разные коды.
Как поменять кодировку в программе?
Для работы с таблицей, в которой используется стандарт, не заданный по умолчанию в программе, надо изменить кодировку. Существует несколько способов.
При помощи Notepad
Если в Экселе не получается превратить «кракозябры» в нормальный текст, откройте файл в программе «Notepad++». Она распространяется бесплатно. Настройте там отображение символов, а потом продолжайте работать в Excel.
Откройте файл в программе «Notepad++»
- Создайте резервную копию документа. Или сохраните информацию из него в какой-нибудь другой таблице.
- Запустите Notepad.
- Перейдите в Файл — Открыть (File — Open) и укажите путь к таблице. В поле «Тип файла» поставьте «Все типы» («All types»). Или укажите конкретный формат. Таблицы имеют расширения .cvs, .xls, .xltm, xlam, .xlm. В Нотпаде текст отобразится без сетки. В нём ничего не надо редактировать.
- Справа внизу в строке состояния будет изображён стандарт, используемый сейчас.
- Откройте меню Кодировка (Encoding). Оно находится вверху окна.
- Нажмите «Преобразовать в UTF-8» («Convert to UTF-8»). Документ будет конвертирован в нужный формат. Этот стандарт Excel воспринимает нормально и не станет превращать в бессвязный поток странных символов.
- Теперь выберите, какие знаки необходимо использовать. В том же меню Encoding наведите выпадающий список. Он там один.
- Для русского языка выберите Кириллица — Windows-1251. Если текст, скажем, на арабском или греческом — отметьте соответствующий набор символов. В разных странах используются разные стандарты.
- Программа попросит подтвердить действие.
- Если это не помогло, попробуйте другие кириллические шрифты.
- Сохранять текст надо тоже в экселевском формате.
Откройте файл в utf-8
Через интерфейс программы
Вот как сменить кодировку в Excel, используя встроенные возможности:
- Запустите программу. Не надо открывать заполненный документ. Нужен «чистый» лист.
- Перейдите во вкладку «Данные» в строке меню.
- На панели «Получать внешние данные» нажмите «Из текста».
- В списке «Тип файла» (он находится рядом с кнопкой «Отмена») выберите «Все» или «Любые». Так в окне будут отображаться форматы Excel, а не только .txt.
- Задайте путь к таблице.
- Откроется мастер импорта.
- В поле «Формат» можете выбрать желаемый стандарт.
- В области «Предварительный просмотр» показано, как будет выглядеть текст с отмеченным набором символов. Можете прокручивать список и искать, какая настройка подходит.
- Когда подберёте нужный вариант, нажмите «Готово».
Можно использовать встроенные возможности
Как сохранить файл в определённой кодировке?
Можно сделать так, чтобы в сохранённом вами файле стояла определённая кодировка Excel.
- Нажмите на зелёную кнопку «Файл» (в Office 2007 надо кликнуть на логотип слева вверху).
- Параметры — Дополнительно.
- Прокрутите вниз до раздела «Общие».
- Кнопка «Параметры веб-документа».
- Вкладка «Кодировка».
- В поле «Сохранить документ как» укажите желаемое значение и нажмите «OK».
Ещё можно сделать так:
- Нажмите на «Файл» или логотип офиса.
- Выберите «Сохранить как…».
- Кликните на «Сервис». Там будет тот же самый пункт «Параметры веб-документа».
Как добавить в программы офиса новую кодировку?
Если ни один из стандартов не подошёл для вашего документа, добавьте новые.
- Пуск — Панель управления.
- «Программы и компоненты» или «Удаление программ».
- Нажмите на пункт Office или Excel (в зависимости от того, установлен ли у вас весь пакет продуктов Микрософт Офис или только Эксель).
- Кнопка «Изменить». Она над основной рабочей областью.
- Поставьте маркер в «Добавить или удалить» и кликните «Продолжить».
- Откройте ветку Общие средства — Многоязыковая поддержка.
- Нажмите на чёрную стрелочку рядом с нужным стандартом и включите функцию «Запускать на моём компьютере».
- Кликните «Продолжить» и дождитесь окончания процесса. Будут добавлены новые наборы.
В Excel можно поменять кодировку, если символы отображаются неправильно. Эта функция доступна в инструментарии программы. Но иногда используется сторонний софт.
Если при импорте контактов вы видите нечитаемые символы, как на скриншоте, это значит, что кодировка файла не подходит для импорта в Unisender. Файл нужно перекодировать в UTF-8. Далее мы расскажем, как это сделать в Excel.
Переходим на вкладку «Данные», выбираем «Получение внешних данных», а далее — «Из текста».
Открывается мастер импорта текста.
С текущей кодировкой содержимое файла нечитабельное.
В поле «Формат файла» перебираем кодировки, пока не найдём ту, в которой текст отображается правильно. Вариантов много, поэтому можно начать с форматов, которые начинаются со слова «Кириллица». Находим нужный формат, нажимаем «Далее».
Выбираем символы-разделители. В нашем случае это запятая.
Нажимаем «Далее» → «Готово» → «OK».
Так выглядит импортированный текст в Excel.
Теперь нажимаем «Файл» → «Сохранить как».
Вводим название файла, тип файла выбираем CSV, ниже нажимаем «Сервис» → «Параметры веб-документа».
Переходим на вкладку «Кодировка», выбираем «Юникод UTF-8» и нажимаем «OK».
Файл сохранён.
Теперь импортируем его и видим, что текст отображается корректно.
Полезные ссылки
Формат данных для загрузки
Как импортировать контакты
Как импортировать номера телефонов
Что такое отчёт об ошибках при импорте
Проверка контактов
Вы нашли ответ?
Свежие статьи
-
Подкаст
15.04.2023 -
Как определить шрифт по картинке?
14.04.2023 -
Креатив
14.04.2023 -
Как собрать список минус-слов для запуска рекламы?
14.04.2023 -
Репрезентативная выборка в рекламе: что это и как определить
14.04.2023 -
Бликфанг
13.04.2023
Научитесь считывать ключевую информацию о кандидате или сотруднике за минуту общения. 16, 17, 18 мая с 10:30 до 12:30.
Иероглифы при открытии .csv файла с помощью Excel: решение проблемы
При выгрузке .csv таблицы в Excel у многих пользователей неверно отображаются данные. Вместо кириллических символов в документе вы можете увидеть иероглифы. Выглядит это примерно так:
Проблема возникает потому, что кодировка csv файла отличается от той, которая используется MS Excel по умолчанию. В этой статье мы рассмотрим два варианта быстрого решения этой проблемы.
Вариант №1. В самом Excel
Шаг 1. Откройте MS Excel.
Шаг 2. Перейдите во вкладку «Данные».
Шаг 3. Нажмите «Получить данные», затем из файла, затем «Из текстового/CSV файла».
Шаг 4. В открывшемся окне в правом нижнем углу выберите опцию «Все файлы».
Шаг 5. Найдите в этом окне .csv файл, который нужно исправить. Нажмите «Импорт».
Шаг 6. В открывшемся окне нажмите «Загрузить».
Шаг 7. Готово! Создан новый лист, и данные в нем отображаются корректно.
Вариант №2. С помощью Google Таблиц (Google Sheets)
Шаг 1. Убедитесь, что вы авторизованы в своем аккаунте Google.
Шаг 3. В разделе «Создать таблицу» нажмите «Пустой файл».
Шаг 4. Откроется страница с пустой таблицей. Нажмите «Файл», затем «Импортировать».
Шаг 5. В открывшемся окне нажмите «Загрузка», затем «Выбрать файл на устройстве».
Шаг 6. Найдите в новом окне .csv файл, который нужно исправить. Нажмите «Открыть».
Шаг 7. Нажмите «Импортировать данные».
Шаг 8. Готово! Таблица импортирована, данные изображаются корректно.
Вы можете дальше работать с файлом прямо в Google Таблицах, либо экспортировать файл, чтобы работать с ним в другой программе (например, MS Excel).
Чтобы экспортировать файл, нажмите «Файл», затем «Скачать», затем выберите нужный формат (например Microsoft Excel).
Я использую различные инструменты для регулярной подготовки данных для web. Один из этапов требует от меня открыть CSV в Excel, внести изменения и сохранить файл.
есть ли способ заставить Excel принять кодировку UTF-8 и сохранить свои файлы с этой кодировкой?
источник
Я ответил на аналогичный вопрос в кодировка символов по умолчанию для текстового мастера Excel?.
Я нашел свой ответ в изменение типа источника импорта текста по умолчанию в Excel.
- в редакторе реестра перейдите к HKEY_CURRENT_USER>программное обеспечение>Microsoft>офис>[версия Excel здесь-вероятно, наибольшее число в этой папке] > Excel>параметры
- щелкните правой кнопкой мыши на правой стороне и перейдите в New > DWORD
- наименование элемента DefaultCPG, и сохранить
- щелкните правой кнопкой мыши DefaultCPG и выберите Изменить
- установить основание в десятичное
- введите код, показанный в Мастере Excel (для UTF-8 это 65001)
- нажмите OK.
Как говорит Василь в комментарии к этому вопросу, если ваш файл на самом деле не в формате UTF-8, вы можете технически преобразовать символы в файле в кодировку, которую вы хотите, прежде чем открывать в Excel. Для моих целей, хотя, UTF-8 делает достаточно хорошую работу по отображению неповрежденных символов.
отвечен Robert H. 2017-03-20 10:17:35
источник
один простой способ изменить кодировку excel ANSI на UTF-8-это открыть .CSV-файл в блокноте выберите «Файл» > «Сохранить как». Теперь в нижней части вы увидите кодировку он установлен в ANSI изменить его на UTF-8 и сохранить файл как новый файл, а затем сделать.
отвечен Moudiz 2015-05-06 10:15:33
источник
Я решил подобную проблему раньше. Неудачно, но можно использовать LibreOffice, что по умолчанию UTF-8.
отвечен Lluser 2015-05-06 10:44:36
источник
есть Excel надстройка доступна здесь для работы с Unicode CSV файлами, которые должны вам помочь.
вот Примечание разработчика Jaimon Mathew:
Excel обрабатывает .csv файлы в виде текстовых файлов и заменят все Unicode
персонажи с «?»при нормальном сохранении. Если вы хотите сохранить
Символы юникода, вам нужно будет сохранить файл как » текст Юникода
(*.txt)», который является файлом с разделителями табуляции. Так как я не мог найти никого
существующий решение для сохранения символов Юникода в формате CSV, I
думал, что я дам ему идти в создании Excel Addin, чтобы сделать именно это.
отвечен Karan 2015-05-06 21:26:20
источник
Это не лучшее решение, но это вариант: загрузите файл Excel на Google Диск, откройте его с помощью вкладок Google и загрузите в виде файла csv.
Это сработало для меня.
отвечен Viktor 2015-10-02 11:04:10
источник
Содержание
- 1 Как убрать иероглифы в Excel?
- 2 Как изменить кодировку текста в Excel?
- 3 Какая кодировка в Excel по умолчанию?
- 4 Как узнать кодировку файла Excel?
- 5 Почему у меня иероглифы вместо букв?
- 6 Как сменить кодировку в файле Excel?
- 7 Как сменить кодировку в блокноте?
- 8 Как поменять кодировку в файле CSV?
- 9 Как поменять кодировку текста в Notepad ++?
- 10 Как изменить кодировку текста в txt?
- 11 Какая кодировка нужна для Excel?
- 12 Как изменить кодировку текста в браузере?
- 13 Как узнать кодировку файла в Windows?
- 14 Как открыть файл с расширением CSV?
- 15 Как сохранить файл Excel в кодировке UTF 8?
Иероглифы в Excel вместо текста
- на вкладке «Данные», в блоке «Получение внешних данных» — нажать кнопку «Из текста»;
- указать файл из которого нужно получить информацию;
- затем в разделе «Формат данных» выбрать нужный вариант «С разделителями» или «Фиксированной ширины»;
- в поле «Формат файла» изменить кодировку на «Юникод Windows», нажать «Далее»;
Как изменить кодировку текста в Excel?
Набираем комбинацию клавиш Ctrl+A на клавиатуре, чтобы выделить весь текст. Кликаем по пункту меню «Кодировки». В открывшемся списке выбираем пункт «Преобразовать в UTF-8». Это кодировка Юникода и с ней Эксель работает максимально корректно.
Какая кодировка в Excel по умолчанию?
Превращение в кашу осмысленного теста, набранного кириллицей, происходит из-за неверной кодировки. По умолчанию Эксель использует кодировку 1251: Кириллица для Windows , но есть и другие форматы.
Как узнать кодировку файла Excel?
Внизу окна в правой части строки состояния указана текущая кодировка документа. Так как Excel отображает её некорректно, требуется произвести изменения. Набираем комбинацию клавиш Ctrl+A на клавиатуре, чтобы выделить весь текст. Кликаем по пункту меню «Кодировки» .
Почему у меня иероглифы вместо букв?
Вместо текста иероглифы, квадратики и крякозабры (в браузере, Word, тексте, окне Windows) … Происходит это из-за того, что текст на страничке написан в одной кодировке (более подробно об этом можете узнать из Википедии), а браузер пытается открыть его в другой.
Как сменить кодировку в файле Excel?
Выбор кодировки при открытии файла
- Откройте вкладку Файл.
- Нажмите кнопку Параметры.
- Нажмите кнопку Дополнительно.
- Перейдите к разделу Общие и установите флажокПодтверждать преобразование формата файла при открытии. …
- Закройте, а затем снова откройте файл.
Как сменить кодировку в блокноте?
Что делать, чтобы сменить кодировку в Блокноте по умолчанию с ANSI на другую
- Открываем Блокнот или создаём новый текстовый документ и потом его открываем в Блокноте
- Меняем кодировку текстового файла
- Сохраняем этот документ (я свой назвал по названию кодировки UTF-8.txt)
Как поменять кодировку в файле CSV?
Для конвертирования его в кодировку UTF-8, откройте на компьютере приложение Блокнот (Notepad), в блокноте откройте сохраненный Вами CSV-файл, затем выберите пункт меню «Файл» — «Сохранить как» и рядом с кнопкой «сохранить» поменяйте кодировку с ANSI на UTF-8. В имени файла укажите расширение файла «. csv».
Как поменять кодировку текста в Notepad ++?
- В верхнем меню выбираете пункт «Кодировки», подпункт «Преобразовать в UTF-8 (без ВОМ)»:
- Результатом этого действия будет надпись в правом нижнем углу редактора:
- Вот и всё. Мы установили параметры сохранения страницы в кодировку UTF-8.
Как изменить кодировку текста в txt?
Изменить кодировку текстового файла, создаваемого в Windows можно легко с помощью встроенной программы «Блокнот». Для этого достаточно открыть требуемый файл и нажать «Файл» -> «Сохранить как». В выпавшем меню выбрать требуемую кодировку и сохранить текстовой файл.
Какая кодировка нужна для Excel?
Из памяти Excel использует кодировку ANSI для конкретного компьютера. Так что это будет Windows-1252 для установки EN-US, 1251 для русского и т. д.
Как изменить кодировку текста в браузере?
В браузере Chrome нельзя поменять настройки кодировки, однако можно попробовать установить для этого расширение.
…
Chrome
- Откройте Интернет-магазине Chrome.
- Выберите Расширения в меню слева.
- Введите запрос, например «кодировка текста».
- Выберите подходящее расширение.
Как узнать кодировку файла в Windows?
Открыть искомый текстовый файл в Блокноте Windows и выбрать пункт меню «Файл» -> «Сохранить как…». Пример текстового файла, в котором русский текст задан в формате UTF, но это не очевидно при открытии. 2. В открывшемся диалоговом окне вы сразу видите, в какой кодировке был сохранён текст в текстовом файле.
Как открыть файл с расширением CSV?
Как открыть файл CSV в Excel
- Запустите Microsoft Excel, на вкладке Home (Главная) нажмите Open (Открыть).
- Появится диалоговое окно Open (Открытие документа), в выпадающем списке в нижнем правом углу выберите Text Files (Текстовые файлы).
- Найдите в Проводнике Windows файл CSV и откройте его, дважды кликнув по нему.
Как сохранить файл Excel в кодировке UTF 8?
Кликните Файл > Сохранить как (File > Save as), введите имя для файла и в выпадающем списке Кодировка (Encoding) выберите UTF-8. Затем нажмите кнопку Сохранить (Save).