Содержание
- Работа с кодировкой текста
- Способ 1: изменение кодировки с помощью Notepad++
- Способ 2: применение Мастера текстов
- Способ 3: сохранение файла в определенной кодировке
- Вопросы и ответы
С потребностью менять кодировку текста часто сталкиваются пользователи, работающие браузерах, текстовых редакторах и процессорах. Тем не менее, и при работе в табличном процессоре Excel такая необходимость тоже может возникнуть, ведь эта программа обрабатывает не только цифры, но и текст. Давайте разберемся, как изменить кодировку в Экселе.
Урок: Кодировка в Microsoft Word
Работа с кодировкой текста
Кодировка текста – эта набор электронных цифровых выражений, которые преобразуются в понятные для пользователя символы. Существует много видов кодировки, у каждого из которых имеются свои правила и язык. Умение программы распознавать конкретный язык и переводить его на понятные для обычного человека знаки (буквы, цифры, другие символы) определяет, сможет ли приложение работать с конкретным текстом или нет. Среди популярных текстовых кодировок следует выделить такие:
- Windows-1251;
- KOI-8;
- ASCII;
- ANSI;
- UKS-2;
- UTF-8 (Юникод).
Последнее наименование является самым распространенным среди кодировок в мире, так как считается своего рода универсальным стандартом.
Чаще всего, программа сама распознаёт кодировку и автоматически переключается на неё, но в отдельных случаях пользователю нужно указать приложению её вид. Только тогда оно сможет корректно работать с кодированными символами.
Наибольшее количество проблем с расшифровкой кодировки у программы Excel встречается при попытке открытия файлов CSV или экспорте файлов txt. Часто, вместо обычных букв при открытии этих файлов через Эксель, мы можем наблюдать непонятные символы, так называемые «кракозябры». В этих случаях пользователю нужно совершить определенные манипуляции для того, чтобы программа начала корректно отображать данные. Существует несколько способов решения данной проблемы.
Способ 1: изменение кодировки с помощью Notepad++
К сожалению, полноценного инструмента, который позволял бы быстро изменять кодировку в любом типе текстов у Эксель нет. Поэтому приходится в этих целях использовать многошаговые решения или прибегать к помощи сторонних приложений. Одним из самых надежных способов является использование текстового редактора Notepad++.
- Запускаем приложение Notepad++. Кликаем по пункту «Файл». Из открывшегося списка выбираем пункт «Открыть». Как альтернативный вариант, можно набрать на клавиатуре сочетание клавиш Ctrl+O.
- Запускается окно открытия файла. Переходим в директорию, где расположен документ, который некорректно отобразился в Экселе. Выделяем его и жмем на кнопку «Открыть» в нижней части окна.
- Файл открывается в окне редактора Notepad++. Внизу окна в правой части строки состояния указана текущая кодировка документа. Так как Excel отображает её некорректно, требуется произвести изменения. Набираем комбинацию клавиш Ctrl+A на клавиатуре, чтобы выделить весь текст. Кликаем по пункту меню «Кодировки». В открывшемся списке выбираем пункт «Преобразовать в UTF-8». Это кодировка Юникода и с ней Эксель работает максимально корректно.
- После этого, чтобы сохранить изменения в файле жмем на кнопку на панели инструментов в виде дискеты. Закрываем Notepad++, нажав на кнопку в виде белого крестика в красном квадрате в верхнем правом углу окна.
- Открываем файл стандартным способом через проводник или с помощью любого другого варианта в программе Excel. Как видим, все символы теперь отображаются корректно.
Несмотря на то, что данный способ основан на использовании стороннего программного обеспечения, он является одним из самых простых вариантов для перекодировки содержимого файлов под Эксель.
Способ 2: применение Мастера текстов
Кроме того, совершить преобразование можно и с помощью встроенных инструментов программы, а именно Мастера текстов. Как ни странно, использование данного инструмента несколько сложнее, чем применение сторонней программы, описанной в предыдущем методе.
- Запускаем программу Excel. Нужно активировать именно само приложение, а не открыть с его помощью документ. То есть, перед вами должен предстать чистый лист. Переходим во вкладку «Данные». Кликаем на кнопку на ленте «Из текста», размещенную в блоке инструментов «Получение внешних данных».
- Открывается окно импорта текстового файла. В нем поддерживается открытие следующих форматов:
- TXT;
- CSV;
- PRN.
Переходим в директорию размещения импортируемого файла, выделяем его и кликаем по кнопке «Импорт».
- Открывается окно Мастера текстов. Как видим, в поле предварительного просмотра символы отображаются некорректно. В поле «Формат файла» раскрываем выпадающий список и меняем в нем кодировку на «Юникод (UTF-8)».
Если данные отображаются все равно некорректно, то пытаемся экспериментировать с применением других кодировок, пока текст в поле для предпросмотра не станет читаемым. После того, как результат удовлетворит вас, жмите на кнопку «Далее».
- Открывается следующее окно Мастера текста. Тут можно изменить знак разделителя, но рекомендуется оставить настройки по умолчанию (знак табуляции). Жмем на кнопку «Далее».
- В последнем окне имеется возможность изменить формат данных столбца:
- Общий;
- Текстовый;
- Дата;
- Пропустить столбец.
Тут настройки следует выставить, учитывая характер обрабатываемого контента. После этого жмем на кнопку «Готово».
- В следующем окне указываем координаты левой верхней ячейки диапазона на листе, куда будут вставлены данные. Это можно сделать, вбив адрес вручную в соответствующее поле или просто выделив нужную ячейку на листе. После того, как координаты добавлены, в поле окна жмем кнопку «OK».
- После этого текст отобразится на листе в нужной нам кодировке. Остается его отформатировать или восстановить структуру таблицы, если это были табличные данные, так как при переформатировании она разрушается.
Способ 3: сохранение файла в определенной кодировке
Бывает и обратная ситуация, когда файл нужно не открыть с корректным отображением данных, а сохранить в установленной кодировке. В Экселе можно выполнить и эту задачу.
- Переходим во вкладку «Файл». Кликаем по пункту «Сохранить как».
- Открывается окно сохранения документа. С помощью интерфейса Проводника определяем директорию, где файл будет храниться. Затем выставляем тип файла, если хотим сохранить книгу в формате отличном от стандартного формата Excel (xlsx). Потом кликаем по параметру «Сервис» и в открывшемся списке выбираем пункт «Параметры веб-документа».
- В открывшемся окне переходим во вкладку «Кодировка». В поле «Сохранить документ как» открываем выпадающий список и устанавливаем из перечня тот тип кодировки, который считаем нужным. После этого жмем на кнопку «OK».
- Возвращаемся в окно «Сохранения документа» и тут жмем на кнопку «Сохранить».
Документ сохранится на жестком диске или съемном носителе в той кодировке, которую вы определили сами. Но нужно учесть, что теперь всегда документы, сохраненные в Excel, будут сохраняться в данной кодировке. Для того, чтобы изменить это, придется опять заходить в окно «Параметры веб-документа» и менять настройки.
Существует и другой путь к изменению настроек кодировки сохраненного текста.
- Находясь во вкладке «Файл», кликаем по пункту «Параметры».
- Открывается окно параметров Эксель. Выбираем подпункт «Дополнительно» из перечня расположенного в левой части окна. Центральную часть окна прокручиваем вниз до блока настроек «Общие». Тут кликаем по кнопке «Параметры веб-страницы».
- Открывается уже знакомое нам окно «Параметры веб-документа», где мы проделываем все те же действия, о которых говорили ранее.
Теперь любой документ, сохраненный в Excel, будет иметь именно ту кодировку, которая была вами установлена.
Как видим, у Эксель нет инструмента, который позволил бы быстро и удобно конвертировать текст из одной кодировки в другую. Мастер текста имеет слишком громоздкий функционал и обладает множеством не нужных для подобной процедуры возможностей. Используя его, вам придется проходить несколько шагов, которые непосредственно на данный процесс не влияют, а служат для других целей. Даже конвертация через сторонний текстовый редактор Notepad++ в этом случае выглядит несколько проще. Сохранение файлов в заданной кодировке в приложении Excel тоже усложнено тем фактом, что каждый раз при желании сменить данный параметр, вам придется изменять глобальные настройки программы.
Здравствуйте! Есть простой макрос для сохранения таблицы в текстовый формат
Код |
---|
Sub Mokus() Const defPath = "c:temp" 'Путь к папке для сохранения файлов Dim fileSaveName, rr As Range, n As Integer, i As Integer If Dir(defPath, vbDirectory) = "" Then MkDir defPath ChDir defPath fileSaveName = Application.GetSaveAsFilename(Replace(ActiveWorkbook.Name, ".xls", ""), _ "Text Files (*.html), *.html", , "Сохранение без лишних кавычек :)") If fileSaveName <> False Then Open fileSaveName For Output As #1 For Each rr In ActiveSheet.UsedRange.Rows n = rr.Cells.Count For i = 1 To n - 1 Print #1, rr.Cells(i).Text; Next Print #1, rr.Cells(n) Next Close #1 End If End Sub |
он работает, но нужно чтобы итоговый файл в utf-8
но если вставляю эту функцию
Код |
---|
Function ChangeFileCharset(ByVal filename$, ByVal DestCharset$, _ Optional ByVal SourceCharset$) As Boolean ' функция перекодировки (смены кодировки) текстового файла ' В качестве параметров функция получает путь filename$ к текстовому файлу, ' и название кодировки DestCharset$ (в которую будет переведён файл) ' Функция возвращает TRUE, если перекодировка прошла успешно On Error Resume Next: Err.Clear With CreateObject("ADODB.Stream" ) .Type = 2 If Len(SourceCharset$) Then .Charset = SourceCharset$ ' указываем исходную кодировку .Open .LoadFromFile filename$ ' загружаем данные из файла FileContent$ = .ReadText ' считываем текст файла в переменную FileContent$ .Close .Charset = DestCharset$ ' назначаем новую кодировку .Open .WriteText FileContent$ .SaveToFile filename$, 2 ' сохраняем файл уже в новой кодировке .Close End With ChangeFileCharset = Err = 0 End Function |
то появляется ошибка Expected End Sub
когда дописываю End Sub ничего не меняется. Как можно перекодировку в utf-8 сделать?
Если при импорте контактов вы видите нечитаемые символы, как на скриншоте, это значит, что кодировка файла не подходит для импорта в Unisender. Файл нужно перекодировать в UTF-8. Далее мы расскажем, как это сделать в Excel.
Переходим на вкладку «Данные», выбираем «Получение внешних данных», а далее — «Из текста».
Открывается мастер импорта текста.
С текущей кодировкой содержимое файла нечитабельное.
В поле «Формат файла» перебираем кодировки, пока не найдём ту, в которой текст отображается правильно. Вариантов много, поэтому можно начать с форматов, которые начинаются со слова «Кириллица». Находим нужный формат, нажимаем «Далее».
Выбираем символы-разделители. В нашем случае это запятая.
Нажимаем «Далее» → «Готово» → «OK».
Так выглядит импортированный текст в Excel.
Теперь нажимаем «Файл» → «Сохранить как».
Вводим название файла, тип файла выбираем CSV, ниже нажимаем «Сервис» → «Параметры веб-документа».
Переходим на вкладку «Кодировка», выбираем «Юникод UTF-8» и нажимаем «OK».
Файл сохранён.
Теперь импортируем его и видим, что текст отображается корректно.
Полезные ссылки
Формат данных для загрузки
Как импортировать контакты
Как импортировать номера телефонов
Что такое отчёт об ошибках при импорте
Проверка контактов
Вы нашли ответ?
Свежие статьи
-
Подкаст
15.04.2023 -
Как определить шрифт по картинке?
14.04.2023 -
Креатив
14.04.2023 -
Как собрать список минус-слов для запуска рекламы?
14.04.2023 -
Репрезентативная выборка в рекламе: что это и как определить
14.04.2023 -
Бликфанг
13.04.2023
На этот раз мы попытаемся изучить простые, быстрые, а главное — эффективные, методы преобразования информации из таблиц Excel в CSV, при этом сохраняя неизменность всех специальных вставок и знаков иностранных языков. Следующие методы совместимы со всеми версиями Excel.
Содержание
- Как провести конвертацию документа Excel в CSV
- Экспорт с использованием CSV-кодировки UTF-8 либо UTF-16
- Конвертация Excel в CSV UTF-8
- Конвертация Excel в CSV UTF-16
- Другие способы преобразования Excel в CSV
- Конвертировать посредством Google таблиц
- Сохраните .xlsx в .xls, далее конвертируйте в .csv
- Сохранить Excel в формате CSV с помощью OpenOffice
Как провести конвертацию документа Excel в CSV
Представим ситуацию. Нам необходимо воспользоваться данными, которые сохранены в таблице Excel, используя какую-нибудь еще программу, например, Outlook, программу с функциями почтового клиента либо Access, программу с базами данных. При подобных обстоятельствах для начала потребуется изменить формат Excel в CSV, далее — импортировать файл .csv в требуемую программу. Далее рассмотрены пошаговые инструкции с применением операции «Сохранить как».
1) Перейдите на вкладку «Файл» и кликните «Сохранить как». Знание того, какие клавиши либо комбинации клавиш нажать, значительно сэкономит ваше время в течение работы в той или иной программе. Поэтому, чтобы открыть то же диалоговое окно (Сохранить как), вы можете просто нажать клавишу F12.
2) В строке Тип файла нам потребуется выбрать CSV (разделители — запятые).
Наряду с этим типом файла, в программе представлен выбор и других вариантов:
Вариант 1 |
CSV (разделители – запятые). Здесь документ сохраняется в виде текста с запятыми, в дальнейшем возможна работа с ним в иной программе Windows (либо иной версии ОС Windows). |
Вариант 2 |
CSV (Macintosh). Схож с предыдущим вариантом, но предназначается с целью применения в ОС Mac. |
Вариант 3 |
CSV (MS-DOS). Необходим с целью применения в ОС MS-DOS. |
Вариант 4 |
Текст Unicode (* TXT). Это промышленный стандарт для компьютеров, поддерживаемый практически всеми современными операционными системами. Он может обрабатывать знаки практически всех современных языков, а также древних. Соответственно, если у нас имеются буквы иностранных языков либо еще какие-то спецзнаки, для начала документ сохраняется в Unicode, потом конвертируется в CSV. Процесс выполнения указан выше. |
Примечание: С помощью всех вышеперечисленных форматов сохраняется лишь активный лист.
3) Выберите папку назначения, далее — «Сохранить».
После, откроется два диалоговых окна. Не надо волноваться, тут нет ничего плохого, все нормально.
4) В первом сообщении напоминается о том, что допускается сохранение только одного активного листа в CSV. Следует кликнуть ОК, если именно это и требуется.
Если необходимо сохранить все содержимое рабочего листа, кликните «Отмена», затем по отдельности сохраните каждый лист. Далее нужно сохранить каждый отдельный файл в CSV.
5) Если щелкнуть ОК во время открытия первого окна, появится второе, информирующее вас о том, что в вашей таблице могут быть функции, не поддерживающие кодировку CSV. Хорошо, просто нажмите да.
Вот и все. Быстро и легко, вряд ли вы встретитесь с какими-нибудь препятствиями на этом пути.
Экспорт с использованием CSV-кодировки UTF-8 либо UTF-16
Поначалу может показаться это сложным. Какие-то кодировки, непонятные названия — но на самом деле все просто. Давайте разбираться по порядку. Если в вашем документе есть специальные вставки, знаки иностранных языков либо иероглифы, провести конвертацию по вышеописанному методу не получится.
Причина заключается в том, что операция «Сохранить как CSV» искажает любые символы за исключением ASCII (американский стандартный код для информационного обмена). В случае наличия в документе “умных кавычек” либо длинных тире (как вариант, унаследованных от оригинального документа Word), они искажаются.
Существует альтернатива — сохранение файла Excel в Unicode (.txt) и дальнейшая конвертация в CSV. Тогда удастся оставить все оригинальные знаки без изменений.
Прежде чем продолжить, давайте коротко разберем разницу между UTF-8 и UTF-16, чтобы у вас была возможность выбрать правильный формат в конкретном случае:
- UTF-8 шифрует наиболее компактно, поскольку для каждого знака используются от 1 до 4 байтов. В общем, его рекомендуют, если знаки ASCII составляют большую часть документа. Еще один плюс состоит в том, что документ UTF-8 имеет такую же кодировку, как и документ ASCII.
- UTF-16 используются от 2 до 4 байтов для каждого знака. Однако, далеко не всегда требуется больше памяти. К примеру, японским знакам в этом варианте требуется от 3 до 4 байтов, тогда как в UTF-8 — от 2 до 4. Соответственно, UTF-16 хорошо подходит в случае использования азиатских знаков, включая японские, китайские или корейские. Однако, он не в полной мере совместим с ASCII и нуждается в программном обеспечении, совместимом с Unicode. Возьмите это на заметку!
Конвертация Excel в CSV UTF-8
Допустим, в вашем распоряжении имеется книга Excel с несколькими иностранными знаками. Рассмотрим на примере японских:
Чтобы оставить все знаки в исходном состоянии, нужно действовать следующим образом:
1) Сначала нужно выбрать «Файл», «Сохранить как».
2) Далее нужно дать название файлу и выбрать текст Unicode (* .txt), далее необходимо кликнуть «Сохранить».
3) Затем следует открыть файл в текстовом редакторе Unicode TXT.
Примечание. В некоторых простых текстовых редакторах отсутствует поддержка всех знаков Юникода, поэтому некоторые знаки появятся в блоках. Чаще всего это ни на что не влияет, поэтому можно просто проигнорировать это либо воспользоваться более сложной программой, например Notepad ++.
4) Так как далее нам понадобится изменить файл в CSV (разделители — запятые), нужно проставить эти запятые.
Примечание. Если запятые вам не требуются, то следующий этап можно просто пропустить.
Выполните последовательность действий:
- Выберите знак табуляции, нажмите на правую кнопку мышки и выберите «Копировать». В данном случае также есть всем известная комбинация клавиш для быстрого выполнения команды. Зажмите CTRL + C.
- Нажмите CTRL + H, появится окно “Заменить”, далее вставьте то, что было скопировано ранее (комбинация CTRL + V), в строке “Найти”. В строке «Заменить на» поставьте запятую. В конце кликните «Заменить все».
В Блокноте полученный файл должен выглядеть так:
5) Далее необходимо кликнуть “Файл” и “Сохранить как”, дать название файлу и изменить кодировку на UTF-8. В конце нужно кликнуть Сохранить.
6) С помощью проводника поменяйте расширение с .txt на .csv.
Есть еще один вариант замены, в окне «Сохранить как CSV». Нужно выбрать «Все файлы» (*. *), см. скриншот ниже:
7) Далее проверим результат. Для этого нужно открыть файл CSV в Excel, нажать “Файл”, “Открыть”, “Текстовые файлы (.prn, .txt, .csv)”, убедиться, что информация верна.
Примечание. Если вы планируете использовать файл в других программах — чтобы избежать проблем с кодированием, не меняйте ничего в таблицах либо сохраняйте файл непосредственно в Excel. Если отображается не все, исправления нужно делать в самой программе, а затем еще раз выполнять сохранение в UTF-8.
Конвертация Excel в CSV UTF-16
Этот способ более простой и быстрый, так как при сохранении файла в Unicode (.txt) автоматически будет использоваться UTF-16.
И все, что нужно сделать, — это кликнуть «Файл», «Сохранить как в Excel», затем выбрать формат Unicode (* .txt) и изменить расширение файла Windows Explorer на CSV. Сделано!
Когда вам требуется, чтобы в CSV-файле были прописаны запятые — воспользовавшись текстовым редактором, нужно заменить пробелы на запятые (для получения дополнительной информации см. вышеуказанный этап 6.
Другие способы преобразования Excel в CSV
Только что описанные способы являются универсальными. Они работают для всех спецзнаков и в любых версиях.
Есть также несколько других способов, которыми также при необходимости можно воспользоваться.
Конвертировать посредством Google таблиц
Это очень простое решение. Предположим, вы уже установили Google Диск, далее потребуется выполнить всего пять простых действий.
1) Итак, нажимаем «Создать на Google Диске», затем нужно выбрать таблицы.
2) Далее следует выбрать “Импорт” в меню “Файл”.
3) Затем нужно кликнуть «Загрузить», далее потребуется выбрать у себя на компьютере необходимый для загрузки файл.
4) После этого выбираем «Заменить электронную таблицу», кликаем «Импорт».
Рекомендация. Чтобы сэкономить время, можно просто скопировать данные в Google таблицу. Но это подходит лишь в случае, если у вас небольшой документ.
5) Далее переходим в “Файл”, “Загрузить как”, выбираем значения через запятую, затем сохраняем файл CSV к себе на компьютер.
Наконец, проверьте получившийся документ в каком-нибудь редакторе, чтобы удостовериться, что все сохранилось, как следует. К сожалению, эта методика не во всех случаях позволяет отображать все правильно.
Сохраните .xlsx в .xls, далее конвертируйте в .csv
Эта методика навряд ли нуждается в дополнительном объяснении, поскольку название подзаголовка говорит само за себя.
Это решение было предложено на форуме. Многие пользователи сообщали, что специальные символы, потерянные при прямом сохранении .xlsx в .csv, можно сохранить, если сначала сохранить файл .xlsx в .xls , а затем сохранить .xls как .csv. Конечно же, вы можете попробовать этот способ самостоятельно, и, если все идет как надо, это может сэкономить ваше время.
Сохранить Excel в формате CSV с помощью OpenOffice
Последовательность действий при использовании программы OpenOffice представлена далее. Сначала с помощью OpenOffice Calc открываем документ Excel, выбираем “Файл”, “Сохранить как”. Затем сохраняем как CSV (.scv).
Затем вам придется выбирать между различными наборами знаков и разделителями полей. Конечно, следует выбрать Unicode (UTF-8) и запятую, если в результате нам необходимо прийти к CVS UTF-8 (либо другому требуемому кодировочному и пунктуационному символу), кликните OK. Как правило, остаются кавычки («) по умолчанию.
Кроме того, можно использовать другое приложение того же типа — LibreOffice — для быстрой и беспроблемной конвертации из Excel в CSV.
Оцените качество статьи. Нам важно ваше мнение:
Содержание
- Изменить кодировку Excel по умолчанию на UTF-8?
- 6 ответов
- Изменение кодировки в Microsoft Excel
- Работа с кодировкой текста
- Способ 1: изменение кодировки с помощью Notepad++
- Способ 2: применение Мастера текстов
- Способ 3: сохранение файла в определенной кодировке
- Excel: Change default encoding (file origin) of Text Import Wizard to UTF-8 (65001 : Unicode)
- 8 Answers 8
- Excel works!
- Excel works!
- Каракули и иероглифы в Excel
- Каракули и иероглифы в Excel. Неверная кодировка
- Неверная кодировка при получении данных из внешних источников. Открытие CSV файлов
- Открываем не той программой
- Как добавить символы-иероглифы в тексте?
Изменить кодировку Excel по умолчанию на UTF-8?
Я использую различные инструменты для регулярной подготовки данных для web. Один из этапов требует от меня открыть CSV в Excel, внести изменения и сохранить файл.
есть ли способ заставить Excel принять кодировку UTF-8 и сохранить свои файлы с этой кодировкой?
6 ответов
- в редакторе реестра перейдите к HKEY_CURRENT_USER>программное обеспечение>Microsoft>офис>[версия Excel здесь-вероятно, наибольшее число в этой папке] > Excel>параметры
- щелкните правой кнопкой мыши на правой стороне и перейдите в New > DWORD
- наименование элемента DefaultCPG, и сохранить
- щелкните правой кнопкой мыши DefaultCPG и выберите Изменить
- установить основание в десятичное
- введите код, показанный в Мастере Excel (для UTF-8 это 65001)
- нажмите OK.
Как говорит Василь в комментарии к этому вопросу, если ваш файл на самом деле не в формате UTF-8, вы можете технически преобразовать символы в файле в кодировку, которую вы хотите, прежде чем открывать в Excel. Для моих целей, хотя, UTF-8 делает достаточно хорошую работу по отображению неповрежденных символов.
один простой способ изменить кодировку excel ANSI на UTF-8-это открыть .CSV-файл в блокноте выберите «Файл» > «Сохранить как». Теперь в нижней части вы увидите кодировку он установлен в ANSI изменить его на UTF-8 и сохранить файл как новый файл, а затем сделать.
Источник
Изменение кодировки в Microsoft Excel
С потребностью менять кодировку текста часто сталкиваются пользователи, работающие браузерах, текстовых редакторах и процессорах. Тем не менее, и при работе в табличном процессоре Excel такая необходимость тоже может возникнуть, ведь эта программа обрабатывает не только цифры, но и текст. Давайте разберемся, как изменить кодировку в Экселе.
Работа с кодировкой текста
Кодировка текста – эта набор электронных цифровых выражений, которые преобразуются в понятные для пользователя символы. Существует много видов кодировки, у каждого из которых имеются свои правила и язык. Умение программы распознавать конкретный язык и переводить его на понятные для обычного человека знаки (буквы, цифры, другие символы) определяет, сможет ли приложение работать с конкретным текстом или нет. Среди популярных текстовых кодировок следует выделить такие:
Последнее наименование является самым распространенным среди кодировок в мире, так как считается своего рода универсальным стандартом.
Чаще всего, программа сама распознаёт кодировку и автоматически переключается на неё, но в отдельных случаях пользователю нужно указать приложению её вид. Только тогда оно сможет корректно работать с кодированными символами.
Наибольшее количество проблем с расшифровкой кодировки у программы Excel встречается при попытке открытия файлов CSV или экспорте файлов txt. Часто, вместо обычных букв при открытии этих файлов через Эксель, мы можем наблюдать непонятные символы, так называемые «кракозябры». В этих случаях пользователю нужно совершить определенные манипуляции для того, чтобы программа начала корректно отображать данные. Существует несколько способов решения данной проблемы.
Способ 1: изменение кодировки с помощью Notepad++
К сожалению, полноценного инструмента, который позволял бы быстро изменять кодировку в любом типе текстов у Эксель нет. Поэтому приходится в этих целях использовать многошаговые решения или прибегать к помощи сторонних приложений. Одним из самых надежных способов является использование текстового редактора Notepad++.
- Запускаем приложение Notepad++. Кликаем по пункту «Файл». Из открывшегося списка выбираем пункт «Открыть». Как альтернативный вариант, можно набрать на клавиатуре сочетание клавиш Ctrl+O.
- Запускается окно открытия файла. Переходим в директорию, где расположен документ, который некорректно отобразился в Экселе. Выделяем его и жмем на кнопку «Открыть» в нижней части окна.
Несмотря на то, что данный способ основан на использовании стороннего программного обеспечения, он является одним из самых простых вариантов для перекодировки содержимого файлов под Эксель.
Способ 2: применение Мастера текстов
Кроме того, совершить преобразование можно и с помощью встроенных инструментов программы, а именно Мастера текстов. Как ни странно, использование данного инструмента несколько сложнее, чем применение сторонней программы, описанной в предыдущем методе.
- Запускаем программу Excel. Нужно активировать именно само приложение, а не открыть с его помощью документ. То есть, перед вами должен предстать чистый лист. Переходим во вкладку «Данные». Кликаем на кнопку на ленте «Из текста», размещенную в блоке инструментов «Получение внешних данных».
- Открывается окно импорта текстового файла. В нем поддерживается открытие следующих форматов:
- TXT;
- CSV;
- PRN.
Переходим в директорию размещения импортируемого файла, выделяем его и кликаем по кнопке «Импорт».
Открывается окно Мастера текстов. Как видим, в поле предварительного просмотра символы отображаются некорректно. В поле «Формат файла» раскрываем выпадающий список и меняем в нем кодировку на «Юникод (UTF-8)».
Если данные отображаются все равно некорректно, то пытаемся экспериментировать с применением других кодировок, пока текст в поле для предпросмотра не станет читаемым. После того, как результат удовлетворит вас, жмите на кнопку «Далее».
- Общий;
- Текстовый;
- Дата;
- Пропустить столбец.
Тут настройки следует выставить, учитывая характер обрабатываемого контента. После этого жмем на кнопку «Готово».
Способ 3: сохранение файла в определенной кодировке
Бывает и обратная ситуация, когда файл нужно не открыть с корректным отображением данных, а сохранить в установленной кодировке. В Экселе можно выполнить и эту задачу.
- Переходим во вкладку «Файл». Кликаем по пункту «Сохранить как».
- Открывается окно сохранения документа. С помощью интерфейса Проводника определяем директорию, где файл будет храниться. Затем выставляем тип файла, если хотим сохранить книгу в формате отличном от стандартного формата Excel (xlsx). Потом кликаем по параметру «Сервис» и в открывшемся списке выбираем пункт «Параметры веб-документа».
- В открывшемся окне переходим во вкладку «Кодировка». В поле «Сохранить документ как» открываем выпадающий список и устанавливаем из перечня тот тип кодировки, который считаем нужным. После этого жмем на кнопку «OK».
- Возвращаемся в окно «Сохранения документа» и тут жмем на кнопку «Сохранить».
Документ сохранится на жестком диске или съемном носителе в той кодировке, которую вы определили сами. Но нужно учесть, что теперь всегда документы, сохраненные в Excel, будут сохраняться в данной кодировке. Для того, чтобы изменить это, придется опять заходить в окно «Параметры веб-документа» и менять настройки.
Существует и другой путь к изменению настроек кодировки сохраненного текста.
- Находясь во вкладке «Файл», кликаем по пункту «Параметры».
- Открывается окно параметров Эксель. Выбираем подпункт «Дополнительно» из перечня расположенного в левой части окна. Центральную часть окна прокручиваем вниз до блока настроек «Общие». Тут кликаем по кнопке «Параметры веб-страницы».
- Открывается уже знакомое нам окно «Параметры веб-документа», где мы проделываем все те же действия, о которых говорили ранее.
Теперь любой документ, сохраненный в Excel, будет иметь именно ту кодировку, которая была вами установлена.
Как видим, у Эксель нет инструмента, который позволил бы быстро и удобно конвертировать текст из одной кодировки в другую. Мастер текста имеет слишком громоздкий функционал и обладает множеством не нужных для подобной процедуры возможностей. Используя его, вам придется проходить несколько шагов, которые непосредственно на данный процесс не влияют, а служат для других целей. Даже конвертация через сторонний текстовый редактор Notepad++ в этом случае выглядит несколько проще. Сохранение файлов в заданной кодировке в приложении Excel тоже усложнено тем фактом, что каждый раз при желании сменить данный параметр, вам придется изменять глобальные настройки программы.
Источник
Excel: Change default encoding (file origin) of Text Import Wizard to UTF-8 (65001 : Unicode)
I am using a variety of tools to regularly prepare data for the web. One stage requires me to open a CSV in Excel, make changes and save the file.
Is there a way to force Excel to accept UTF-8 encoding, and to save its files with that encoding?
8 Answers 8
- Close Excel, if it is open.
- Open the Registry Editor.
- Navigate to HKEY_CURRENT_USER → Software → Microsoft → Office → ▒▒ → Excel → Options, where ▒▒ is your version of Office, mostly likely the largest number you see there.
- Right-click an empty space on the right side and select New → DWORD.
- Name the item DefaultCPG, and press Enter to save.
- Right-click on DefaultCPG and select Modify.
- Set the Base to Decimal.
- For Value data, enter 65001 to set your default to UTF-8. For some other encoding, use the code page identifier, which you can find in the Text Import Wizard in Excel or in this list.
- Click OK.
Like Vasille says in the comment to this question, if your file is not actually in UTF-8 format, you may technically want to convert the characters within the file to the encoding you want before opening in Excel. For my purposes, though, UTF-8 does a good enough job of displaying non-corrupted characters.
Not working? Make sure you set Base to Decimal (Step 7).
Источник
Excel works!
Excel работает за вас
Excel works!
Thanks for Visiting
Каракули и иероглифы в Excel
Почему появляются Каракули и иероглифы в Excel? У этой проблемы может быть несколько вариантов, соберу большинство решений в этой статье. Ну и заодно напишу, как добавлять и использовать символы-иероглифы в тексте.
Проблема с кодировкой часто возникает в разных программах. Кто выгружает данные из ИТ систем , уверен сталкивался с проблемой смены кодировки. Разберем и другие случаи
Каракули и иероглифы в Excel. Неверная кодировка
Если при открытии файла вы видите каракули/иероглифы в Excel, вам может помочь смена кодировки. Пересохраните файл следующим способом:
Нажав «Сохранить как», нажмите на кнопку Сервис и выберите Параметры веб-документа
На вкладке Кодировка выберите Юникод (UTF-8) или Кириллица (Windows)
Неверная кодировка при получении данных из внешних источников. Открытие CSV файлов
Если при вставке данных из других файлов или внешних источников получаются каракули/неизвестные символы, тоже рекомендуется уточнить кодировку. Сделать это можно следующим образом:
На ленте управления выберите вкладку Данные, а в разделе Получение внешних данных выберите нужный пункт.
Если вы вставляете обычные данные из файла, т.е. текст или таблицу, выберите Из текста
Укажите файл, из которого забираем данные, после выберите формат данных, а главное в разделе Формат файла выберите Юникод (UTF-8).
Что выбрать с разделителем или фиксированной ширины (шаг 1), а так же следующий шаг (шаг 2) подробно описан в этой статье.
В шаге 3 выбираем «Общий» формат данных.
Открываем не той программой
Так же я рекомендую проверить, какой именно программой вы открываете Excel-файл. Бывает, что книги 2010 формата Excel открываются в Excel 2003 (или более ранние версии) с измененным на иероглифы текстом. Подробнее про форматы Excel здесь .
Точно такая же проблема периодически возникает, если открывать сложные Excel-книги с большим набором данных через альтернативные табличные редакторы, такие как LibreOffice.Calc, Apache OpenOffice и другие.
Как добавить символы-иероглифы в тексте?
«С текстом у меня все в порядке, мне нужно вставить иероглиф/символ в Excel» — скажете вы. Чтобы вставить символ, перейдите на вкладку Вставка и в разделе Символы выберите Символ.
В таблице символов можно найти почти любой символ
Чтобы добавить его в текст, кликните по нему.
Источник
В этой статье представлены 3 функции для работы с текстовыми файлами:
- Text_LoadFromFile — загружает текст из заданного файла
- Text_SaveToFile — сохраняет текст в файл в нужной кодировке
- ReturnCharset — получает кодировку заданного текстового файла
Среди доступных кодировок есть koi8-r, ascii, utf-7, utf-8, utf-8noBOM, utf-16, Windows-1251, unicode, и т.д.
Под кодировкой utf-8noBOM подразумевается utf-8 без BOM (без трёх стартовых байтов 0xEF, 0xBB, 0xBF)
Список доступных кодировок можно найти в реестре Windows, в ветке HKEY_LOCAL_MACHINESOFTWAREClassesMIMEDatabaseCharset
Для начала — пример использования функций:
Sub Example_ReadAndWriteTextFile() Dim file$, txt$, enc$ ' полный путь к текстовому файлу file$ = "C:Windowswin.ini" ' получаем кодировку файла (необязательно) enc$ = ReturnCharset(file$) ' считываем текст из файла txt$ = Text_LoadFromFile(file$) ' добавляем строку в начало текста txt$ = "; это добавленная строка" & vbNewLine & txt ' записываем обратно в файл (кодировка файла не изменится) Text_SaveToFile txt$, file$, enc$ ' проверяем, был ли добавлен текст txt$ = Text_LoadFromFile(file$) MsgBox Left(txt, 200), , "Кодировка: " & enc End Sub
Sub Example_ReadTextFilesOnDesktop() Dim folder$, sFiles, txt$, enc$, item ' путь к папке РАБОЧИЙ СТОЛ folder$ = CreateObject("WScript.Shell").SpecialFolders("Desktop") & "" sFiles = Dir(folder$ & "*.txt*") Do While sFiles <> "" ' перебираем файлы в папке item = folder$ & sFiles ' полный путь к файлу enc$ = ReturnCharset(item) ' получаем кодировку файла txt$ = Text_LoadFromFile(item) ' считываем текст из файла ' выводим данные о файле (размер в байтах, кодировка, имя файла) Debug.Print "Размер: " & FileLen(item), "Кодировка: " & enc$, sFiles Debug.Print " Текст: " & Replace(Replace(Left(txt$, 50), vbCr, " "), vbLf, " ") sFiles = Dir Loop End Sub
Код функций для работы с текстовыми файлами:
Function Text_LoadFromFile(ByVal Filename$, Optional ByVal Encoding$) As String ' функция загружает текст в кодировке Encoding$ из файла filename$ ' © 2022 ExcelVBA.ru On Error Resume Next: Dim FSO, ts If Encoding$ = "" Then Encoding$ = ReturnCharset(Filename$) If Encoding$ = "ANSI" Then Encoding$ = "windows-1251" If Encoding$ = "UTF-8noBOM" Then Encoding$ = "UTF-8" If Encoding$ = "windows-1251" Then ' так НАМНОГО быстрее считываются большие файлы Set FSO = CreateObject("scripting.filesystemobject") Set ts = FSO.OpenTextFile(Filename$, 1, True): Text_LoadFromFile = ts.ReadAll: ts.Close Set ts = Nothing: Set FSO = Nothing: Exit Function End If With CreateObject("ADODB.Stream") .Type = 2: If Len(Encoding$) Then .charset = Encoding$ .Open: .LoadFromFile Filename$ Text_LoadFromFile = .ReadText: .Close End With End Function Function Text_SaveToFile(ByVal txt$, ByVal Filename$, Optional ByVal Encoding$) As Boolean ' функция сохраняет текст txt в кодировке Encoding$ в файл filename$ ' возвращает TRUE, если сохранение прошло успешно ' © 2022 ExcelVBA.ru On Error Resume Next: Err.Clear If Encoding$ = "ANSI" Then Encoding$ = "windows-1251" If Encoding$ = "" Then Encoding$ = "UTF-8" ' кодировка по умолчанию: UTF-8 Select Case Encoding$ Case "utf-8noBOM" With CreateObject("ADODB.Stream") .Type = 2: .charset = "utf-8": .Open: .WriteText txt$ Dim binaryStream As Object: Set binaryStream = CreateObject("ADODB.Stream") binaryStream.Type = 1: binaryStream.Mode = 3: binaryStream.Open .Position = 3: .CopyTo binaryStream 'Skip BOM bytes .flush: .Close binaryStream.SaveToFile Filename$, 2 binaryStream.Close End With Case Else With CreateObject("ADODB.Stream") .Type = 2: .charset = Encoding$: .Open: .WriteText txt$ .SaveToFile Filename$, 2: .Close End With End Select Text_SaveToFile = Err = 0: DoEvents End Function Function ReturnCharset(ByVal filePath As String) As String On Error Resume Next ' © 2022 ExcelVBA.ru Dim bytHeader(2) As Byte, txt$, lngFileNum As Long, fLen& lngFileNum = FreeFile If CreateObject("Scripting.FileSystemObject").FileExists(filePath) Then Open filePath For Binary Access Read As lngFileNum Get lngFileNum, , bytHeader ' first 3 bytes Close lngFileNum End If Select Case bytHeader(0) Case 255: 'UTF-16 (LE) FF FE 255 254 If bytHeader(1) = 254 Then ReturnCharset = "UTF-16LE" ' Unicode Case 254: 'UTF-16 (BE) FE FF 254 255 If bytHeader(1) = 255 Then ReturnCharset = "UTF-16BE" ' UnicodeBigEndian Case 239: 'UTF-8 EF BB BF 239 187 191 If bytHeader(1) = 187 Then If bytHeader(2) = 191 Then ReturnCharset = "UTF-8" Case 43: 'UTF-7 2b 2f 76 43 47 118 If bytHeader(1) = 47 Then If bytHeader(2) = 118 Then ReturnCharset = "UTF-7" End Select If ReturnCharset = "" Then fLen& = FileLen(filePath) ' для файлов более 2 МБ не уточняем тип файла, ибо это занимает много времени If fLen& > 2048000 Then ReturnCharset = "ANSI": Exit Function With CreateObject("ADODB.Stream") .Type = 2: .charset = "UTF-8": .Open .LoadFromFile filePath ' загружаем данные из файла txt$ = .ReadText ReturnCharset = IIf(Len(txt) < .Size - 3, "UTF-8noBOM", "ANSI") .Close End With End If End Function
Если в таблице вместо нужной информации вы увидели вопросы, иероглифы или другие непонятные знаки, это значит, вам надо разобраться, как поменять кодировку в Excel. Эта функция доступна в самом Microsoft Office. Но избавиться от проблемы можно и другими методами.
Иногда мы получаем непонятные иероглифы
Что такое кодировка?
Компьютер воспринимает любую информацию, как набор цифр. Поэтому у каждого печатного знака есть свой код. Он состоит из чисел и букв латинского алфавита. Символы и соответствующие им числа — это и есть кодировка.
У неё есть несколько стандартов. Например, Koi-8, Unicode, Windows-1251, ASCII. И если файл с текстом сохранён, скажем, в Кои-8, в Excel он будет неправильно отображаться в Юникоде. Так как в этих наборах одним и тем же символам приписаны разные коды.
Как поменять кодировку в программе?
Для работы с таблицей, в которой используется стандарт, не заданный по умолчанию в программе, надо изменить кодировку. Существует несколько способов.
При помощи Notepad
Если в Экселе не получается превратить «кракозябры» в нормальный текст, откройте файл в программе «Notepad++». Она распространяется бесплатно. Настройте там отображение символов, а потом продолжайте работать в Excel.
Откройте файл в программе «Notepad++»
- Создайте резервную копию документа. Или сохраните информацию из него в какой-нибудь другой таблице.
- Запустите Notepad.
- Перейдите в Файл — Открыть (File — Open) и укажите путь к таблице. В поле «Тип файла» поставьте «Все типы» («All types»). Или укажите конкретный формат. Таблицы имеют расширения .cvs, .xls, .xltm, xlam, .xlm. В Нотпаде текст отобразится без сетки. В нём ничего не надо редактировать.
- Справа внизу в строке состояния будет изображён стандарт, используемый сейчас.
- Откройте меню Кодировка (Encoding). Оно находится вверху окна.
- Нажмите «Преобразовать в UTF-8» («Convert to UTF-8»). Документ будет конвертирован в нужный формат. Этот стандарт Excel воспринимает нормально и не станет превращать в бессвязный поток странных символов.
- Теперь выберите, какие знаки необходимо использовать. В том же меню Encoding наведите выпадающий список. Он там один.
- Для русского языка выберите Кириллица — Windows-1251. Если текст, скажем, на арабском или греческом — отметьте соответствующий набор символов. В разных странах используются разные стандарты.
- Программа попросит подтвердить действие.
- Если это не помогло, попробуйте другие кириллические шрифты.
- Сохранять текст надо тоже в экселевском формате.
Откройте файл в utf-8
Через интерфейс программы
Вот как сменить кодировку в Excel, используя встроенные возможности:
- Запустите программу. Не надо открывать заполненный документ. Нужен «чистый» лист.
- Перейдите во вкладку «Данные» в строке меню.
- На панели «Получать внешние данные» нажмите «Из текста».
- В списке «Тип файла» (он находится рядом с кнопкой «Отмена») выберите «Все» или «Любые». Так в окне будут отображаться форматы Excel, а не только .txt.
- Задайте путь к таблице.
- Откроется мастер импорта.
- В поле «Формат» можете выбрать желаемый стандарт.
- В области «Предварительный просмотр» показано, как будет выглядеть текст с отмеченным набором символов. Можете прокручивать список и искать, какая настройка подходит.
- Когда подберёте нужный вариант, нажмите «Готово».
Можно использовать встроенные возможности
Как сохранить файл в определённой кодировке?
Можно сделать так, чтобы в сохранённом вами файле стояла определённая кодировка Excel.
- Нажмите на зелёную кнопку «Файл» (в Office 2007 надо кликнуть на логотип слева вверху).
- Параметры — Дополнительно.
- Прокрутите вниз до раздела «Общие».
- Кнопка «Параметры веб-документа».
- Вкладка «Кодировка».
- В поле «Сохранить документ как» укажите желаемое значение и нажмите «OK».
Ещё можно сделать так:
- Нажмите на «Файл» или логотип офиса.
- Выберите «Сохранить как…».
- Кликните на «Сервис». Там будет тот же самый пункт «Параметры веб-документа».
Как добавить в программы офиса новую кодировку?
Если ни один из стандартов не подошёл для вашего документа, добавьте новые.
- Пуск — Панель управления.
- «Программы и компоненты» или «Удаление программ».
- Нажмите на пункт Office или Excel (в зависимости от того, установлен ли у вас весь пакет продуктов Микрософт Офис или только Эксель).
- Кнопка «Изменить». Она над основной рабочей областью.
- Поставьте маркер в «Добавить или удалить» и кликните «Продолжить».
- Откройте ветку Общие средства — Многоязыковая поддержка.
- Нажмите на чёрную стрелочку рядом с нужным стандартом и включите функцию «Запускать на моём компьютере».
- Кликните «Продолжить» и дождитесь окончания процесса. Будут добавлены новые наборы.
В Excel можно поменять кодировку, если символы отображаются неправильно. Эта функция доступна в инструментарии программы. Но иногда используется сторонний софт.
#excel #vba
Вопрос:
У меня работает весь мой код, но это сохраняет текст в ANSI, хотел бы сохранить текст в формате UTF-8, не могли бы вы мне помочь с этим?
Option Explicit
Sub SaveWorkSheetAsCSV()
ActiveSheet.Buttons.Delete
Dim FolderPath As String
FolderPath = "C:Users" amp; Environ("USERNAME") amp; "Test"
Dim FileName As String: FileName = Format(Now, "yyyymmdd-hh.mm ") amp; " Test"
Dim sws As Worksheet: Set sws = ThisWorkbook.Worksheets(4)
Application.ScreenUpdating = False
sws.Copy
Dim dwb As Workbook: Set dwb = ActiveWorkbook
Application.DisplayAlerts = False
dwb.SaveAs FolderPath amp; "" amp; FileName amp; ".txt", xlCSV, Local:=True
Application.DisplayAlerts = True
dwb.Close SaveChanges:=False
Application.ScreenUpdating = True
ThisWorkbook.FollowHyperlink FolderPath
End Sub
Комментарии:
1. Проверьте документацию для рабочей книги. Сохраните, особенно аргумент FileFormat. docs.microsoft.com/en-us/office/vba/api/excel.xlfileformat
2. Спасибо, я уже проверил это, к сожалению, ничего для txt как UTF-8.
Ответ №1:
У вас есть пара вариантов, чтобы изменить свой SaveAs
Попробуйте любой из этих»
'My best guess that will work
dwb.SaveAs FolderPath amp; "" amp; FileName, xlCurrentPlatformText, Local:=True
'Alternative text
dwb.SaveAs FolderPath amp; "" amp; FileName, xlUnicodeText, Local:=True
'CSV approach
dwb.SaveAs FolderPath amp; "" amp; FileName, xlCSVUTF8, Local:=True
Комментарии:
1. Спасибо, я разберусь с этим!
2. Я должен проверить это еще раз, xlCSVUTF8, возвращается к ошибке.
3. Это будет связано с файлом. Не код. Довольно стандартная процедура.
4. Я собираюсь проверить это сегодня!
5. Кажется, что xlCSVUTF8 работает, но он сохраняется как UTF-8 с BOM, есть ли возможность сохранить это без части спецификации?
Сохранение в .txt с разделителем — точка с запятой [UTF-8] |
||||||||
Ответить |
||||||||
Ответить |