Что делать если при конвертации pdf в word получаются нечитаемые символы

Не копируется текст из PDF: причины, способы изменения формата и советы специалистов

Бывало у вас такое, что вам необходимо текст, присутствующий в каком-то PDF-документе, вставить в другую программу для редактирования, но в файле PDF текст не копируется? Как бы посоветовали поступить в такой ситуации? Далеко не многие пользователи догадываются о том, что можно воспользоваться не одним, а несколькими простыми способами, позволяющими «разрулить» ситуацию. Но для начала давайте остановимся на некоторых стандартных случаях и их причинах, а затем попробуем найти наиболее подходящее решение для каждого из них. Сразу стоит отметить, что изменять оригинальный формат документа не всегда целесообразно.

Почему текст из PDF не копируется?

How dangerous is the new coronavirus? You will be interested: How dangerous is the new coronavirus?

Итак, первой и основной причиной невозможности копирования содержимого документов PDF большинство специалистов считает установку всевозможных запретов на подобные действия в самих файлах.

Запрет копирования в структуре файла

Это могут быть и пароли на открытие, и запреты на копирование, и даже защита документа при попытке вывода содержимого на печать. Еще одна не менее распространенная ситуация, связанная с тем, что текст из PDF не копируется, может быть связана с повреждением самого файла или нарушением его оригинальной структуры. Реже можно встретить и случаи, когда пользователь использует для извлечения текстового содержимого из PDF-документа не совсем подходящее приложение. Так, например, очень многие эксперты сходятся во мнении, что у Adobe Reader возможностей в сравнении с Acrobat гораздо больше. Поэтому, если текст из PDF не копируется в «Акробате», первым делом попробуйте выполнить аналогичную операцию в «Ридере». Вполне возможно, это даст желаемый результат. Но в большинстве случаев это, увы, не помогает, поскольку содержимое попросту защищено от копирования, а пароль скрыт глубоко внутри самого файла. Как обойти такие ограничения рассмотрим чуть позже, а пока остановимся еще на одной ситуации, которая тоже многих пользователей ставит в тупик.

Почему текст из PDF копируется иероглифами?

Теперь предположим, что защита от копирования в оригинальном документе не установлена и все вроде бы нормально. Но почему-то при переносе содержимого в другой редактор текст из PDF копируется иероглифами. Связано это только с тем, что оригинал имеет отличную от стандартной кодировку. Чаще всего специалисты в такой ситуации предлагают самый простой выход, при котором даже изменять начальный формат документа не потребуется. Исходя из того, что текст из PDF копируется с неправильной кодировкой, ее нужно сменить.

Пересохранение файла PDF

Для этого проще всего воспользоваться файловым меню любого редактора PDF, выбрать пункт «Сохранить как. » (Save As…), а затем в окне сохранения нажать кнопку параметров (Settings) и выбрать другую кодировку. Обычно достаточно поменять оригинальный стандарт на UTF-8. При повторном открытии документа текст можно будет скопировать и вставить в любой другой текстовый редактор в неизменном виде. Также перекодировать файл можно на каком-нибудь интернет-ресурсе вроде Decoder.

Как обойти запрет копирования в самом файле?

Теперь давайте посмотрим, что можно сделать для обхода всевозможных запретов и блокировок.

Программа PDF Password Remover

Если текст из PDF не копируется ни под каким предлогом, можете воспользоваться пиратским методом, выполнив снятие ограничений или удаление установленных паролей в программе PDF Password Remover. Если это результата не даст, можете зайти на какой-нибудь специализированный сайт вроде PDFPirate или FreeMyPDF и попытаться снять защиту там. Однако каждый должен понимать, что в случае с некоторыми официальными документами такая методика является противозаконной.

Открытие файла PDF в Word

Еще одна простая методика, рекомендуемая для устранения множества проблем с оригинальными PDF-документами, которые необходимо отредактировать, состоит в том, чтобы не копировать исходное содержимое в «просмотрщике» или редакторе PDF, а открыть файл непосредственно в той программе, с использованием которой предполагается производить редактирование.

Открытие PDF в Word

В случае с текстовыми документами, проще всего воспользоваться универсальным «Вордом» и открыть искомый документ в этом приложении, выбрав соответствующий тип файла. Если документ откроется без проблем, его можно будет и отредактировать, и сохранить в нужном формате.

Как преобразовать текст PDF в Word?

Но давайте предположим, что исходный документ в текстовых редакторах не открывается (мало ли что может быть) и в «родных» редакторах текст из PDF не копируется.

Копирование файла PDF в буфер

В этом случае для преобразования файла именно в документ Word попробуйте в PDF-редакторе выбрать не копирование текста, а копирование файла в буфер обмена целиком, после чего вставьте содержимое в Word. Способ, конечно, далеко не самый удобный, поскольку вставка будет иметь графический формат, и отредактировать материал будет невозможно.

В этой ситуации оптимальным решением станет смена формата оригинального документа на любой другой. В интернете сейчас выложено достаточно много программ-конвертеров, например, PDF to Word Converter и др. В выбранном приложении обычно достаточно просто указать начальный файл и конечный формат после преобразования. При помощи таких апплетов, кстати, можно преобразовать PDF не только в Word. Существуют и программы для конвертирования в Excel.

Проблемы с самим текстом в PDF-документах

Иногда бывает и так, что в оригинальном файле текстовое содержимое могло быть изначально создано путем сканирования какого-то печатного документа. Совершенно очевидно, что при таком подходе текст был сохранен именно в графическом формате. При этом и на него могли быть установлены запреты на копирование или печать. Как поступить в такой ситуации?

Использование системы оптического распознавания

В этом случае на помощь приходят системы оптического распознавания OCR. Практически все эксперты сходятся во мнении, что оптимальным вариантом станет выбор пакета ABBY Finereader. Конечно, программа не бесплатная, но на просторах «Рунета» можно найти уже активированные (взломанные) версии или модификации с ключом активации.

Программа ABBYY Finereader

В самом приложении в стартовом окне выбрать преобразование файла PDF/изображения в документ Word. Система самостоятельно распознает текст с картинки и отправит его в Word, после чего можно будет выполнить редактирование и сохранить новый документ.

Конвертирование в другие форматы

Наконец, если стоит задача преобразовать текст в другие нестандартные форматы, обычно для этих целей рекомендуется применять все те же конвертеры, выбирая либо узконаправленные программы (например, PDF to JPEG для конвертирования в графические файлы), либо универсальные приложения, поддерживающие не один, а несколько форматов, среди которых будет тот, что нужен. Иногда можно использовать и онлайн-сервисы, но это неудобно по соображениям больших временных затрат и ограничений по размеру добавляемых файлов (или их количеству).

Заключение

Подводя итоги, можно выделить несколько основных моментов. Во-первых, изменять исходный формат не всегда нужно, поскольку выполнить копирование можно либо в более продвинутом редакторе, как в случае с «Акробатом» и «Ридером», либо открыть файл непосредственно в той программе для работы с текстовым содержимым, в которую нужно вставить исходный материал, как в случае с Word. Во-вторых, для сброса паролей и запретов лучше всего применять специальные приложения (пусть даже это и выглядит незаконно). В-третьих, большинство конвертеров в процессе преобразования форматов запреты, как правило, игнорируют, так что и их использование выглядит весьма перспективным. В-четвертых, не стоит сбрасывать со счетов и системы распознавания текста, которые иногда выглядят даже лучше, чем все предыдущее. В-пятых, существует мнение, что иногда преобразование можно выполнить при помощи виртуальных принтеров, но такой вариант годится только для тех случаев, когда исходный текстовый фрагмент нужно преобразовать в графику.

При конвертации pdf в word иероглифы. Что делать, если вместо текста иероглифы (в Word, браузере или текстовом документе). Копируем текст из PDF файла в Word с помощью онлайн конвертеров

Вопрос пользователя

Здравствуйте.

Подскажите пожалуйста, почему у меня некоторые странички в браузере отображают вместо текста иероглифы, квадратики и не пойми что (ничего нельзя прочесть). Раньше такого не было.

Заранее спасибо.

Доброго времени суток!

Действительно, иногда при открытии какой-нибудь интернет-странички вместо текста показываются различные «крякозабры» (как я их называю), и прочитать это нереально.

Происходит это из-за того, что текст на страничке написан в одной кодировке (более подробно об этом можете узнать из ), а браузер пытается его открыть в другой. Из-за такого рассогласования, вместо текста — непонятный набор символов.

Попробуем исправить это.

Исправляем иероглифы на текст

Вообще, раньше Internet Explorer часто выдавал подобные крякозабры, современные же браузеры (Chrome, Яндекс-браузер, Opera, Firefox) — довольно неплохо определяет кодировку, и ошибаются очень редко. Скажу даже больше, в некоторых версиях браузера уже убрали выбор кодировки, и для «ручной» настройки этого параметра нужно скачивать дополнения, или лезть в дебри настроек за 10-ток галочек.

И так, предположим браузер неправильно определили кодировку и вы увидели следующее (как на скрине ниже).

Чаще всего путаница бывает между кодировками UTF (Юникод) и Windows-1251 (большинство русскоязычных сайтов выполнены в этих кодировках).

  1. нажать левый ALT — чтобы сверху показалось меню. Нажать меню «Вид»;
  2. выбрать пункт «Кодировка текста» , далее выбрать Юникод . Вуаля — иероглифы на странички сразу же стали обычным текстом (скрин ниже)!

Еще один совет : если в браузере не можете найти, как сменить кодировку (а дать инструкцию для каждого браузера — вообще нереально!), я рекомендую попробовать открыть страничку в другом браузере. Очень часто другая программа открывает страницу так, как нужно.

Текстовые документы

Очень много вопросов по крякозабрам задаются при открытии каких-нибудь текстовых документов. Особенно старых, например при чтении Readme в какой-нибудь программе прошлого века (например, к играм).

Разумеется, что многие современные блокноты просто не могут прочитать DOS»овскую кодировку, которая использовалась ранее. Чтобы решить сию проблему, рекомендую использовать редактор Bread 3.

Bred 3

Простой и удобный текстовый блокнот. Незаменимая вещь, когда нужно работать со старыми текстовыми файлами. Bred 3 за один клик мышкой позволяет менять кодировку и делать не читаемый текст читаемым! Поддерживает кроме текстовых файлов довольно большое разнообразие документов. В общем, рекомендую!

Попробуйте открыть в Bred 3 свой текстовый документ (с которым наблюдаются проблемы). Пример показан у меня на скрине ниже.

Для работы с текстовыми файлами различных кодировок так же подойдет еще один блокнот — Notepad++. Вообще, конечно, он больше подходит для программирования, т.к. поддерживает различные подсветки, для более удобного чтения кода.

Пример смены кодировки показан ниже: чтобы прочитать текст, достаточно в примере ниже, достаточно было сменить кодировку ANSI на UTF-8.

WORD»овские документы

Очень часто проблема с крякозабрами в Word связана с тем, что путают два формата Doc и Docx . Дело в том, что с 2007 Word (если не ошибаюсь) появился формат Docx (позволяет более сильнее сжимать документ, чем Doc, да и надежнее защищает его).

Так вот, если у вас старый Word, который не поддерживает этот формат — то вы, при открытии документа в Docx, увидите иероглифы и ничего более.

Решения есть 2:

  1. скачать на сайте Microsoft спец. дополнение, которое позволяет открывать в старом Word новые документы. Только из личного опыта могу сказать, что открываются далеко не все документы, к тому же сильно страдает разметка документа (что в некоторых случаях очень критично);
  2. использовать аналоги Word (правда, тоже разметка в документе будет страдать);
  3. обновить Word до современной версии.

Так же при открытии любого документа в Word (в кодировке которого он «сомневается»), он на выбор предлагает вам самостоятельно указать оную. Пример показан на рисунке ниже, попробуйте выбрать:

  1. Widows (по умолчанию);
  2. MS DOS;
  3. Другая.

Окна в различных приложениях Windows

Бывает такое, что какое-нибудь окно или меню в программе показывается с иероглифами (разумеется, прочитать что-то или разобрать — нереально).

  1. Руссификатор. Довольно часто официальной поддержки русского языка в программе нет, но многие умельца делают руссификаторы. Скорее всего, на вашей системе — данный руссификатор работать отказался. Поэтому, совет простой: попробовать поставить другой;
  2. Переключение языка. Многие программы можно использовать и без русского, переключив в настройках язык на английский. Ну в самом деле: зачем вам в какой-то утилите, вместо кнопки «Start» перевод «начать»?
  3. Если у вас раньше текст отображался нормально, а щас нет — попробуйте восстановить Windows, если, конечно, у вас есть точки восстановления (подробно об этом здесь — );
  4. Проверить настройки языков и региональных стандартов в Windows, часто причина кроется именно в них.

Языки и региональные стандарты в Windows

Чтобы открыть меню настроек:

  • нажмите Win+R ;
  • введите intl.cpl , нажмите Enter.

intl.cpl — язык и регион. стандарты

Проверьте чтобы во вкладке «Форматы» стояло «Русский (Россия) // Использовать язык интерфейса Windows (рекомендуется)» (пример на скрине ниже).

Во вкладке местоположение поставьте расположение Россия.

И во вкладке дополнительно установите язык системы на «Русский (Россия)». После этого сохраните настройки и перезагрузите ПК. Затем вновь проверьте, нормально ли отображается интерфейс нужной программы.

И напоследок, наверное, для многих это очевидно, и все же некоторые открывают определенные файлы в программах, которые не предназначены для этого: к примеру в обычном блокноте пытаются прочитать файл DOCX или PDF. Естественно, в этом случае вы вместо текста будут наблюдать за крякозабрами, используйте те программы, которые предназначены для данного типа файла (WORD 2007+ и Adobe Reader для примера выше).

На сим всё, удачи!

Наверное, каждый пользователь ПК сталкивался с подобной проблемой: открываешь интернет-страничку или документ Microsoft Word — а вместо текста видишь иероглифы (различные «крякозабры», незнакомые буквы, цифры и т.д. (как на картинке слева…)).

Хорошо, если вам этот документ (с иероглифами) не особо важен, а если нужно обязательно его прочитать?! Довольно часто подобные вопросы и просьбы помочь с открытием подобных текстов задают и мне. В этой небольшой статье я хочу рассмотреть самые популярные причины появления иероглифов (разумеется, и устранить их).

Иероглифы в текстовых файлах (.txt)

Самая популярная проблема. Дело в том, что текстовый файл (обычно в формате txt, но так же ими являются форматы: php, css, info и т.д.) может быть сохранен в различных кодировках .

Кодировка — это набор символов, необходимый для того, чтобы полностью обеспечить написание текста на определенном алфавите (в том числе цифры и специальные знаки). Более подробно об этом здесь: https://ru.wikipedia.org/wiki/Набор_символов

Чаще всего происходит одна вещь: документ открывается просто не в той кодировке из-за чего происходит путаница, и вместо кода одних символов, будут вызваны другие. На экране появляются различные непонятные символы (см. рис. 1)…

Рис. 1. Блокнот — проблема с кодировкой

Как с этим бороться?

На мой взгляд лучший вариант — это установить продвинутый блокнот, например Notepad++ или Bred 3. Рассмотрим более подробно каждую из них.

Один из лучших блокнотов как для начинающих пользователей, так и для профессионалов. Плюсы: бесплатная программа, поддерживает русский язык, работает очень быстро, подсветка кода, открытие всех распространенных форматов файлов, огромное количество опций позволяют подстроить ее под себя.

В плане кодировок здесь вообще полный порядок: есть отдельный раздел «Кодировки» (см. рис. 2). Просто попробуйте сменить ANSI на UTF-8 (например).

После смены кодировки мой текстовый документ стал нормальным и читаемым — иероглифы пропали (см. рис. 3)!

Рис. 3. Текст стал читаемый… Notepad++

Еще одна замечательная программа, призванная полностью заменить стандартный блокнот в Windows. Она так же «легко» работает со множеством кодировок, легко их меняет, поддерживает огромное число форматов файлов, поддерживает новые ОС Windows (8, 10).

Кстати, Bred 3 очень помогает при работе со «старыми» файлами, сохраненных в MS DOS форматах. Когда другие программы показывают только иероглифы — Bred 3 легко их открывает и позволяет спокойно работать с ними (см. рис. 4).

Если вместо текста иероглифы в Microsoft Word

Самое первое, на что нужно обратить внимание — это на формат файла. Дело в том, что начиная с Word 2007 появился новый формат — «docx » (раньше был просто «doc «). Обычно, в «старом» Word нельзя открыть новые форматы файлов, но случается иногда так, что эти «новые» файлы открываются в старой программе.

Просто откройте свойства файла, а затем посмотрите вкладку «Подробно » (как на рис. 5). Так вы узнаете формат файла (на рис. 5 — формат файла «txt»).

Если формат файла docx — а у вас старый Word (ниже 2007 версии) — то просто обновите Word до 2007 или выше (2010, 2013, 2016).

Далее при открытии файла обратите внимание (по умолчанию данная опция всегда включена, если у вас, конечно, не «не пойми какая сборка») — Word вас переспросит: в какой кодировке открыть файл (это сообщение появляется при любом «намеке» на проблемы при открытии файла, см. рис. 5).

Рис. 6. Word — преобразование файла

Чаще всего Word определяет сам автоматически нужную кодировку, но не всегда текст получается читаемым. Вам нужно установить ползунок на нужную кодировку, когда текст станет читаемым. Иногда, приходится буквально угадывать, в как был сохранен файл, чтобы его прочитать.

Рис. 8. браузер определил неверно кодировку

Чтобы исправить отображение сайта: измените кодировку. Делается это в настройках браузера:

  1. Google chrome: параметры (значок в правом верхнем углу)/дополнительные параметры/кодировка/Windows-1251 (или UTF-8);
  2. Firefox: левая кнопка ALT (если у вас выключена верхняя панелька), затем вид/кодировка страницы/выбрать нужную (чаще всего Windows-1251 или UTF-8) ;
  3. Opera: Opera (красный значок в верхнем левом углу)/страница/кодировка/выбрать нужное.

Таким образом в этой статье были разобраны самые частые случаи появления иероглифов, связанных с неправильно определенной кодировкой. При помощи выше приведенных способов — можно решить все основные проблемы с неверной кодировкой.

Буду благодарен за дополнения по теме. Good Luck

Вопрос от пользователя

Добрый день.

Подскажите пожалуйста. У меня есть один файл формата PDF, и мне нужно его отредактировать (поменять часть текста, поставить заголовки и выделения). Думаю, что лучше всего такую операцию провести в WORD.

Как конвертировать этот файл в формат DOCX (с которым работает WORD)? Пробовала несколько сервисов, но некоторые выдают ошибку, другие — переносят текст, но теряют картинки. Можно ли сделать лучше?

Марина Иванова (Нижний Новгород)

Да, в офисной работе время от времени приходится сталкиваться с такой задачей. В некоторых случаях, она решается довольно легко, в других — всё очень непросто ☺.

Дело в том, что PDF файлы могут быть разными:

  1. в форме картинок : когда каждая страничка представляет из себя фото/картинку, т.е. текста там нет в принципе. Самый сложный вариант для работы, т.к. перевести это все в текст — это все равно что работать со сканированным листом (у кого есть сканер — тот поймет ☺). В этом случае целесообразно пользоваться спец. программами;
  2. в форме текста : в файле есть текст, который сжат в формат PDF и защищен (не защищен) от редактирования (с этим типом, как правило, работать легче). В этом случае сгодятся и онлайн-сервисы, и программы.

В статье рассмотрю несколько способов преобразования PDF в WORD. Думаю, что из них каждый для себя сможет найти самый подходящий, и выполнит сию задачу ☺.

Программами

Microsoft Word

В новых версиях Word (по крайней мере в 2016) есть специальный инструмент по преобразованию PDF файлов. Причем, от вас ничего ненужно — достаточно открыть какую-нибудь «пдф-ку» и согласиться на преобразование. Через пару минут — получите результат.

И, кстати, данная функция в Word работает весьма неплохо (причем, с любыми типами PDF файлов). Именно поэтому, рекомендую попробовать сей способ в первую очередь.

Как пользоваться : сначала откройте Word, затем нажмите «файл/открыть» и выберите нужный вам файл.

На вопрос о преобразование — просто согласитесь. Через некоторое время увидите свой файл в форме текста.

Плюсы : быстро; не нужно никаких телодвижений от пользователя; приемлемый результат.

Минусы : программа платная; часть форматирования документа может потеряться; далеко не все картинки будут перенесены; на процесс преобразования никак нельзя повлиять — всё идет в авто-режиме.

Примечание!

Вместо Word и Excel можно использовать другие бесплатные аналоги с похожим функционалом. О них я рассказывал в этой статье:

ABBY Fine Reader

Ограничения в пробной версии : 100 страниц для распознавания; софт работает в течении 30 дней после установки.

А вот эта программа одна из самых универсальных — ей можно «скормить» любой файл PDF, картинку, фото, скан. Работает она по следующему принципу: выделяются блоки текста, картинок, таблиц (есть авто-режим, а есть ручной), а затем распознает с этих блоков текст. На выходе вы получаете обычный документ Word.

Кстати, последние версии программы отличаются направленностью на начинающего пользователя — пользоваться программой очень просто. В первом приветственном окне выберите «Изображение или PDF-файл в Microsoft Word» (см. скрин ниже).

Fine Reader — популярные задачи, вынесенные в стартовое окно приветствия

Далее программа автоматически разобьет ваш документ по страничкам, и на каждой страничке сама выделит все блоки и распознает их. Вам останется подправить ошибки и сохранить документ в формат DOCX (кстати, Fine Reader может сохранить и в другие форматы: HTML, TXT, DOC, и пр.).

Fine Reader — распознавание текста и картинок в PDF файле

Плюсы : можно перевести любую картинку или PDF файл в текстовый формат; лучшие алгоритмы распознавания; есть опции для проверки распознанного текста; можно работать даже с самыми безнадежными файлами, от которых отказались все остальные сервисы и программы.

Минусы : программа платная; нужно вручную указывать блоки на каждой из страничек.

Readiris Pro

Ограничение пробной версии : 10 дней использования или обработка 100 страниц.

Эта программа некоторый конкурент Fine Reader. Она поможет сканировать документ с принтера (даже если у вас нет драйверов на него!), а потом распознать информацию со скана и сохранить ее в Word (в этой статье нас интересует вторая часть, а именно распознавание ☺).

Кстати, благодаря очень тесной интеграции с Word — программа способна распознать математические формулы, различные не стандартные символы, иероглифы и т.д.

Плюсы : распознавание разных языков (английский, русский и пр.); множество форматов для сохранения; неплохие алгоритмы; системные требования ниже, чем у других программ аналогов.

Минусы : платная; встречаются ошибки и необходима ручная обработка.

Free PDF to Word Converter

Сайт разработчика: http://www.free-pdf-to-word-converter.com/

Очень простая программа для быстрой конвертации файлов PDF в DOC. Программа полностью бесплатна, и при преобразовании — старается сохранить полностью исходное форматирование (чего многим аналогам так не хватает).

Несмотря на то, что в программе нет русского, разобраться со всем достаточно просто: в первом окне указываете PDF файлы (Select File — т.е. выбрать файлы); во втором — формат для сохранения (например, DOC); в третьем — папку, куда будут сохранены преобразованные документы (по умолчанию, используется «Мои документы»).

В общем-то, в целом хороший и удобный инструмент для преобразования относительно несложных файлов.

Онлайн-сервисами

Small PDF

Smallpdf.com — бесплатное решение всех PDF проблем

Отличный и бесплатный сервис для преобразования и работы с PDF файлами. Здесь есть все, что может пригодиться: сжатие, конвертирование между JPG, Word, PPT, объединение PDF, поворачивание, редактирование и пр.!

Преимущества:

  1. качественное и быстрое преобразование, редактирование;
  2. простой и удобный интерфейс: разберется даже совсем начинающий пользователь;
  3. доступно на всех платформах: Windows, Android, Linux и пр.;
  4. работа с сервисом бесплатна.
  1. не работает с некоторыми типами файлов PDF (там, где нужно проводить распознавание картинок).
Конвертер PDF

Стоимость: около 9$ в месяц

Этот сервис позволяет бесплатно обрабатывать только две странички (за остальное придется доплатить). Зато сервис позволяет конвертировать PDF файл в самые различные форматы: Word, Excel, Power Point, в картинки и т.д. Также у него используются отличные от аналогов алгоритмы (позволяют получить качество обработки файла на порядок выше, чем у аналогов). Собственно, благодаря этой функциональности и алгоритмам, я и добавил его в обзор.

Кстати, по первым двум страничкам сможете сделать вывод, стоит ли покупать подписку на сервис (стоимость около 9$ за месяц работы).

ZamZar

Многофункциональный онлайн-конвертер, работает с кучей форматов: MP4, MP3, PDF, DOC, MKV, WAV и многие другие. Несмотря на то, что сервис выглядит несколько странным, пользоваться им достаточно просто: т.к. все действия выполняются пошагово (см. на скрин выше: Шаг 1, 2, 3, 4 (Step 1, 2, 3, 4)).

  1. Step 1 (ШАГ 1) — выбор файла.
  2. Step 2 (ШАГ 2) — в какой формат конвертировать.
  3. Step 3 (ШАГ 3) — необходимо указать свою почту (кстати, возможно вам будет статья о том, ).
  4. Step 4 (ШАГ 4) — кнопка для запуска конвертирования.

Особенности:

  1. куча форматов для конверта из одного в другой (в том числе PDF);
  2. возможность пакетной обработки;
  3. очень быстрый алгоритм;
  4. сервис бесплатный;
  5. есть ограничение на размер файла — не более 50 МБ;
  6. результат конверта приходит на почту.
Convertio

Мощный и бесплатный сервис по онлайн-работе с различными форматами. Что касается PDF — то сервис может конвертировать их в DOC формат (кстати, сервис работает даже со сложными «пдф-ками», с которыми остальные не смогли справиться), сжимать, объединять и пр.

Ограничений на размер файлов и их структуру — не выявлено. Для добавления файла необязательно даже иметь его на диске — достаточно указать URL адрес, а с сервиса уже скачать готовый документ в формате DOC. Очень удобно, рекомендую!

iLOVEPDF

Похожий на предыдущий сайт: также есть весь функционал для работы с PDF — сжатие, объединение, разбивка, конвертация (в различные форматы). Позволяет быстро преобразовать различные небольшие PDF файлы.

Из минусов : сервис не может обработать файлы, которые состоят из картинок (т.е. «пдф-ки» где нет текста, здесь вы с них ничего не вытащите — сервис вернет вам ошибку, что текста в файле нет).

PDF.io

Весьма интересный и многофункциональный онлайн-сервис. Позволяет конвертировать PDF в: Excel, Word, JPG, HTML, PNG (и те же самые операции в обратном направлении). Кроме этого, на этом сервисе можно сжимать файлы подобного типа, объединять и разделять страницы. В общем-то, удобный помощник в офисной работе ☺.

Из минусов : сервис справляется не с всеми типами файлов (в частности, про некоторые пишет, что в них нет текста).

Дополнения приветствуются.

Довольно часто используется для публикации разного рода электронных документов. В PDF публикуются научные работы, рефераты, книги, журналы и многое другие.

Сталкиваясь с документом в PDF формате, пользователи часто не знают, как скопировать текст в Ворд. Если у вас также возникла подобная проблема, то наша статья должна вам помочь. Здесь вы узнаете 4 способа, как скопировать текст из PDF в Ворд.

Самый простой способ скопировать текст из PDF в Ворд это обычное копирование, которым вы пользуетесь постоянно. Откройте ваш PDF файл в любой программе для просмотра PDF файлов (например, можно использовать Adobe Reader), выделите нужную часть текста, кликните по ней правой кнопкой мышки и выберите пункт «Копировать».

Также вы можете скопировать текст с помощью комбинации клавиш CTRL-C. После копирования текст можно вставить в Ворд или любой другой текстовый редактор.

К сожалению, данный способ копирования текста далеко не всегда подходит. от копирования, тогда вам не удастся выполнить копирование текста. Также в PDF документе могут быть таблицы или картинки, которые нельзя просто так скопировать. Если вы столкнулись с подобной проблемой, то следующие способы копирования текста из ПДФ должны вам помочь.

Копируем текст из PDF файла в Word с помощью ABBYY FineReader

ABBYY FineReader это программа для распознавания текста. Обычно данную программу используют для распознавания текста на отсканированных изображениях. Но, с помощью ABBYY FineReader можно распознавать и PDF файлы. Для этого откройте ABBYY FineReader, нажмите на кнопку «Открыть» и выберите нужный вам PDF файл.

После того как программа закончит распознавание текста нажмите на кнопку «Передать в Word».

После этого перед вами должен открыться документ Ворд с текстом из вашего PDF файла.

Копируем текст из PDF файла в Word c помощью конвертера

Если у вас нет возможности воспользоваться программой ABBYY FineReader, то можно прибегнуть к программам-конвертерам. Такие программы позволят конвертировать PDF документ в Word файл. Например, можно использовать бесплатную программу .

Для того чтобы сконвертировать PDF документ в Word файл с помощью UniPDF вам нужно просто открыть программу, добавить в нее нужный PDF файл, выбрать конвертацию в Word и нажать на кнопку «Convert».

Копируем текст из PDF файла в Word с помощью онлайн конвертеров

Также существуют онлайн конвертеры, которые позволяют сконвертировать PDF файл в Word файл. Обычно такие онлайн конвертеры работают хуже, чем специализированные программы, но они позволят скопировать текст из PDF в Ворд без установки дополнительного софта. Поэтому их также нужно упомянуть.

Использовать такие конвертеры довольно просто. Все что вам нужно сделать, это загрузить файл и нажать на кнопку «Конвертировать». А после завершения конвертации нужно будет скачать файл обратно.

При печати pdf файла на принтере печатаются иероглифы или как говорили мои бухгалтера на старой работе «Виталий подойди у нас при печати pdf абракадабра распечатывается «. Сегодня на работе возникла такая же фигня и т.к. я стараюсь в своем блоге описывать по максимуму решения таких проблем и решил выложить инструкцию по исправлению иероглифов в pdf файлах. Так вот эту проблему можно решить тремя способами(может есть и еще но я опишу те какие знаю ).

1 Способ

Это самый надежный и проверенный временем способ!!

  1. Открыть редактор реестра (Пуск -> Выполнить -> regedit.exe)
  2. Перейти в
    HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindows NTCurrentVersionFontSubstitutes
  3. Удалить параметры: «Courier,0»=»Courier New,204″
    «Arial,0»=»Arial,204″
  4. Перезагрузить ПК

PS перезагрузить комп нужно обязательно.

2 Способ

Самый долгий наверное из всех трех способ, это скачать русифицированную версию самого adobe reader:

  • Скачать последнюю версию adobe reader с официального сайта http://get.adobe.com/ru/reader/
  • После этого открываем фаил и радуемся жизни

2 Способ

Так вот первый способ самый быстрый но и самый не качественный в плане разрешения распечатывающегося документа:

  • При печати документа зайдите в дополнительно и выберите печать как изображения (File — print -advanced — галочка print as image)

4 Способ

Этот способ самый действенный и кардинальный т.к. решение данного косяка будет осуществлен на уровне реестра windows:

PDF Квадраты и символы при копировании

Как-то раз мне на стол принесли PDF-файл с просьбой скопировать содержимое текста, мол сами не могут т.к. при копировании текст превращается в квадраты, крякозяблы и странные символы. «Кодировка, защита или недостающие шрифты», подумал я, это ж легко. Однако пережимы pdf, снятие защиты через онлайн сервисы и прочие простые решения не помогли. При копировании со всех созданных вариантов данного pdf имеем такую картину:

p, blockquote 1,0,1,0,0 —>

Поиски решения

Открываем PDF в программе Acrobat reader, скачать его можно по ссылке идем в редактирование — защита — параметры защиты. Самой защиты на моем PDF не оказалось, однако на вкладке Шрифты указаны отсутствующие у меня на компе шрифты с заказной кодировкой. Скорее всего дело в этом, можно погуглив найти и установить недостающий шрифт, однако в моем случае такое решение не прокатит. Шрифт MSTT31c, кодировка — заказная.

p, blockquote 2,0,0,0,0 —>

Быстрое решение

Дабы особо не ломать голову, выбираем самое простое решение. Мы попросту разобьем данный PDF на JPEG файлы и заново пересоберем, используя Pdf 24 Creator или его аналоги. (см. Конвертация PDF в JPEG и обратно).

p, blockquote 3,1,0,0,0 —>

Открываем программу — тыкаем Pdf конструктор, ищем наш файл и перетаскиваем в правую часть окна и тыкаем сохранить. В появившемся окне жмем «Настраиваемый» и выбираем Jpeg. DPI оставляйте как есть и жмите продолжить. Вам предложат путь куда вы сохраните весь ваш файл в виде изображений.

Не закрывая программу идем в папку куда сохранили изображения и перетаскиваем их на правую часть. Сохраняем как PDF, получаем слепленный из изображений файл, с которого пока что нельзя копировать ничего. Осталось чуть-чуть.

p, blockquote 5,0,0,0,0 —>

Снова открываем программу, на этот раз жмем Recognize text, выбираем язык документа, желаемое качество, жмем Add files и выбираем созданный на прошлом шаге файл. И всё, жмем Start, по завершению из нашего PDF можно с легкостью копировать текст. Надеюсь помог =)

Кракозябры (иероглифы) при копировании с PDF документа

Я не уверен, что следующие советы помогут для всех решить проблему, но частичное решение ее все же возможно.

Давайте сразу отбросим отсканированые и нераспознанные PDF документы, из которых просто невозможно скопировать текст. Это равносильно попытке копирования текста из обычной фотографии, сделанной на ваш смартфон. В таком случае текст нужно распознать специальной программой, вроде ABBYY FineReader.

Наша книга (тестовая) полностью поддерживает копирование текста и изображений. Но при попытке перенести такой текст в Microsoft Office Word, можно видеть такие нечитабельные символы как на скриншоте сверху статьи.

Способ 1 (длинный).

Чтобы узнать какие именно нужно инсталлировать на компьютер шрифты, нужно открыть наш PDF документ поддерживаемой программой (на примере PDF-XChange Viewer ). Далее идем в «Файл» → «Свойства документа» (можно нажать сочетание клавиш Ctrl + D).

Далее копируем и вставляем текст из PDF документа, выделяем его в Microsoft Office Word (или в другом офисном редакторе, который у вас установлен) и выбираем из списка недавно установленный шрифт. Все должно быть нормально. Снизу на скриншоте видно, что я намеренно применил нужный шрифт только на одно предложение, другую часть текста прочитать невозможно.

Способ 2 (быстро и удобно).

Способ 3 (онлайн).

Кто не хочет использовать программу Shtirlitz или она не работает, может использовать следующие онлайн сервисы для перекодирования (отдельные сервисы имеют ограничения по объему текста).

Обратите внимание, что кодирование нашей тестовой книги windows-1252. Для нас нужна кодировка windows-1251. Поэтому переходим на сервис online-decoder.com.

Там можно видеть окно, где написано «Скопируйте сюда текст». Вставляем наш непонятный текст и нажимаем на кнопку «Подбор». Такой способ будет правильно использовать если вам неизвестна система кодирования. Декодер попытается подобрать ее автоматически. Если вы знаете исходное кодирование своей кракозябры, то можете смело нажимать кнопку «Точно», указав перед этим кодирование, напротив текста «Я знаю нужные кодировки».

Второй сервис «artlebedev.ru». Есть два способа для декодирования: «Просто» и «Сложно». Первый вариант работает на автомате. Второй – дает возможность, при необходимости, указать исходное и конечное кодирование.

Третий онлайн сервис для декодирования текста «2cyr.com» имеет отличие от предыдущих в том, что позволяет выбирать язык. Кроме русского, доступен также и украинский язык интерфейса (и надеюсь, что кодирования также, просто не было возможности проверить).

Все три сервиса отлично работали на моей тестовой книге в формате PDF с кракозябрами.

Способ 4 (с помощью макросов для Microsoft Office Word ).

Еще один вариант для программы Microsoft Office Word. Никаких шрифтов ставить не нужно. Создаем макрос со следующим кодом:

Код 1: «Перекодирование 1252 в 1251»

Sub Corr1252_1251() Dim s$, i&, j& s = Selection For i = 1 To Len(s) j = AscW(Mid$(s, i, 1)) If j

Код 2: «Перекодирование 1252 в 1251 (с учетом русской буквы Ё)»

‘ Замена Ё и ё Selection.Find.ClearFormatting Selection.Find.Replacement.ClearFormatting With Selection.Find .Text = ChrW(168) .Replacement.Text = «Ё» .Forward = True .Wrap = wdFindContinue End With Selection.Find.Execute Replace:=wdReplaceAll Selection.Find.ClearFormatting Selection.Find.Replacement.ClearFormatting With Selection.Find .Text = ChrW(184) .Replacement.Text = «ё» .Forward = True .Wrap = wdFindContinue End With Selection.Find.Execute Replace:=wdReplaceAll End Sub

Выделяем вставленный текст с иероглифами. Тогда запускаем макрос на выполнение и получаем нормальный текст, который можно спокойно редактировать, изменять шрифты и т.д.

Для добавления готового макроса в Word делаем следующее:

Открываем редактор и переходим в «Вид».

Там находим кнопку «Макросы» и нажимаем на нее.

Даем для макроса имя (любое, оно будет автоматически изменено при полном копировании кода выше).

Откроется окно в котором можно заметить название нашего макроса. При желании можете оставить свое имя. Но лучше, чтобы не было ошибок, полностью заменить весь код на готовый (код смотрите сверху).

Как видно, макрос начинается так:

Sub названиемакроса() дальше идет код макроса End Sub

Название макроса может любым, но не цифры и не должно быть пробелов. Может быть так: декодирование_кракозябр_с_ё. Но не может быть так: декодирование кракозябр с ё.

То есть, для нас нужно заменить для нашего созданного пустого макроса весь текст с кодом, который показан выше.

После того как заменили, нужно закрыть окно редактирования макросов (можно нажать на иконку сохранения, хотя изменения сохраняются автоматически). Далее выделяем наш иероглифический текст, открываем макросы, выбираем из списка (если их у вас несколько) нужный и нажимаем на кнопку «Выполнить».

Ваш текст должен стать читабельным.

Источник макросов для Microsoft Office Word: https://wordexpert.ru

Как ни крути, но это не полное решение ситуации. Поиск после данных действий в самом PDF документе работать не будет. Проблема остается. Кто может подсказать ее решение, просьба писать в комментариях.

Источник

Ворд не читает документ кодировка

Ввиду того, что текстовый редактор «Майкрософт Ворд» является самым популярным на рынке, именно форматы документов, которые присущи ему, можно чаще всего встретить в сети. Они могут отличаться лишь версиями (DOCX или DOC). Но даже с этими форматами программа может быть несовместима или же совместима не полностью.

Случаи некорректного отображения текста

Конечно, когда в программе наотрез отказываются открываться, казалось бы, родные форматы, это поправить очень сложно, а то и практически невозможно. Но, бывают случаи, когда они открываются, а их содержимое невозможно прочесть. Речь сейчас идет о тех случаях, когда вместо текста, кстати, с сохраненной структурой, вставлены какие-то закорючки, «перевести» которые невозможно.

Эти случаи чаще всего связаны лишь с одним – с неверной кодировкой текста. Точнее, конечно, будет сказать, что кодировка не неверная, а просто другая. Не воспринимающаяся программой.

Интересно еще то, что общего стандарта для кодировки нет. То есть, она может разниться в зависимости от региона.

Так, создав файл, например, в Азии, скорее всего, открыв его в России, вы не сможете его прочитать.

В этой статье речь пойдет непосредственно о том, как поменять кодировку в Word. Кстати, это пригодится не только лишь для исправления вышеописанных «неисправностей», но и, наоборот, для намеренного неправильного кодирования документа.

Определение

Перед рассказом о том, как поменять кодировку в Word, стоит дать определение этому понятию. Сейчас мы попробуем это сделать простым языком, чтобы даже далекий от этой тематики человек все понял.

Зайдем издалека. В «вордовском» файле содержится не текст, как многими принято считать, а лишь набор чисел. Именно они преобразовываются во всем понятные символы программой. Именно для этих целей применяется кодировка.

Кодировка – схема нумерации, числовое значение в которой соответствует конкретному символу. К слову, кодировка может в себя вмещать не только лишь цифровой набор, но и буквы, и специальные знаки. А ввиду того, что в каждом языке используются разные символы, то и кодировка в разных странах отличается.

Как поменять кодировку в Word. Способ первый

После того, как этому явлению было дано определение, можно переходить непосредственно к тому, как поменять кодировку в Word. Первый способ можно осуществить при открытии файла в программе.

В том случае, когда в открывшемся файле вы наблюдаете набор непонятных символов, это означает, что программа неверно определила кодировку текста и, соответственно, не способна его декодировать. Все, что нужно сделать для корректного отображения каждого символа, – это указать подходящую кодировку для отображения текста.

Говоря о том, как поменять кодировку в Word при открытии файла, вам необходимо сделать следующее:

  1. Нажать на вкладку «Файл» (в ранних версиях это кнопка «MS Office»).
  2. Перейти в категорию «Параметры».
  3. Нажать по пункту «Дополнительно».
  4. В открывшемся меню пролистать окно до пункта «Общие».
  5. Поставить о.
  6. Нажать»ОК».

Итак, полдела сделано. Скоро вы узнаете, как поменять кодировку текста в Word. Теперь, когда вы будете открывать файлы в программе «Ворд», будет появляться окно. В нем вы сможете поменять кодировку открывающегося текста.

Выполните следующие действия:

  1. Откройте двойным кликом файл, который необходимо перекодировать.
  2. Кликните по пункту «Кодированный текст», что находится в разделе «Преобразование файла».
  3. В появившемся окне установите переключатель на пункт «Другая».
  4. В выпадающем списке, что расположен рядом, определите нужную кодировку.
  5. Нажмите «ОК».

Если вы выбрали верную кодировку, то после всего проделанного откроется документ с понятным для восприятия языком. В момент, когда вы выбираете кодировку, вы можете посмотреть, как будет выглядеть будущий файл, в окне «Образец». Кстати, если вы думаете, как поменять кодировку в Word на MAC, для этого нужно выбрать из выпадающего списка соответствующий пункт.

Способ второй: во время сохранения документа

Суть второго способа довольно проста: открыть файл с некорректной кодировкой и сохранить его в подходящей. Делается это следующим образом:

  1. Нажмите «Файл».
  2. Выберите «Сохранить как».
  3. В выпадающем списке, что находится в разделе «Тип файла», выберите «Обычный текст».
  4. Кликните по «Сохранить».
  5. В окне преобразования файла выберите предпочитаемую кодировку и нажмите «ОК».

Теперь вы знаете два способа, как можно поменять кодировку текста в Word. Надеемся, что эта статья помогла вам в решении вопроса.

MS Word заслужено является самым популярным текстовым редактором. Следовательно, чаще всего можно столкнуться с документами в формате именно этой программы. Все, что может в них отличаться, это лишь версия Ворда и формат файла (DOC или DOCX). Однако, не смотря на общность, с открытием некоторых документов могут возникнуть проблемы.

Источник: https://planshet-info.ru/kompjutery/vord-ne-chitaet-dokument-kodirovka

Что делать, если вместо текста иероглифы (в Word, браузере или текстовом документе)

Наверное, каждый пользователь ПК сталкивался с подобной проблемой: открываешь интернет-страничку или документ Microsoft Word — а вместо текста видишь иероглифы (различные «крякозабры», незнакомые буквы, цифры и т.д. (как на картинке слева…)).

Хорошо, если вам этот документ (с иероглифами) не особо важен, а если нужно обязательно его прочитать?! Довольно часто подобные вопросы и просьбы помочь с открытием подобных текстов задают и мне. В этой небольшой статье я хочу рассмотреть самые популярные причины появления иероглифов (разумеется, и устранить их).

Иероглифы в текстовых файлах (.txt)

Кодировка — это набор символов, необходимый для того, чтобы полностью обеспечить написание текста на определенном алфавите (в том числе цифры и специальные знаки). Более подробно об этом здесь: https://ru.wikipedia.org/wiki/Набор_символов

Чаще всего происходит одна вещь: документ открывается просто не в той кодировке из-за чего происходит путаница, и вместо кода одних символов, будут вызваны другие. На экране появляются различные непонятные символы (см. рис. 1)…

Рис. 1. Блокнот — проблема с кодировкой

Как с этим бороться?

На мой взгляд лучший вариант — это установить продвинутый блокнот, например Notepad++ или Bred 3. Рассмотрим более подробно каждую из них.

Notepad++

Один из лучших блокнотов как для начинающих пользователей, так и для профессионалов. Плюсы: бесплатная программа, поддерживает русский язык, работает очень быстро, подсветка кода, открытие всех распространенных форматов файлов, огромное количество опций позволяют подстроить ее под себя.

В плане кодировок здесь вообще полный порядок: есть отдельный раздел «Кодировки» (см. рис. 2). Просто попробуйте сменить ANSI на UTF-8 (например).

Рис. 2. Смена кодировки в Notepad++

После смены кодировки мой текстовый документ стал нормальным и читаемым — иероглифы пропали (см. рис. 3)!

Рис. 3. Текст стал читаемый… Notepad++

Bred 3

Еще одна замечательная программа, призванная полностью заменить стандартный блокнот в Windows. Она так же «легко» работает со множеством кодировок, легко их меняет, поддерживает огромное число форматов файлов, поддерживает новые ОС Windows (8, 10).

Кстати, Bred 3 очень помогает при работе со «старыми» файлами, сохраненных в MS DOS форматах. Когда другие программы показывают только иероглифы — Bred 3 легко их открывает и позволяет спокойно работать с ними (см. рис. 4).

Если вместо текста иероглифы в Microsoft Word

Самое первое, на что нужно обратить внимание — это на формат файла. Дело в том, что начиная с Word 2007 появился новый формат — « docx » (раньше был просто « doc «). Обычно, в «старом» Word нельзя открыть новые форматы файлов, но случается иногда так, что эти «новые» файлы открываются в старой программе.

Просто откройте свойства файла, а затем посмотрите вкладку « Подробно » (как на рис. 5). Так вы узнаете формат файла (на рис. 5 — формат файла «txt»).

Если формат файла docx — а у вас старый Word (ниже 2007 версии) — то просто обновите Word до 2007 или выше (2010, 2013, 2016).

Рис. 5. Свойства файла

Далее при открытии файла обратите внимание (по умолчанию данная опция всегда включена, если у вас, конечно, не «не пойми какая сборка») — Word вас переспросит: в какой кодировке открыть файл (это сообщение появляется при любом «намеке» на проблемы при открытии файла, см. рис. 5).

Рис. 6. Word — преобразование файла

Чаще всего Word определяет сам автоматически нужную кодировку, но не всегда текст получается читаемым. Вам нужно установить ползунок на нужную кодировку, когда текст станет читаемым. Иногда, приходится буквально угадывать, в как был сохранен файл, чтобы его прочитать.

Рис. 7. Word — файл в норме (кодировка выбрана верно)!

Смена кодировки в браузере

Когда браузер ошибочно определяет кодировку интернет-странички — вы увидите точно такие же иероглифы (см. рис 8).

Рис. 8. браузер определил неверно кодировку

Чтобы исправить отображение сайта: измените кодировку. Делается это в настройках браузера:

Таким образом в этой статье были разобраны самые частые случаи появления иероглифов, связанных с неправильно определенной кодировкой. При помощи выше приведенных способов — можно решить все основные проблемы с неверной кодировкой.

Буду благодарен за дополнения по теме. Good Luck

Цитата
Сообщение от Raptor279
Посмотреть сообщение

Пдф создан в Мак Ос, из-за этого не могу скопировать текст.

Очень странно, но мак тоже не понимает эти символы. И проблема тут точно не в кодировке. Скорее проблема в программе, которая при создании PDF забыла включить туда символы. Под словами так вообще символов нет, только пробелы.

Цитата
Сообщение от antal10
Посмотреть сообщение

1. Очень просто. Достаточно зайти в свойства документа и посмотреть, что файл был создан с помощью Mac OS X 10.6.7 Quartz PDFContext возможно там и кодировка маковская, а может он и зашифрован, там есть такое. Проверить не могу.

Не совсем, в том файле такая же проблема. И мак его точно также не читает. Даже больше скажу, если бы проблема была с кодировкой (которая может отличаться, не спорю), выглядело бы это так:

Положительный полюс

Или даже так:

╧юыюцшЄхы№э√щ яюы■ё эряЁ*цхэш

Тут проблема уж точно не в ней, у вашем файле просто набор несвязных символов. Скорее всего, при создании PDF криво вписали параметры. Символы должны быть одинаковыми для любой системы, PDF это картинки с возможностью пихать под них символы. Так что подозрение падает именно на создавших эти файлы.

И да, FineReader это действительно лучший софт для распознавания. Всякие бесплатные и так далее не дадут сравнимого по качеству результата.

I have this exact same problem.  It is very frustrating.  How is it not possible to «grab» onto the text in the pdf ??!!

  • I am looking at it.  I can see it.  I can read it.
  • I can highlight the individual letters and words with the mouse pointer. (So it’s not just a «picture»)
  • With a pdf editor, I can even make the text bold, italic, or increase the font size.

SO WHY CAN’T I COPY THE TEXT!   AAARGH!

No, the file is not protected.

Yes, I have tried saving as different formats.  (The «save as tiff file workaround» idea is  very time consuming and greatly degrades the quallity.)

The font is shown as being: «Arial083.313»

Something in the pdf program is recognizing the text, translating the 1’s and 0’s (that make up all computer files) into the letters that display on the screen that I can read and select with the mouse. So why can’t that same «something» allow me to copy it?  So frustrating.

Somebody please help.  If you can solve this problem you are awesome.

Копирование текстового содержимого из PDF в Word с ошибкой шрифта — распространенная ошибка, с которой, возможно, сталкивался любой, кто работает в офисе. В следующей статье показаны некоторые способы исправить ошибки шрифтов при копировании из PDF в Word.

Вы заметили, что в вашем тексте есть несколько неправильных символов, заменяющих многие слова, одно и то же слово в тексте может быть знаком? или, может быть, персонаж, которого нет на клавиатуре. При этой ошибке вам нужно использовать функцию замены только для тех же неправильных символов:

Изображение 1: Как исправить ошибки шрифтов при копировании из PDF в Word

Нажмите Ctrl + H, чтобы исправить те же ошибки:

— В разделе «Найти»: введите слово с ошибкой.

— В разделе «Заменить на»: введите правильное написание, чтобы заменить неправильное написание.

Наконец, нажмите «Заменить все», чтобы заменить исправление ошибок:

Изображение 2: Как исправить ошибки шрифтов при копировании из PDF в Word

Результаты диалогового окна сообщают общее количество исправлений, а затем нажмите OK:

Изображение 3: Как исправить ошибки шрифтов при копировании из PDF в Word

Итак, вы закончили редактировать свой текст. Однако при замене правильного письменного содержания оно заменяется, поэтому вам следует обратить на него внимание. Вы можете нажать «Заменить далее», чтобы убедиться, что персонаж нуждается в замене.

Изображение 4: Как исправить ошибки шрифтов при копировании из PDF в Word

2. Ошибка шрифта при копировании из PDF в Word.

Если в копии появляется ошибка некоторых нестандартных слов, проверьте, какой шрифт подходит. Например, под исходным шрифтом .VnTime, однако, устанавливается шрифт Time New Roman:

Изображение 5: Как исправить ошибки шрифтов при копировании из PDF в Word

При этой ошибке вам нужно только выделить весь текст, а затем выбрать шрифт, чтобы исправить ошибку:

Изображение 6: Как исправить ошибки шрифтов при копировании из PDF в Word

3. В случае ошибки шрифта при копировании из PDF в Word из-за неправильной кодировки.

Когда вы видите, что в вашем тексте есть ошибка шрифта и на картинке появляются специальные символы, немедленно подумайте о преобразовании кодировки в текст:

Изображение 7 из Как исправить ошибки шрифтов при копировании из PDF в Word

Сделайте копию всего текста, который нужно исправить -> щелкните правой кнопкой мыши значок Unikey в нижнем углу экрана, выберите Инструменты или нажмите Ctrl + Shift + F6:

Изображение 8: Как исправить ошибки шрифтов при копировании из PDF в Word

Появится диалоговое окно с такими параметрами кодировки, как следующие:

  1. Источник: выберите кодировку TCVN3 (ABC)
  2. Место назначения: выберите Юникод

Щелкните Транскодировать:

Изображение 9 из Как исправить ошибки шрифтов при копировании из PDF в Word

В диалоговом окне сообщения об успешном выполнении нажмите ОК. Вернемся к его писательской пасте, вставившей поверх старого содержимого ошибка шрифта содержимого:

Изображение 10: Как исправить ошибки шрифтов при копировании из PDF в Word

Однако вам необходимо определить, из какой исходной кодировки текста выбрать в исходной кодировке и месте назначения соответственно.

4. В случае ошибки шрифта при копировании из PDF в Word ошибка целиком и невозможно перевести ни одного слова.

В этом случае вам следует использовать дополнительное программное обеспечение, которое поддерживает преобразование ABBY для преобразования из PDF в Word, чтобы минимизировать ошибки шрифтов:

Изображение 11: Как исправить ошибки шрифтов при копировании из PDF в Word

Выше приведены некоторые рекомендации по устранению ошибки шрифта при преобразовании из формата PDF в формат Word. Удачи!

Like this post? Please share to your friends:
  • Что делать если прекращена работа программы microsoft word
  • Что делать если поврежден файл word
  • Что делать если поврежден документ word
  • Что делать если не сохранила документ word как восстановить документ
  • Что делать если пишет word нелицензированный продукт