Word Tabulator: программа для переводчика (извлечение терминологии). Быстрая и простая программа, однако из-за отсутствия возможности установки «черного списка» терминов, выдает большое количество предлогов, артиклей и общих слов, таким образом, время и усилия, необходимые на редактуру увеличиваются. Поддерживается русский язык, а также присутствует подробная справка на русском языке.
Сайт разработчика: http://www.rvb.ru
Условия распространения: Бесплатно.
Ссылка на скачивание: Word Tabulator 2.2.3 (обязательно проверьте наличие новой версии на сайте разработчика)
Теги: word tabulator | извлечение терминологии | программа для переводчика
Рекламные ссылки:
Скриншот программы:
Детали программы:
Версия: 3.5
Дата загрузки: 15 Apr 15
Тип распространения: Бесплатная
Популярность: 343
Размер: 2708 Kb
- Currently 2.00/5
- 1
- 2
- 3
- 4
- 5
Rating: 2.0/5 (Total Votes: 1)
Рекламные ссылки:
WordTabulator предназначен для анализа текста. С помощью wordTabulator вы можете создать индекс элементов слов, извлеченных из определенного набора текста. Элементы слово может быть слова, N-грамм (с определенным размером) или фразы (syntagmes). Программа может обрабатывать тексты, как в обычных 2-байт, кодирующих (ANSI), а в многобайтового кодирования UTF-8. Исходные тексты определяются как набор плоских текстовых файлов или HTML / XML / SGML документов. В последнем случае программа может фильтровать контент из разметки. Кроме того, вы можете обрабатывать только определенный контент в отдельных парных тегов. Или вы можете пропустить этот содержание из обработки. Она включает в себя морфологический модуль для российских, трех различных форматах индекса выхода, три различных типов элементов (слов словами, N-грамм и фраз), браузер контексте, и истинной алфавитного порядка.
15 Apr 15
Поддерживаемые операционные системы
Другие программы разработчика Sergey Logichev
Комментарии к WordTabulator
Популярные программы
Это приложение для Windows под названием wordTabulator, последнюю версию которого можно загрузить как wtwin-unicon-setup-3.6.exe. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн это приложение под названием wordTabulator с OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
— 1. Загрузил это приложение на свой компьютер.
— 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
— 3. Загрузите это приложение в такой файловый менеджер.
— 4. Запустите любой онлайн-эмулятор OS OnWorks с этого сайта, но лучше онлайн-эмулятор Windows.
— 5. В только что запущенной ОС Windows OnWorks перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
— 6. Скачайте приложение и установите его.
— 7. Загрузите Wine из репозиториев программного обеспечения вашего дистрибутива Linux. После установки вы можете дважды щелкнуть приложение, чтобы запустить его с помощью Wine. Вы также можете попробовать PlayOnLinux, необычный интерфейс поверх Wine, который поможет вам установить популярные программы и игры для Windows.
Wine — это способ запустить программное обеспечение Windows в Linux, но без Windows. Wine — это уровень совместимости с Windows с открытым исходным кодом, который может запускать программы Windows непосредственно на любом рабочем столе Linux. По сути, Wine пытается заново реализовать Windows с нуля, чтобы можно было запускать все эти Windows-приложения, фактически не нуждаясь в Windows.
СКРИНШОТЫ
словоТабулятор
ОПИСАНИЕ
Программа wordTabulator предназначена для анализа текста. Он может генерировать индекс элементов слова, извлеченных из определенного набора текстов. Элементами слова могут быть слова, N-граммы или фразы (синтагмы). Программа может обрабатывать тексты как в обычной 1-байтовой кодировке (ANSI), так и в многобайтовой кодировке UTF-8.
Особенности
- Кодировки ANSI и UTF-8
- NCR-коды, сущности с именами в формате HTML. многоязычные тексты
- поиск по регулярным выражениям
- набор операций над исходными текстами: вычитание, пересечение и объединение
- модуль морфологии для русского языка
- разные форматы выходного индекса; истинный алфавитный порядок
Аудитория
Наука / Исследования, Конечные пользователи / Рабочий стол
Интерфейс пользователя
Win32 (МС Windows)
Язык программирования
C
Категории
Текстовая обработка, Лингвистика
Это приложение также можно загрузить с https://sourceforge.net/projects/wordtabulator/. Он был размещен в OnWorks, чтобы его можно было легко запускать в Интернете с помощью одной из наших бесплатных операционных систем.
Скачать приложения для Windows и Linux
>>
- Приложения для Linux
- Приложения для Windows
-
1
- Тема WooCommerce Nextjs React
- Тема React WooCommerce, созданная с помощью
Далее JS, Webpack, Babel, Node и
Экспресс, используя GraphQL и Apollo
Клиент. Магазин WooCommerce в React (
содержит: продукты… - Скачать тему WooCommerce Nextjs React
-
2
- archlabs_repo
- Репозиторий пакетов для ArchLabs Это
приложение, которое также можно получить
от
https://sourceforge.net/projects/archlabs-repo/.
Он был размещен на OnWorks в… - Скачать archlabs_repo
-
3
- libportable
- Библиотека программного обеспечения, написанного на C с
полный исходный код, динамическая ссылка
Portable {arch} .dll, сделать Firefox переносимым
для окон.. Особенности:портативный
модусиление… - Скачать libportable
-
4
- Зефир Проект
- Проект Zephyr — новое поколение
операционная система реального времени (RTOS), которая
поддерживает несколько аппаратных средств
архитектуры. Он основан на
компактное ядро … - Скачать проект Зефир
-
5
- SCons
- SCons — инструмент для создания программного обеспечения
это лучшая альтернатива
классический инструмент сборки «Make»,
мы все знаем и любим. SCons — это
реализовал … - Скачать SCons
-
6
- PSInt
- PSeInt — интерпретатор псевдокода для
испаноязычные студенты-программисты.
Его основная цель — быть инструментом для
изучение и понимание основных
концепция … - Скачать PSInt
-
7
- oStorybook
- oСборник рассказов l’outil privil�gi� des
�crivains. ВНИМАНИЕ : voir sur
http://ostorybook.tuxfamily.org/v5/
—en_RU oStorybook правильный инструмент для
писатели. ВНИМАНИЕ… - Скачать oStorybook
- Больше »
Команды Linux
-
1
- a+
- Используйте + онлайн с помощью onworks.net
Сервисы. … - Запустить +
-
2
- a2crd
- a2crd — пытается преобразовать
файл лирики в аккорды ввода … - Запустить a2crd
-
3
- coqtop.opt
- coqtop.opt — собственный код Coq
высший уровень … - Запустите coqtop.opt
-
4
- coqwc
- coqwc — вывести количество
строки спецификации, доказательства и комментариев
в файлах Coq… - Запустить coqwc
-
5
- g2root
- g2root — конвертировать файлы геометрии GEANT в
КОРНЕВЫЕ файлы… - Запустите g2root
-
6
- g3cat
- g3cat — объединить несколько g3
документы … - Запустите g3cat
- Больше »
Необыкновенно полезная программа, предназначенная для извлечения терминологии. Она хоть и разработана под WIndows, тем не менее, замечательно работает в WINE, прекрасно справляясь со своей задачей. В качестве форматов исходных файлов использует txt и html.
Программа очень проста и понятна.
В результате работы программы в отдельном окне создается таблица извлеченных терминов и число их повторений. На основе этой таблицы можно составить глоссарий.
Радует удобство интерфейса и скорость работы программы. Скачать и узнать более подробные сведения о программе можно здесь.
Примеры работы с Word. Tabulator
EX-1. Особенности расчета частоты при пересечении множеств
Дано: тексты из папок …texts Dialog-2010_1 -50_txt и …texts Dialog-2010_51 -93_txt Задача: сравнить результаты пересечения [1 -50] ∩ [51 -93] и [51 -93] ∩ [1 -51].
Ход решения. 1. 1. Создаем и наполняем папки сравниваемых подмножеств Папка 1 -50 содержит ссылки на файлы из …texts Dialog-2010_1 -50_txt Папка 51 -93 содержит ссылки на файлы из …texts Dialog-2010_51 -93_txt
1. 2. Определяем настройки для создания упорядоченного по убыванию частоты ЧС общих словоформ [1 -50] ∩ [51 -93].
1. 3. Сохранив настройки, запускаем программу и получаем ЧС общих словоформ [1 -50] ∩ [51 -93]. ———2. 1. Меняем местами папки 1 -50 и 51 -93 (перетаскиваем мышкой в главном окне Word. Tabulator). 2. 2. Меняем имя результата и запускаем программу и получаем ЧС общих словоформ [51 -93] ∩ [1 -51]. [1 -50] ∩ [51 -93] Сравнение результатов покажет, что входы словарей идентичны, а частоты – не совпадают (см. первые 10 входов обоих словарей). [51 -93 ∩ [1 -50] ] Причина: при операции пересечения частота дается по множеству входных текстов. 1. 5935 в 1. 5594 в 2. 4742 и 2. 3911 и 3. 1934 с 3. 1699 с 4. 1682 на 4. 1560 на 5. 1388 не 5. 1368 the 6. 1324 а ! 6. 1310 не 7. 1186 для 7. 1205 а 8. 1141 что 8. 1002 для 9. 914 как 9. 916 что 10. 792 по 10. 801 of … …
EX-2. Примеры поисковых шаблонов
А. Шаблон для ЧС предлогов с, в, для, от, при. !Тип элемента: слово. Пример результата: # част. Элемент 1. 5594 в 2. 1699 с 3. 1002 для 4. 480 при 5. 404 от 9179
Б. Шаблон для ЧС двухкомпонентных «словосочетаний» со словоформой на –ные. !Тип элемента: словосочетание из 2 -х элементов. Пример результата (фрагмент): # част. элемент 1. 1 абсолютные величины 2. 1 автономные метафоры 3. 1 административные штампы … 1624. 1 l-граммные спектры 1625. 1 php корпусные 1626. 1 y дополнительные 2001
В. Шаблон для поиска правого и левого окружения слова корпус. !Тип элемента: словосочетание из 3 -х элементов. Комментарий. Маска * корпус* * избыточна, так как по ней будет построен ЧС и для правого/левого окружения слова корпусный. Приведенная выше маска определяет только словоформы слова корпус. Альтернативная маска: прописать в столбик все уникальные по форме словоформы слова корпус. Пример результата (фрагмент): # част. Элемент 1. 3 национальный корпус русского 2. 2 звуковой корпус русского 3. 1 аннотированный корпус чешского …
EX-3. ЧС для словоформ на латинице
Дано: тексты из папки …texts Dialog-2010_1 -50_txt Задача: получить ЧС словоформ на латинице.
Решение-1. Загружаем тексты и определяем кодировку ASCII (кириллица игнорируется). Запускаем программу.
Решение-2. Загружаем тексты и определяем маску вида «звездочка + знак гласного + звездочка» . Запускаем программу.