Как удалить дубли в excel гугл

Google Таблицы постепенно становятся для многих выбором электронных таблиц. Легкость, с которой вы можете сотрудничать в Google Таблицах, намного превосходит все другие инструменты для работы с электронными таблицами.

Еще одна причина, по которой Google Таблицы так широко используются, связана с простотой использования. Команда, стоящая за ним, постоянно добавляет новые функции и возможности, которые упрощают и ускоряют работу.

В этом уроке я покажу вам несколько способов удаления дубликатов в Google Таблицах.

Удалите дубликаты с помощью инструмента «Удалить дубликаты»

Удаление дубликатов — это настолько обычное дело, что люди делают в Google Таблицах, что теперь есть специальная опция для быстрого удаления дубликатов записей.

Предположим, у вас есть набор данных, как показано ниже, и вы хотите удалить все повторяющиеся записи из этого набора данных.

Ниже приведены шаги по удалению дубликатов из набора данных в Google Таблицах:

Вышеупомянутые шаги мгновенно удалят все повторяющиеся записи из набора данных, и вы получите результат, как показано ниже.

Когда вы используете опцию «Удалить дубликаты», чтобы избавиться от повторяющихся записей, это не повлияет на данные вокруг них. Это означает, что при его использовании не удаляются строки и не удаляются ячейки. Он просто удаляет повторяющиеся записи из ячеек (без нарушения ячеек в наборе данных).

Удалите дубликаты с помощью УНИКАЛЬНОЙ функции

В Google Таблицах также есть функция, которую вы можете использовать для удаления повторяющихся значений и сохранения только уникальных значений.

Это УНИКАЛЬНАЯ функция.

Предположим, у вас есть набор данных, как показано ниже, и вы хотите удалить все повторяющиеся записи из этого набора данных:

Приведенная ниже формула удалит все повторяющиеся записи, и вы получите все уникальные:

= УНИКАЛЬНЫЙ (A2: B17)

Приведенная выше формула даст вам результат, начиная с ячейки, в которую вы ввели формулу.

Результатом является массив уникальных записей, и вы не можете удалить или изменить часть этого результата массива. Ничего не произойдет, если вы попытаетесь удалить какую-либо одну ячейку из результата. А если вы перезапишете какую-либо ячейку, весь результат исчезнет, ​​и вы увидите # ССЫЛКА! ошибка.

Одним из ограничений использования функции UNIQUE является то, что она будет рассматривать как дубликаты только те записи, где повторяется все содержимое строки. Если вы хотите сохранить только один экземпляр названия страны и удалить все остальные, UNIQUE сделает это только в том случае, если остальные значения столбца для этой записи также совпадают.

Если в ваших данных есть начальные, конечные или дополнительные пробелы, уникальная функция будет рассматривать записи как разные. В таком случае вы можете использовать следующую формулу:

= МассивФормула (УНИКАЛЬНО (ОБРЕЗАТЬ (A2: B17)))

Удалить дубликат с помощью надстройки

Google Таблицы, как правило, поддерживают огромную библиотеку различных надстроек, чтобы решить все мыслимые проблемы или проблемы.

Все надстройки для удаления дубликатов могут использоваться для одной и той же цели. В Выкрутить Дубликаты надстройка по AbleBits является одним из лучших дополнений для удаления повторяющихся записей из набора данных.

Чтобы использовать надстройку, вам сначала нужно добавить ее в свой документ Google Таблиц.

Ниже приведены шаги по добавлению надстройки в документ Google Таблиц:

Вышеупомянутые шаги добавят надстройку Remove Duplicate в ваш документ Google Sheets, и теперь вы можете начать ее использовать.

Ниже приведены шаги по использованию этого дополнения для удаления повторяющихся записей в Google Таблицах:

Вышеупомянутые шаги мгновенно удалят повторяющиеся записи, и у вас останутся только уникальные записи.

Поскольку в Google Таблицах уже есть способ быстрого удаления дубликатов с помощью встроенной функции, лучше использовать его, если это возможно. Единственная причина, по которой я бы рекомендовал использовать надстройку, — это когда вы хотите сделать гораздо больше, чем просто удалить дубликаты.

Это дополнение также может выполнять следующее:

  • Раскрасьте повторяющиеся записи
  • Добавьте столбец и укажите повторяющиеся записи
  • Сравните столбцы или листы

На чтение 16 мин Просмотров 2к. Опубликовано 02.11.2021

Из этой статьи вы узнаете, как удалить повторы данных в Google Sheets с помощью инструмента «Удалить повторы данных», функции UNIQUE, сводных таблиц, условного форматирования, сценария приложений Apps Script или надстроек.

Прежде всего, что такое дубликаты? И почему они — проблема? Повторы данных (или дублирующие записи, или дублирующие строки) — это случаи появления одной и той же записи в ваших данных более одного раза. Они представляют собой огромную проблем для любого аналитика данных. Очень важно найти и удалить их до начала анализа данных.

Представьте, что в вашей базе данных есть два экземпляра одной и той же клиентской транзакции на сумму $5 000. Когда вы обобщаете данные, вы можете подумать, что у вас есть доход от этого клиента в размере $10 000, в то время как на самом деле у вас есть только $5 000. Вы будете принимать решения на основе неверных данных. А мы все знаем, что это плохо для бизнеса.

Поэтому лучше всего, если вы будете бороться с ними в лоб. К счастью, их исправление не требует много сил, и это не очень энергозатратное занятие. В этом руководстве я покажу вам шесть различных методов поиска дубликатов в Google Sheets и удаления дубликатов в Google Sheets.

Рекомендации по очистке таблиц от повторяющихся ячеек (дубликатов)

В большинстве случаев я бы рекомендовал использовать инструмент «Удалить повторы данных», поскольку это быстрее и проще, чем другие методы. Тем не менее, вот краткое описание того, когда имеет смысл использовать различные методы:

Способ 1: Инструмент «Удалить повторы данных» — самый надежный и практичный метод удаления дубликатов.

Способ 2: Формулы. А) UNIQUE. Она отлично подходит для небольших, простых наборов данных или когда вам нужно удалить повторы данных внутри вложенной формулы.

Б) Формулы IF — надежный, но довольно старый подход. Их преимущество заключается в том, что вам придется испачкать руки в данных, чтобы увидеть повторы данных вблизи.

Способ 3: Сводные таблицы — отличный способ поиска дубликатов в Google Sheets. Сводные таблицы очень гибкие и быстрые в использовании, поэтому это отличный инструмент для использования, когда вы не уверены, есть ли у вас повторы данных, и проверяете свои данные.

Способ 4: Условное форматирование — отличный способ выделения дубликатов в Google Sheets.

Способ 5: сценарий приложений Apps Script полезен для разработчиков, которые хотят удалять повторы данных из таблиц как часть своих приложений, или для тех, кому нужно многократно и автоматически удалять повторы данных данных.

Способ 6: Дополнение дает больше возможностей для удаления дубликатов (например, создание свежей копии данных, выделение дублирующихся записей для просмотра и т.д.), поэтому это хороший вариант, если вам нужно разобраться в дубликатах. Однако это дополнение — платное, поэтому кажется ненужным, учитывая другие бесплатные инструменты в вашем распоряжении.

Содержание

  1. Рекомендации по очистке таблиц от повторяющихся ячеек (дубликатов)
  2. Способ 1: Как удалить повторы данных в Google Sheets с помощью инструмента «Удалить повторы»
  3. Способ 2: Как удалить повторы данных в Google Sheets с помощью формул
  4. 2.1. Формула UNIQUE()
  5. 2.2. Выделение дубликатов значений с помощью COUNTIF
  6. 2.3. Как удалить повторы данных в Google Sheets с помощью формул IF
  7. 2.4. Использование формул IF для нескольких столбцов
  8. Способ 3: Как удалить повторы данных в Google Sheets с помощью сводных таблиц
  9. Способ 4: Как удалить повторы в Google Sheets с помощью условного форматирования
  10. Способ 5: Как удалить повторы данных в Google Sheets с помощью Apps Script
  11. Образец программы-скрипта Apps: Как удалить повторы данных в Google Sheets
  12. Чем этот метод лучше?
  13. Способ 6: Как удалить повторы данных в Google Sheets с помощью надстроек

Способ 1: Как удалить повторы данных в Google Sheets с помощью инструмента «Удалить повторы»

Новая функция очень проста в использовании. Вы найдете эту функцию в меню: Данные > Удалить повторы данных

Удаление дубликатов через инструменты

После того, как вы нажмете на кнопку «Удалить повторы данных», вы будете должны выбрать, в каком именно диапазоне ячеек искать повторы.

Выбрать где провести удаление повторов

Затем повторы данных будут удалены, и вам будет представлен сводный отчет, в котором будет указано, сколько дубликатов было удалено

Сколько дубликатов было удалено при работе инструмента

Способ 2: Как удалить повторы данных в Google Sheets с помощью формул

2.1. Формула UNIQUE()

Этот метод удаляет повторы данных в выбранном вами диапазоне данных.

При определении дубликатов учитываются все столбцы диапазона данных. Другими словами, он сравнивает каждую строку данных и удаляет все строки, которые дублируют друг друга (идентичными всем другим по всему ряду).

Это очень просто реализовать, поскольку для этого используется одна формула с одним аргументом — диапазон, который вы хотите очистить от дубликатов (де-дуплицировать)

=UNIQUE(A1:D11)

Вот пример функции UNIQUE в действии. Функция находится в ячейке F1 и ищет повторы данных в диапазоне данных A1:D11

Пример использования функции UNIQUE

Вы можете видеть, что в таблице справа стало меньше строк, потому что дублирующиеся строки были как бы отфильтрованы — в результате мы получили только уникальные значения.

Результат работы функции UNIQUE для удаления дубликатов данных

2.2. Выделение дубликатов значений с помощью COUNTIF

Этот метод сначала выделяет повторы данных в вашем наборе данных.

Сначала создайте новый столбец рядом со столбцом данных, который вы хотите проверить на наличие дубликатов (например, номер счета).

Затем используйте эту формулу в ячейке B2, чтобы выделить повторы данных в столбце A:

=COUNTIF(A$2:A2;A2)>1

Обратите внимание, что диапазон — A$2:A2. Знак $ здесь ключевой, потому что он фиксирует диапазон в верхней части столбца. Иногда мы хотим зафиксировать ячейку, чтобы она не менялась при копировании формулы — для этого используется абсолютная адресация. Чтобы указать программе, что ссылку не нужно менять, используется абсолютная адресация — со знаком «$»:

Если данные в ячейке появляются в указанном диапазоне один раз и не повторяются — вернётся значение ЛОЖЬ. Если два раза и более — вернётся значение функции ИСТИНА.

Ищем дубликаты данных через COUNTIF

Останется только выделить значения TRUE (повторы данных) и удалить их.

Примечание: если у вас большой набор данных с большим количеством дубликатов, то лучше всего превратить текст в столбце Duplicate в значения (Копировать > Вставить значения), затем отсортировать таблицу по этому столбцу, чтобы все повторы данных (TRUE) оказались в блоке в одной части набора данных, а затем удалить их одной большой группой. Это намного быстрее.

2.3. Как удалить повторы данных в Google Sheets с помощью формул IF

Именно так я впервые научился находить повторы данных и удалять их.

Это работает путем сортировки данных и сравнения соседних строк. Поначалу это довольно сложно, поскольку формулы немного запутаны. Однако, как только вы привыкнете, все становится просто, и это дает вам преимущество — вы сможете разобраться с данными. Вы увидите повторы данных вблизи и сможете выяснить, почему они возникают.

Это включает в себя использование формулы IF для проверки того, равно ли значение в текущей строке значению в предыдущей строке. Если они равны, то это дублирующая запись. Дублирующим записям присваивается значение 1, а уникальным (не дублирующим) — 0. Таким образом, вы можете легко подсчитать количество дубликатов (путем суммирования столбца).

Вот изображение, показывающее этот метод в действии. Формулы мы разберём чуть позже:

Удаление дубликатов с помощью IF

Обратите внимание, что в русской версии Гугл-таблиц знак разделителя — это точка с запятой ;

В данном примере для целей дублирования учитывается только первый столбец — номер счета.

Это означает, что если две строки имеют одинаковый номер счета, то они будут помечены как повторы данных, независимо от того, отличаются ли другие точки данных, например, дата.

Вы можете видеть, что номер счета-фактуры «196-X» в строке 4 был отмечен цифрой 1, чтобы указать, что это дублирующая строка. Если вы хотите рассмотреть больше столбцов или весь ряд, используйте один из других методов, описанных в этой статье.

Следующий шаг — выделение дублирующихся пар:

Это делается для того, чтобы вы могли сравнить уникальную запись и дублирующие записи бок о бок и исследовать, что происходит, прежде чем слепо удалять их.

Последний шаг — удаление дублирующихся строк.

Вот весь процесс, объясненный более подробно:

Шаг 1: Добавьте уникальный столбец

Этот шаг очень важен. Он позволяет сортировать данные по любому столбцу, а затем легко вернуться к исходному порядку. (Примечание: на скриншоте выше это не показано).

Шаг 2: Сортировка А-Я по тому столбцу, который является вашим «уникальным» столбцом

У вас есть номер счета-фактуры, который вы можете проверить на наличие дубликатов? Или номер ссылки на транзакцию? Или идентификатор студента? Определите столбец, который должен быть уникальным. Затем отсортируйте его от А до Я. Это отсортирует все совпадающие записи рядом друг с другом (поэтому дублирующие записи будут рядом с их уникальными аналогами).

Шаг 3: Вставьте два новых столбца справа от «уникального» столбца.

Примените цветовое кодирование, чтобы сообщить пользователям, что эти столбцы были добавлены и не являлись частью исходного набора данных.

Шаг 4: Определите дублирующиеся записи с помощью формулы IF

Основная формула для проверки дубликатов в столбце B выглядит следующим образом:

=IF(B3=B2;1;0)

Шаг 5: Выявление дублирующих группировок с помощью формул ИЛИ и ИЛИ

А затем формула в соседнем столбце, которая идентифицирует дублирующие группы (т.е. первую запись и последующие повторы данных):

=IF(OR(D3=1;D2=1);1;0) 

Шаг 6: Просмотр дубликатов записей

Этот шаг всегда стоит выполнять. Вы можете определить источник дубликатов. Возможно, все повторы данных относятся к определенной дате или клиенту, что можно устранить.

Шаг 7: Сохраните копии дублирующих формул для будущих справок (необязательно)

Если вы думаете, что, возможно, захотите использовать эти формулы снова, вы можете сохранить копии в строках над Листом, чтобы они были «живыми».

Шаг 8: Превратите повторы данных столбцов в значения

Выделите данные (состоящие из 0 и 1) в двух дублирующих столбцах.

Копировать > Вставить специальные > Вставить только значения

Шаг 9: Сортировка по повторяющимся столбцам для перемещения дубликатов

Переместите все повторы данных в нижнюю часть набора данных, чтобы их можно было легко удалить как единый непрерывный диапазон. Это намного быстрее, чем просто отфильтровать повторы данных и удалить их, особенно если набор данных большой.

Шаг 10: Отсортируйте набор данных по столбцу исходного порядка

Отсортируйте данные в исходном порядке, но теперь с удаленными дублирующимися строками.

Вкратце, этот метод:

  • позволяет выделить повторы данных в Google Sheets;
  • позволяет определить дублирующиеся группы в Google Sheets;
  • сохраняет копии всех данных до тех пор, пока вы не будете готовы удалить строки;
  • однако это довольно трудоемкая работа, связанная с хитрыми формулами;
  • изменяет исходный набор данных (если вы не сделали копию).

2.4. Использование формул IF для нескольких столбцов

Это то же самое, что и метод выше, но применяется к нескольким столбцам. В этом случае вы хотите искать повторы данных в Google Sheets на основе двух (или более) столбцов. Возможно, номер счета-фактуры и идентификатор продукта.

Первое, что нужно сделать, — определить столбцы, которые вы хотите включить в рассмотрение дубликатов. На этот раз вставьте три новых столбца справа от последнего «уникального» столбца.

Используйте формулу сцепления всех «уникальных» столбцов, которые вы рассматриваете для выделения дубликатов:

=B2&C2

или вы также можете использовать формулу CONCATENATE (на этот раз включая больше столбцов):

=CONCATENATE(B2;C2;D2;E2)

Этот новый столбец состоит из всех «уникальных» столбцов, сложенных вместе. Теперь используйте способ 2.3 для удаления в этом новом «уникальном» столбце объединенных значений. Для выявления дубликатов и дублирующих групп пройдите те же 10 шагов, что и в способе 2.3.

Вот пример:

Делаем уникальный текст через СЦЕПИТЬ и затем удаляем дубликаты

Способ 3: Как удалить повторы данных в Google Sheets с помощью сводных таблиц

Сводные таблицы чрезвычайно полезны для анализа данных. Это отличный инструмент для поиска дубликатов в Google Sheets. Они очень гибкие и быстрые в использовании, поэтому с них стоит начать, если вы не уверены, есть ли в ваших данных повторы данных.

Шаг 1. Выделите свой набор данных и создайте сводную таблицу (в меню «Данные»). Откроется новая вкладка с редактором сводных таблиц.

В разделе ROWS (строки) выберите тот столбец, который вы хотите проверить на наличие дубликатов (например, номер счета). Затем в VALUES (значения) выберите другой столбец (я часто использую один и тот же) и убедитесь, что он настроен на суммирование по функциям COUNT (СЧЁТ) или COUNTA (СЧЁТЗ) (если ваш столбец содержит текст), как показано ниже:

Удаление дубликатов из сводной таблицы

Выделение дубликатов в Google Sheets с помощью сводной таблицы будет выглядеть вот так:

Количество дубликатов получено с помощью сводных таблиц

Можно заметить, что повторы значений в ячейках имеют значение больше единицы. По этому показателю вы определяете повторы данных и действуете, исходя из ситуации. Как понимаете, данный метод подходит для тех людей, которые не хотят удалять все повторы, а изучить каждый конкретный случай в отдельности.

Способ 4: Как удалить повторы в Google Sheets с помощью условного форматирования

Этот метод состоит из двух шагов: 1) выделение дубликатов в Google Sheets и 2) удаление выделенных дубликатов (необязательно).

Шаг 1. Выберите набор данных и откройте боковую панель условного форматирования (в меню «Формат»). В разделе «Форматировать ячейки, если…» выберите пользовательскую формулу (последний вариант) и введите следующую формулу:

=COUNTIF($A$1:$A1;A1)>1

Эта формула проверяет наличие дубликатов в столбце A.

Условное форматирование для подсветки дубликатов

В результате к дублирующимся значениям применяется выделение:

Выделение дубликатов в Google Sheets с помощью условного форматирования

Что если вы хотите применить выделение ко всей строке?

Нужно внести одно небольшое изменение в формулу (выделено красным), добавив знак $ перед конечным A:

=COUNTIF($A$1:$A1;$A1)>1

Теперь ваш результат будет выглядеть следующим образом: вся строка будет выделена:

Выделение всей неуникальной строки при условном форматировании

Шаг 2. Это необязательный шаг для удаления дублирующихся строк. Добавьте фильтры к набору данных, а затем отсортируйте по цвету, чтобы собрать дублирующиеся строки вместе. Выделите блок дублирующихся строк и удалите его, вот и все дела.

Способ 5: Как удалить повторы данных в Google Sheets с помощью Apps Script

Создать небольшой файл сценария, который может удалять повторы данных строк из ваших наборов данных, относительно просто. Преимущество написания программы Apps Script в том, что вы можете запускать ее снова и снова, например, при каждом добавлении новых данных.

Образец программы-скрипта Apps: Как удалить повторы данных в Google Sheets

Эта программа удаляет повторы данных из набора данных в Листе 1. Она очень специфична для листа и диапазона данных, но ее легко создать и модифицировать.

Она работает следующим образом: (скриншот, код или видео)

  • получите значения из диапазона данных в Sheet1, используя Apps Script;
  • превратите строки массива в строки (блоки текста) для сравнения;
  • отфильтруйте все дублирующиеся строки;
  • проверьте, существует ли лист с дубликатами;
  • если существует, удалите старые данные и вставьте новые дублированные данные;
  • если такого листа не существует, создайте новый лист и вставьте в него новые дублированные данные;
  • добавьте пользовательское меню для запуска из листа Google.

Таким образом, это очень специфично для данного случая использования, но при необходимости его можно легко адаптировать для различных наборов данных. Вот он в действии:

Удаление дубликатов через Apps Script

А вот код Apps Script для этой программы:

/**
* remove duplicate rows from Google Sheets data range
*/
function removeDupRows() {
  
  var ss = SpreadsheetApp.getActiveSpreadsheet();
  var sheet = ss.getSheetByName('Sheet1');
  
  // change the row number of your header row
  var startRow = 7;
  
  // get the data
  var range = sheet.getRange(startRow,1,sheet.getLastRow(),sheet.getLastColumn()).getValues();
  
  // remove duplicates with helper function
  var dedupRange = arrayUnique(range);
  Logger.log(dedupRange);
  
  // check if duplicate sheet exists already, if not create new one
  if (ss.getSheetByName('Sheet1 Duplicates Removed')) { 
    
    // case when dedup sheet already exists
    var dedupSheet = ss.getSheetByName('Sheet1 Duplicates Removed');
    var lastRow = Math.max(dedupSheet.getLastRow(),1);
    var lastColumn = Math.max(dedupSheet.getLastColumn(),1);
    
    // clear out any previous de-duplicate data
    dedupSheet.getRange(1,1,dedupSheet.getLastRow(),dedupSheet.getLastColumn()).clear();
    
    // replace with new de-duplicated data
    dedupSheet.getRange(1,1,dedupRange.length,sheet.getLastColumn()).setValues(dedupRange);
  }
  else {
    
    // case when there is no dedup sheet
    var dedupSheet = ss.insertSheet('Sheet1 Duplicates Removed',0);
    dedupSheet.getRange(1,1,dedupRange.length,dedupRange[0].length).setValues(dedupRange);
  }
  
  // make the de-duplicate sheet the active one
  dedupSheet.activate();
  
}

/** 
* helper function returns unique array
*/
function arrayUnique(arr) {
  
  var tmp = [];
  
  // filter out duplicates
  return arr.filter(function(item, index){
    
    // convert row arrays to strings for comparison
    var stringItem = item.toString(); 
    
    // push string items into temporary arrays
    tmp.push(stringItem);
    
    // only return the first occurrence of the strings
    return tmp.indexOf(stringItem) >= index;
    
  });
}

Кроме того, вы можете добавить пользовательское меню, чтобы запускать его из листа Google, а не из окна редактора сценариев:

/**
* add menu to run function from Sheet
*/
function onOpen() {
  var ui = SpreadsheetApp.getUi();
  ui.createMenu('Remove duplicates')
  .addItem('Highlight duplicate rows','highlightDupRows')
  .addItem('Remove duplicate rows','removeDupRows')
  .addToUi();
}

Чем этот метод лучше?

  • возможно установка триггеров для запуска функции удаления дубликатов при определенных условиях (например, раз в день, при добавлении новых данных);
  • можно улучшить контроль над выбором данных (т.е. какой лист, какой диапазон и т.д.);
  • рассматривайте все столбцы или нет на предмет дубликатов;
  • лучший контроль над выводом данных, чем в остальных методах

Я начал кодировать что-то в этом духе, но все усложняется, когда вы начинаете нагромождать все больше пользовательских опций. Довольно быстро я понял, что все, что я делаю, это изобретаю колесо, поскольку существует совершенно замечательное дополнение (см. способ 2).

Самое лучшее в Apps Script — это то, что он позволяет вам очень быстро создавать максимально жизнеспособные продукты, подходящие именно для вашей ситуации.

Как только вы освоите Apps Script, вам потребуется всего 15-30 минут, чтобы создать пользовательские сценарии, как, например, этот для удаления дубликатов в Google Sheets.

Способ 6: Как удалить повторы данных в Google Sheets с помощью надстроек

Дополнения или надстройки — это специализированные программы, которые вы добавляете в Google Sheets, чтобы получить дополнительную функциональность. Они разрабатываются сторонними разработчиками, но проходят проверку Google, прежде чем попасть в каталог надстроек.

Добавление надстроек в таблицу осуществляется через меню надстроек:

Устанавливаем дополнения в Гугл Таблицы в меню дополнений в Google Sheets

Как вы заметите, здесь много вариантов. Лучшая из них, которую я нашел, это надстройка Remove Duplicates Add-On от Ablebits, которая является первой на этом изображении:

Удалить повторы данных в Google Sheets с помощью дополнения

Это платное дополнение, хотя вы можете использовать полную функциональность бесплатно в течение 30-дневного пробного периода.

Это дополнение выделяет повторы данных в Google Sheets, удаляет повторы данных в Google Sheets и даже может сравнивать два столбца для одного и того же значения.

Оно очень простое в использовании и очень удобно, если вы часто работаете с повторами данных или не уверены, где или почему в ваших данных есть повторы данных. Прежде чем удалить их, вы можете исследовать, в каких строках данных есть повторы данных, и посмотреть, можно ли выявить какие-либо проблемы.

Программа очень проста в использовании. У него много опций, например, нужно ли выделить повторы данных, удалить их, создать новую копию данных и т.д., поэтому я оставлю это на ваше усмотрение.

Вот GIF-изображение, показывающее шаги для выделения повторов в ячейках в вашем наборе данных:

Как выделить повторы данных в Google Sheets с помощью надстройки

Теперь вы знаете, как удалить повторы данных в Google Sheets с помощью шести различных методов, теперь можно идти и очищать свои таблицы от повторов!

Как разделить текст на столбцы, удалить дубликаты и убрать лишние пробелы

Как разделить данные на несколько столбцов

В Google Таблицах данные, разделенные каким-либо символом (например, запятой), можно распределить по столбцам. Так, столбец «Имя, Фамилия» можно разделить на два: «Имя» и «Фамилия».

  1. Откройте файл в Google Таблицах на компьютере.
    • Если данные уже находятся на листе, выберите ячейки, которые нужно разделить.
    • Если данных ещё нет на листе, вставьте их.
  2. В верхней части экрана нажмите Данные затем Разделить текст на столбцы.
  3. Чтобы изменить символ, который используется для разделения данных, нажмите на раскрывающееся меню рядом с параметром «Разделитель».
  4. Чтобы установить распределение столбцов после того, как вы разделите текст, нажмите на меню рядом с параметром «Разделитель» затем Определять автоматически.

Примечание. После вставки данных вы можете нажать на значок «Вставить форматирование» Вставить затем Разделить текст на столбцы.

Как удалить строки с повторяющимися данными

  1. Откройте файл в Google Таблицах на компьютере.
  2. Выберите диапазон данных, в котором нужно удалить дубликаты.
    • Ячейки с разными буквенными регистрами, форматами или формулами, но с идентичными данными считаются точными копиями.
  3. В верхней части страницы нажмите Данные затем Очистка данных затем Удалить повторы.
  4. Выберите, какие столбцы нужно включить, и укажите, есть ли у данных заголовки.
  5. Нажмите Удалить дубликаты.

Примечание. Если вы выберете одну ячейку внутри диапазона, точные копии будут удалены из всего диапазона.

Как удалить лишние пробелы

  1. Откройте файл в Google Таблицах на компьютере.
  2. Выберите диапазон данных, в котором нужно убрать начальные, конечные или лишние пробелы.
  3. В верхней части страницы нажмите Данные затем Очистка данных затем Удалить пробелы.

Примечание. Неразрывные пробелы ( ) удалены не будут.

Эта информация оказалась полезной?

Как можно улучшить эту статью?

You don’t need to dedupe line by line

What to Know

  • Remove Duplicates: Select cell range/columns to search > Data > Data Cleanup > Remove Duplicates.
  • UNIQUE function: Select first cell in column for unique returns > Insert > Function > Filter > Unique.
  • Next: Select search range > press Enter > Sheets will create new column/table of unique entries.

This article explains how to find and remove duplicate entries in Google Sheets using built-in functions or third-party add-ons.

Find Duplicates in Google Sheets Using the Remove Duplicates Tool

Google Sheets includes a built-in tool that will search the sheet based on the criteria you provide.

When you use the Remove Duplicates tool, it’ll automatically remove the duplicates it finds. You won’t have the opportunity to view them first. If you prefer to review them before Google Sheets removes them, you may want to try highlighting duplicates in Google Sheets instead.

 Helloquence / Unsplash
  1. Open the spreadsheet in which you want to find and remove duplicate data.

  2. Select the data range in which you’d like to remove duplicates.

    Cells with identical values, but different formatting, formulas, or letter cases are considered duplicates.

  3. Select Data > Data Cleanup > Remove Duplicates. The Remove Duplicates dialog box will open showing the number of columns and rows selected.

  4. Select the Data has header row checkbox if your spreadsheet includes a header row to prevent this row from being affected.

  5. Choose the columns you want the tool to analyze by selecting the corresponding checkboxes. To analyze all columns, select the Select All checkbox.

    If you select a single cell within a range, duplicates will be removed for the whole range.

  6. Select Remove Duplicates. The tool will analyze the data, and a box will appear showing how many duplicate rows Google Sheets found and removed.

Find Duplicates in Google Sheets Using the UNIQUE Function

The UNIQUE function in Google Sheets returns unique rows from the provided source range, discarding duplicates. The UNIQUE function returns rows in the order they first appear in the source range. Using this method, you are able to view and compare both sets of data before deleting the original duplicates.

Ensure numeric values are formatted in the same way, such as percentages or currency values.

  1. Select the first cell in the column in which you want to unique rows returned.

  2. Select Insert > Function.

  3. Select Filter > Unique.

  4. Enter or select the range you want to use as the argument for the function and press Enter.

  5. Google Sheets will create a new column or table with only unique rows included.

    If returned rows appear to include duplicates, look for cells that have hidden text or other differences, such as trailing spaces.

Find and Remove Duplicates in Google Sheets Using an Add-on

Add-ons are tools created by third-party developers that improve or simplify your experience using Google Sheets. Add-ons are available that will find and remove duplicates from your spreadsheet in Google Sheets.

While no two add-ons are identical, many include similar features. Learn how to locate add-ons that find and remove duplicates in Google Sheets and how to decide which one best suits your needs.

  1. Go to Google Sheets.

  2. Select Add-ons > Get Add-ons. The Add-ons window will open with several suggested tools.

  3. Type «remove duplicates« into the Search add-ons field and press Enter. A list of potential add-ons matching your search will appear.

  4. Select an add-on you want to learn more about to open the description page. Scroll down to read reviews or scroll right and left to view screenshots and videos displaying the add-on in action.

  5. Select Add.

    The Add button might have a price or the word «Free« on it.

  6. Select or sign in to your Google account if prompted.

  7. Select Allow to provide the requested permissions to the add-on.

  8. Wait while the add-on is installed.

  9. Select Add-ons to access and use the tool.

    Select Help in the add-on menu to get help using the tool you have downloaded.

Thanks for letting us know!

Get the Latest Tech News Delivered Every Day

Subscribe

Как и везде в вашей жизни, ваша таблица Google может немного запутаться и время от времени нуждаться в хорошей уборке. Одной из самых неприятных проблем может быть дублирование информации в нескольких местах вашей электронной таблицы.

Вот несколько простых методов, которые вы можете использовать, чтобы найти и удалить повторяющиеся данные в вашей таблице Google.

Инструмент « Удалить дубликаты» – самый надежный и практичный метод удаления дубликатов в Google Таблицах, и он должен быть первым, с чего вы начнете. В качестве примера мы использовали короткий список контактов, который часто является самым серьезным нарушителем дублирования данных.

Выполните следующие действия, чтобы удалить дубликаты с листа с помощью инструмента Удалить дубликаты:

  1. Откройте свою таблицу Google .
  2. Выделите область на листе, из которой вы хотите удалить дубликаты. Вы можете быстро сделать это, щелкнув и перетащив указатель мыши из верхней левой ячейки в нижнюю правую ячейку вашего списка, выделив все ячейки, которые вы хотите сканировать в процессе удаления дубликатов.
  3. Выберите Данные в строке меню.
  4. Выберите Удалить дубликаты из опций меню.
  5. Вам будет предложено выбрать, какие столбцы вы хотите проверить на наличие дубликатов. Вы можете удалить дубликаты, если строки полностью совпадают, или вы можете выбрать конкретный столбец, например адрес или имя, независимо от того, какие данные находятся в других столбцах.
  6. Выберите Удалить дубликаты . Затем вам будет представлен сводный отчет, в котором будет указано, сколько дубликатов было удалено.

2. Удаление дубликатов с помощью формул

Есть несколько способов воспользоваться формулами в Google Таблицах, которые помогут вам идентифицировать и удалять повторяющиеся данные, некоторые из которых более сложные, чем другие. Вот самые простые способы использования формул для удаления дубликатов.

Использование УНИКАЛЬНОЙ формулы

Этот метод удаляет дубликаты в выбранном вами диапазоне данных. Он сравнивает каждую строку данных и удаляет все повторяющиеся строки. Его очень легко реализовать, поскольку он включает одну формулу с одним аргументом – диапазон, из которого вы хотите удалить дубликаты.

Используйте УНИКАЛЬНУЮ формулу, выполнив следующие действия:

  1. Откройте свою таблицу Google .
  2. Выберите пустую ячейку.
  3. Введите эту формулу = UNIQUE (A2: D9), указав ячейки, которые вы хотите выбрать.
  4. Нажмите Enter на клавиатуре или щелкните мышью. Теперь у вас будет вторая таблица с удаленными дубликатами.

Использование формулы СЧЁТЕСЛИ

Этот метод сначала выделяет дубликаты в вашем наборе данных. Когда значение отображается впервые, счет будет 1, поэтому результат формулы будет ложным. Но когда значение появится во второй раз, счет будет 2, поэтому результат формулы будет ИСТИНА.

Преимущество этой формулы в том, что она позволит вам просмотреть дубликаты перед удалением.

Выполните следующие действия, чтобы использовать формулу СЧЁТЕСЛИ для удаления дубликатов с листа:

  1. Откройте свою таблицу Google .
  2. Создайте новый столбец рядом с столбцом данных, который вы хотите проверить на наличие дубликатов, используя команду Вставить слева в разделе Вставка в меню.
  3. Введите = СЧЁТЕСЛИ (диапазон, критерии)> 1 в верхней ячейке нового столбца, который вы создали, чтобы выделить дубликаты. В нашем примере формула для проверки повторяющихся фамилий будет = СЧЁТЕСЛИ (B $ 2: B2, B2)> 1 . Вы заметите, что диапазон равен B $ 2: B2 , знак $ блокирует диапазон до текущей строки, даже если вы копируете формулу в столбец C. Таким образом, эта формула будет проверять наличие дубликатов в текущей строке обратно вверх. для тебя.

3. Удаление дубликатов с помощью сводных таблиц

Сводные таблицы могут быть чрезвычайно полезны для поиска дубликатов в таблице Google. Он чрезвычайно гибкий и быстрый в использовании, поэтому часто это отличное место для начала, если вы не уверены, есть ли у вас какие-либо дубликаты в ваших данных.

Выполните следующие действия, чтобы определить и удалить дубликаты с листа:

  1. Откройте свою таблицу Google .
  2. Выделите свой набор данных.
  3. В меню « Данные» выберите « Сводная таблица» .
  4. Выберите, хотите ли вы создать эту новую таблицу на новом листе или на существующем листе . Редактор сводной таблицы откроется справа от вашего листа.
  5. Выберите « Строки» и выберите столбец, который вы хотите проверить на наличие дубликатов (например, фамилию).
  6. Выберите ЗНАЧЕНИЯ , выберите тот же столбец, что и выбранный выше, и убедитесь, что он настроен для суммирования по COUNT или COUNTA .

Теперь вы можете легко найти эти повторяющиеся значения на исходном листе и решить, что делать дальше. Как видите, этот метод идеально подходит, когда вы проверяете наличие дубликатов и хотите изучить их подробнее.

Этот метод состоит из двух шагов: сначала выделяются дубликаты, а во втором – удаляются выделенные дубликаты, что позволяет увидеть дубликат до удаления.

Чтобы реализовать условное форматирование для удаления дубликатов с листа, выполните следующие действия:

  1. Откройте свою таблицу Google .
  2. Выберите данные, из которых вы хотите удалить дубликаты.
  3. В разделе « Формат» выберите « Условное форматирование» для боковой панели.
  4. Под параметром Форматировать ячейки, если выберите Пользовательская формула .
  5. Введите следующую формулу: = СЧЁТЕСЛИ ($ B $ 2: $ B2, B2)> 1 . Эта формула проверяет наличие дубликатов в выбранном столбце для вас.
  6. Установите стиль форматирования, чтобы выделить повторяющиеся данные.
  7. Если вы хотите, чтобы в результатах выделялась вся строка, вы можете настроить формулу на = COUNTIF ($ B $ 2: $ B2, $ B2)> 1 .
  8. Удаление дубликатов необязательно, но теперь это можно легко сделать. Выделите данные, которые нужно отсортировать, и выберите пункт меню « Фильтр» .
  9. Щелкните значок фильтра рядом с заголовком столбца, который нужно отсортировать по цвету.
  10. В раскрывающемся меню выберите « Сортировать по цвету», затем « Цвет заливки» и выберите цвет заливки, который должен отображаться сверху.
  11. Выделите блок дубликатов и нажмите Удалить .

Существуют и другие методы удаления дубликатов в Google Таблицах, в том числе использование скрипта Google Apps и покупка надстройки в Google Workspace Marketplace . Их стоит проверить, если вы не получаете желаемых результатов.

Использование скрипта приложений дает вам возможность легко запускать скрипт в любое время. Также доступны дополнительные приложения для регулярной проверки дубликатов.

Получите четкое представление о ваших данных

Эти методы избавят вашу электронную таблицу от дубликатов, дадут вам четкое представление о ваших данных и сэкономят ваше время. Надеюсь, знание этих быстрых и простых способов удаления дубликатов сделает вашу жизнь более организованной.

Google постоянно совершенствует свое программное обеспечение, поэтому следите за последними обновлениями.

Понравилась статья? Поделить с друзьями:

А вот еще интересные статьи:

  • Как удалить дубли в excel в одном столбце
  • Как удалить всю строку в excel vba
  • Как удалить гиперссылки в excel во всем столбце
  • Как удалить дату создания файла excel
  • Как удалить дубли в excel vba

  • 0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии