МАЙ 2020
Мы решили выложить данные по коронавирусу по регионам РФ в табличной форме (Excel) для тех, кто хочет попробовать себя в аналитике.
Источник по заболевшим: Роспотребнадзор
Новый коронавирус был назван тяжелым острым респираторным синдромом “Коронавирус 2” (SARS-CoV-2), в то время как заболевание, связанное с ним, теперь называется COVID-19. С 6 марта 2020 года, когда началась пандемия коронавируса в Российской Федерации, группа аналитиков компании “Полиматика” собирает данные о количестве случаев COVID-19 на основе публичных ежедневных отчетов Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (Роспотребнадзор). Для обеспечения точности и достоверности данных этот процесс постоянно совершенствуется. Датасет помогает отслеживать и интерпретировать актуальную динамику пандемии COVID-19 в Российской Федерации. Корректировка данных Роспотребнадзором не учитывались; это может вызвать незначительные расхождения при сравнении с данными, предоставляемыми нарастающим итогом.
СТРУКТУРА ДАННЫХ
Регион
Федеральный округ
Дата — начинается с 06.03.2020
Случаи заболевания — количество новых случаев на дату
Население — население регионов РФ на 01.01.2020. Источник
Количество смертей — количество смертей дату Источник
ДАТА ОБНОВЛЕНИЯ: 30 ИЮНЯ
СКАЧАТЬ ДАТАСЕТ
НАШИ ВИДЕО С АНАЛИТИКОЙ ПО КОРОНАВИРУСУ
Открытый доступ
Обновлено:
27.04.2022
УИК России: координаты, численность избирателей и оценка численности населения в крупных городах
Срез данных на 2020 год, который дает возможность работать с более равномерным распределением численности населения при пространственном анализе.
4658
303
CSV
Открытый доступ
Обновлено:
23.03.2022
Экспорт и импорт российских регионов: таможенная статистика с детализацией до товаров за 2016-2021 гг.
Сведения Федеральной таможенной службы по экспорту и импорту. Данные представлены с детализацией до десятизначных кодов товаров, а также стран, в которые (из которых) эти товары импортируются или экспортируются субъектами РФ
8979
725
CSV
Открытый доступ
Обновлено:
10.02.2022
Российская гуманитарная помощь для борьбы с COVID-19: сведения о поставках в зарубежные страны за 2020-2022 гг.
Вручную собранные сведения из официальных российских и зарубежных источников, а также сообщений СМИ о поставках российской гуманитарной помощи зарубежным странам для борьбы с COVID-19 за период 01.02.2020 — 01.02.2022.
9385
725
XLSX
Открытый доступ
Обновлено:
27.01.2022
База данных показателей муниципальных образований России за 2006 – 2020 гг.
Социально-экономические характеристики муниципальных образований (МО) всех уровней в России за 2006-2020 гг.
23018
1412
CSV
POSTGRESQL
Открытый доступ
Обновлено:
24.12.2021
Международные соглашения России: объединенные исторические данные о двусторонних договорах за 1887—2021 гг.
Сведения о международных договорах, заключенных Российской империей, РСФСР, СССР или Россией. Собраны на основе публичной информации из трех источников: электронной картотеки международных соглашений МИД России, АСОЗД Госдумы и собрания договоров ООН
5107
163
CSV
XLSX
Открытый доступ
Обновлено:
14.12.2021
Крупные города России: объединенные данные по основным социально-экономическим показателям за 1985-2019 гг.
Сведения по 70 базовым социально-экономическим показателям для более 200 крупных российских городов за 1985, 1990-1991, 1995-2019 гг. Публикуются как официальная статистическая информация в ежегодных статистических сборниках Росстата.
8301
731
CSV
Открытый доступ
Обновлено:
02.12.2021
«Работа в России»: обработанные и объединенные сведения о вакансиях, резюме, откликах и приглашениях портала trudvsem.ru
Архивные и актуальные сведения о резюме, вакансиях, откликах соискателей и приглашениях на собеседование, размещенные на портале Роструда «Работа России». Сведения публикуются в разделе «Открытые данные» в формате многоуровневых структур XML.
14090
488
CSV
Открытый доступ
Обновлено:
30.11.2021
Доходы и имущество госслужащих: объединенные сведения из антикоррупционных деклараций сотрудников российских министерств
Данные о доходах и имуществе сотрудников российских министерств и членов их семей, полученные из опубликованных антикоррупционных деклараций за 2013-2020 гг.
6421
514
CSV
Открытый доступ
Обновлено:
25.11.2021
История изменений муниципалитетов в России: наименования, коды ОКТМО и входящие в состав населенные пункты
Датасет позволяет отследить изменения, происходившие с муниципалитетами в 2015-2021 гг.: состав населенных пунктов, код ОКТМО и название МО.
3408
133
CSV
Открытый доступ
Обновлено:
18.11.2021
Показатели валового регионального продукта в России: объединенные данные за 1998—2019 гг.
Ежегодные показатели валового регионального продукта (в субъектах РФ) за период с 1998 по 2019 г. Публикуются как официальная статистическая информация на сайте Росстата.
4380
320
CSV
Статистика и рейтинги
Статистические данные широко используются в прикладных международных исследованиях. Они позволяют делать сравнения и анализировать международные события, основываясь на конкретных количественных показателях. Источниками представленных статистических данных выступают крупные международные организации, в числе которых ООН, МВФ, Всемирный банк, ВТО. Международные и национальные базы статистических данных охватывают практически все аспекты глобального развития.
Очень полезными для международных исследований могут быть и различные индексы. Под индексом понимается показатель, количественно отражающий ту или иную качественную характеристику объекта исследования. Для расчета индексов вырабатываются специальные методологии, которые имеют как свои недостатки, так и преимущества. Все источники общедоступны и позволяют легко и бесплатно скачивать данные. Источники на английском языке. В аннотации приводится краткое описание содержания источника, и даются рекомендации по скачиванию материалов.
Статистика
Содержит ссылки на различные базы данных по производству и потреблению энергии, энергоресурсов, макроэкономическому положению различных государств.
№ | Название | Аннотация |
---|---|---|
1 | Статистика ООН | Современная статистика глобального и национального уровня, собранная ООН. На сайте представлена статистика по энергетике, образованию, финансам, сельскому хозяйству, преступности, окружающей среде, здравоохранению, демографии, промышленности, миграции, туризму, торговле. Данные доступны в виде таблиц и скачиваются в заархивированном формате EXCEL. |
2 | Статистика Конференции ООН по торговле и развитию | Статистика по международной торговле, инвестициям, тенденциям развития экономики, курсам обмены валют, рабочей силе, товарам, информационным и коммуникационным технологиям, морским перевозкам и т.д. Статистика собирается и обрабатывается Конференцией ООН по торговле и развитию. Данные представлены в виде графиков и таблиц. Для скачивания данных в формате EXCEL необходима бесплатная регистрация на сайте. |
3 | Статистика МВФ (Международного валютного фонда) | Статистические данные по всевозможным финансовым и экономическим показателям представлены на сайте МВФ. Информация очень удобно представлена в виде интерактивных карт, графиков и таблиц. Статистика по странам и группам стран скачивается в формате EXCEL. МВФ выпускает основанные на статистических данных аналитические доклады, которые можно скачать в формате PDF. |
4 | Статистика ВТО | База данных статистики для большинства стран мира по торговой политике, доступам на рынки, экспорту и импорту, основным инфраструктурам доступна на сайте ВТО. Сайт позволяет в интерактивном режиме извлекать статистические данные по международной торговле. Данные доступны в виде таблиц и скачиваются в форматах HTML и EXCEL. |
5 | Статистика Всемирного банка | Более 2000 показателей, включая сотни индикаторов, охватывающих период продолжительностью в 50 лет и касающиеся практически всех аспектов мирового развития, содержатся в базе данных Всемирного банка. Статистика для удобства сгруппирована по странам, по темам и по индикаторам. Данные представлены в виде таблиц, графиков и карт. Скачивается статистика в форматах EXCEL и XML. |
6 | База данных СИПРИ (Stockholm International Peace Research Institute) | Обширная статистика военных расходов по 170 странам мира за период с 1988 по 2010 годы, интерактивные данные по международным и региональным миротворческим операциям, поставкам вооружений и производителям военной техники доступы на сайте SIPRI. Сайт может оказаться исключительно полезным для тех, кто интересуется проблемами мира и войны, прежде всего вопросами контроля над вооружениями и разоружения. Для скачивания баз данных в формате EXCEL необходима бесплатная регистрация на сайте. SIPRI также выпускает аналитические доклады, скачиваемые без регистрации в формате PDF. |
7 | Справочник ЦРУ по странам мира (CIA – The World Factbook) | Подробная статистика и фактическая информация по всем странам мира собрана на сайте ЦРУ. В онлайн-версии справочника содержится информация о географии, демографии, государственном строе, экономике, вооруженным силам, телекоммуникациям и транспортной системе стран. Информация по странам удобно представлена в картах, фотографиях и таблицах. Статистические данные можно скачать в формате TXT. |
8 | Статистика Nation Master | Зачастую отдельные показатели не имеют смысла сами по себе. Особенность сайта заключается в том, что наряду с рейтингами стран по различным показателям, он позволяет в интерактивном режиме сравнивать различные индексы и показатели по любым странам мира. Масштабная база статистики для удобства разделена по категориям: «энергетика», «демократия», «миграция», «экономика», «интернет», «политическая система» и многим другим. Данные для сайта собраны из общедоступных источников, таких как справочник ЦРУ по странам мира, государственные переписи населения, статистика ООН, ВМФ, Всемирного банка и т.д. Информация представлена в диаграммах, картах и таблицах. |
9 | Статистика Index mundi | На сайте собрана экономическая, демографическая, телекоммуникационная, военная и транспортная статистика. Источником данных в основном выступает справочник ЦРУ по странам мира. Удобный интерфейс позволяет в интерактивном режиме просматривать рейтинги стран, сравнивать любые четыре страны по различным показателям. Информация представлена в картах, графиках и таблицах. |
10 | Интерактивная карта мировой торговли оружием | Карта создана компанией Google. Данные для карты, отражающие более миллиона сделок по импорту и экспорту оружия с 1992 по 2010 год в 250 странах и территориях мира, предоставлены Исследовательским институтом мира в Осло. |
11 | Статистика Gapminder | Набор баз данных международной статистики по странам мира. Оригинальный визуальный интерфейс представления статистической информации в виде динамической инфографики. |
12 | Статистика Международного энергетического агентства (МЭА) | База данных по статистике для стран мира по производству и потреблению основных источников энергии, затратам на НИОКР в сфере энергетике, выбросам CO2, обзор стоимости энергоносителей и электроэнергии для промышленности и частных потребителей. Данные можно просматривать в режиме онлайн отдельно для стран-членов ОЭСР и других государств, или в виде ежегодных публикаций в формате PDF. Для доступа к расширенным данным и исследованиям необходима регистрация. |
13 | Статистика компании BP | Статистические данные по основным мировым источникам энергии – запасы, потребление, резервы и цены. Информация доступна для скачивания в формате PDF и MSExcel. |
14 | Статистика Организации экономического сотрудничества и развития (ОЭСР) | Статистические данные для стран-членов ОЭСР по большому числу показателей. Позволяет просматривать как статистику для отдельных государств, так и для регионов в рамках ОЭСР, стран-членов Организации в целом и средние показатели. Данные доступны как в режиме онлайн, так и для скачивания в формате MSExcel, CSV, XML, PC-axis. |
15 | Статистика Организации стран-экспортеров нефти (ОПЕК) | Содержит данные по среднемировой цене на сырую нефть, объему инвестиций стран-членов ОПЕК в разведку и добычу углеводородных энергоносителей, величине взимаемых налогов на добычу полезных ископаемых. Помимо этого, публикуются ежемесячные и годовые отчеты по основным показателям мирового рынка углеводородов. Характерной чертой является изначальное представление всех данных в виде графиков и диаграмм. Для скачивания данные доступы как в различных временных форматах (день/неделя/месяц/год), так и в формате MSExcel и XML. |
16 | Статистика Организации Североатлантического договора (НАТО) | Доступна статистическая информация по финансово-экономическим показателям расходов на оборону по странам НАТО и блоку в целом и постсоветским государствам (абсолютный/относительный размер расходов на оборону, расходы по категориям). Данные доступны в формате PDF. |
17 | Статистика Организации Объединенных Наций по вопросам образования, науки и культуры (ЮНЕСКО) | Более 1000 индикаторов и данных по вопросам образования, грамотности, науки и технологии, взаимодействию в культурной и гуманитарной сферах. Статистические данные доступны по более чем 200 странам и территориям, собранные как с помощью государств-членов Организации, так и с помощью других международных организаций. Данные можно скачать в формате MS Excel. |
18 | Статистика Организации Объединенных Наций по промышленному развитию (ЮНИДО) | Содержит данные по основным показателям промышленного производства, позволяет сравнивать как отдельные страны, так и группы стран. Данные доступны в режиме онлайн. |
19 | Статистические данные Всемирной организации здравоохранения (ВОЗ) | Данные по различным аспектам здравоохранения (расходы на здравоохранение, ожидаемая продолжительность жизни, смертность, данные о пандемиях и распространенных заболеваниях). Таблицы доступны для скачивания в формате MS Excel. |
20 | Статистика Всемирной организации интеллектуальной собственности (ВОИС) | Содержит статистические данные о патентах и международных патентных заявках (полезные модели, товарные знаки, промышленные образцы, растения и микроорганизмы), статистические данные о промышленной собственности. Данные доступны для скачивания в формате MSExcel, CSV, TXT. |
21 | Статистика Международной организации труда (МОТ) | Позволяет получить доступ к нескольким базам данных по различным аспектам трудовых ресурсов, защиты прав трудового населения, распределения доходов, стандартов организации труда. Для скачивания данные доступны в формате MS Excel. |
22 | Статистика Бюро трудовой статистики США | В базах данных по международному сравнению трудовых ресурсов и сравнению экономических показателей содержатся данные по 38 странам. Данные доступны для скачивания в форматах PDFи MSExcel. |
23 | Статистика Центра международных сравнений Университета Пенсильвании | Доступны данные по 189 государствам по показателям экономической и социальной сферы в период с 1950 по 2010 гг. Отличительной чертой является возможность создать сравнительные таблицы под конкретный запрос. Данные доступны для скачивания в формате MS Excel. |
24 | Статистика Продовольственной и сельскохозяйственной организации ООН (ФАО) | Организация предоставляет доступ к базам данных по снабжению населения различных стран продовольствием, обеспеченности водой, пахотным землями, лесными ресурсами. Кроме того, имеется доступ к интерактивному атласу по развитию сельскохозяйственного животноводства и производства продуктов питания. |
25 | Статистика Европейского центрального банка (ЕЦБ) | Статистические данные по финансово-экономическим показателям европейских стран. Данные доступны для скачивания в формате MSExcel и CSV. |
26 | Статистика Азиатского банка развития (АБР) | Статистические данные по экономике, финансам, трудовым ресурсам, социальным аспектам для 48 государств-членов. Возможен выбор и сравнение показателей нескольких государств. |
27 | Статистика Базельского комитета по банковскому надзору | Данные по различным аспектам банковской деятельности и международного движения капитала. Доступны для скачивания в формате PDF, CSV. |
28 | Статистика Европейского банка реконструкции и развития | Статистические данные по макроэкономической ситуации, структурным изменениям в экономике 29 стран, в которых банк осуществляет свою деятельность. Данные доступны для скачивания в формате MSExcel. |
29 | Статистика Межамериканского банка развития | В базах данных собраны более 1000 индикаторов и индексов для оценки макроэкономического, политического и социального положения стран в регионе Латинской Америки и бассейна Карибского моря. |
30 | Статистика Африканского банка развития | Статистические данные социально-экономического развития стран Африки. Информация представлена в удобном режиме интерактивной карты, возможно сравнение нескольких государств. |
31 | Статистика Международного газового союза | |
32 | Статистика Статистической службы Европейского союза (Евростат) | Базы статистических данных по странам Европейского союза. Отличается высокой степенью детализации, вплоть до показателей по отдельным регионам и городам стран-членов ЕС. |
33 | Статистика Управления ООН по наркотикам и преступности | Содержит ссылки на базы данных по различным аспектам преступности и нелегального оборота наркотических средств по странам и регионам мира. Данные доступны для скачивания в формате PDF. |
34 | Статистика Детского фонда ООН (ЮНИСЕФ) | Собрание статистических данных и исследований по проблеме защиты прав детей в различных странах мира. Доступны данные по отдельным странам, регионам, а также сравнительные таблицы. Данные по отдельным странам доступны в режиме онлайн, сравнительные таблицы и графики доступны для скачивания в формате PDF. |
35 | Статистика Управления Верховного комиссара ООН по делам беженцев | Доступны статистические показатели по проблеме беженцев, их статуса, основных миграционных потоков. Данные доступны в режиме онлайн. Также есть возможность скачать в формате PDF ежегодные отчеты по проблемам беженцев и населения мира в целом. |
36 | Статистика Конференции сторон Рамочной конвенции ООН об изменении климата | Данные по выбросам парниковых газов для отдельных государств и групп стран, возможно просматривать данные отдельно для стран-участниц Киотского протокола. Также содержит ссылки на другие международные и национальные организации, занимающиеся оценкой процессов изменения климата. |
37 | Статистика Международной ассоциации производителей стали | Базы данных по производству стали по отдельным странам и регионам мира (62 страны, в совокупности выпускающие до 98% мировой выплавки стали и продукции на ее основе). Данные представлены как за весь год, так и по отдельным месяцам и доступны для скачивания в формате PDF и MSExcel. |
38 | Статистика Международного института алюминия | Статистические базы данных по мировой добыче бокситов и производству алюминия. Отличается удобством пользования – данные можно представить не только в виде таблицы (доступны для скачивания в формате CSV – MSExcel), но и в виде карты, гистограмм и линейных диаграмм. |
39 | Статистика Международного института изучения риса | Базы данных института позволяют получить статистическую информацию о мировом производстве и потреблении риса. Данные доступны как в форме таблиц (онлайн) так и в виде карт, графиков, а также 3Dмоделей, интегрированных с сервисов GoogleEarth. |
40 | Статистика Конференции ООН по торговле и развитию (ЮНКТАД) | Доступны данные по различным аспектам движения мирового финансового капитала, обмена технологиями, инвестиций и проблем устойчивого развития. Данные доступны для 194 стран, по некоторым показателям – с 1948 года. Скачивание данных возможно в формате MSExcel. |
41 | Статистика Business Monitor International | Доступны данные по оценке страновых инвестиционных рисков, общему состоянию экономики, долгосрочным тенденциям экономического развития. Доступ осуществляется на платной основе, но при регистрации предоставляется пробный период пользования базами данных. |
42 | Статистика Федеральной службы государственной статистики России | Публикуется официальная статистическая информация по Российской Федерации. В графе внешняя торговля представлены основные показатели внешней торговли, въезда-выезда граждан. В графе «международные сравнения» публикуются сравнительные таблицы показателей экономической деятельности, демографии и социальной сферы России и стран зарубежья. Данные доступны в режиме онлайн, а также для скачивания в формате MSExcel. |
43 | Статистика Федеральной таможенной службы России | Статистика по показателям внешней торговли России со странами зарубежья. Данные доступны для скачивания в формате MS Excel. |
44 | Статистика Министерства финансов Российской Федерации | Данные по финансовым, общеэкономическим и демографическим показателям стран мира. |
45 | Базы данных по конфликтам в мире Уппсальского университета | Проект Уппсальского университета объединяет информацию по всем текущим вооруженным конфликтам и насилию в мире. Большое количество баз данных по разным аспектам данных конфликтов. Доступны для скачивания в формате MSExcel. |
46 | Базы данных EUGene | EUGene представляет собой программу, являющуюся мощным инструментом статистического анализа международных отношений. После установки исследователь получает возможность доступа к данным по различным аспектам международных отношений с 1816 года. Кроме того, поскольку проект изначально создавался для математической и статистической поддержки Теории ожидаемой полезности войны (Б. Буэно де Мескита и др.), программа позволяет одновременно сравнивать различные страны, строить графики и диаграммы. Кроме того, данные проекта можно экспортировать в другие инструменты статистического анализа – STAT, SPSS, LIMDEP. Программа находится в бесплатном доступе, скачивается через сайт. |
47 | Базы данных Google Public Data | Интересный сервис, интегрирует статистические данные по различным аспектам международных отношений из 77 источников как международных, так и страновых. Одной из особенностей сервиса является возможность представить данные в удобном виде (график, точечная диаграмма, диаграммы рассеивания, точечная диаграмма с политической картой мира). |
48 | Базы данных Daily North Korea | Южнокорейский ресурс, посвященный сбору и анализу информации о процессах и событиях, происходящих в Корейской Народно-Демократической республике. В разделе «database» представлен сборник статистических баз данных, аналитических статей и других материалов по КНДР. |
49 | Статистические данные Центра анализа стратегий и технологий | В данном разделе публикуется информация о российском экспорте вооружений и военной технике, российском оборонном бюджете и государственном оборонном заказе, основных действующих контрактах на поставку российских вооружений и военной техники, а также об экономических итогах деятельности крупнейших предприятий российского ОПК. Данные доступны для скачивания в формате doc. |
50 | Регистр обычных вооружений ООН (Управление ООН по вопросам разоружения) | Регистр обычных вооружений ООН создан решением Генеральной Ассамблеи ООН в декабре 1991 года. Организация публикует официальные мировые отчеты по всем основным продажам обычных вооружений (основные боевые танки, бронированные машины пехоты, артиллерия больших калибров, боевые самолеты, атакующие вертолеты, военные корабли и ракеты). Данные доступны не для всех стран, поскольку предоставляются на добровольной основе. |
51 | Базы данных Центра анализа мировой торговли оружием | Центр анализа мировой торговли оружием является молодым российским аналитическим центром (создан в 2010 году). Центр публикует ежегодник, который собран по трем базам данных – экспорту, импорту, а также по основным статьям поставок вооружений и военной техники. |
52 | Базы данных Информационно-библиографической системы ООН, UNBISnet | Информационно-библиографическая система ООН содержит информацию по всем решениям и резолюциям, принятым в рамках системы Организации Объединенных Наций. Кроме того, содержит каталог публикаций и других официальных документов из Библиотеки им. Дага Хаммаршёльда. |
53 | Проект Country Commercial Guide | Country Commercial Guide является совместным проектом Государственного департамента США и Национальной экспортной инициативы и направлен на создание «профиля» стран, с которыми Соединенные Штаты, американские компании или резиденты имеют торгово-экономические отношения. |
54 | Базы данных Human Relations Area Files (HRAF) | Данные базы данных содержат источники и информации о социальных, культурных и других ценностях, характерных для разных народов и других расовых и этнических групп стран мира. |
55 | Базы данных Standard Cross-cultural sample (Стандартная кросс-культурная выборка) | База данных содержит выборку для 186 основных культур мира и широко используется учеными, занимающимися изучением культурного фактора в международных отношениях. |
56 | Базы данных The World Values Survey | Данный проект — один из лучших источников по роли социо-культурных аспектов в международных отношениях. За основу берутся результаты социологических опросов населения стран мира. |
57 | Данные проекта The Pew Research Center Global Attitudes | Проект независимого экспертно-аналитического центра The Pew Research Center направлен на изучение влияния ценностных ориентаций населения на мировые политические процессы. |
58 | Базы данных Международного совета по зерну (International Grains Council) | Содержит данные по мировому рынку зерна – спрос и предложение. |
59 | Проект «Доля добавленной стоимости в мировой торговле по странам» | Совместный проект ВТО и ОЭСР, направленный на изучение распределения доли добавленной стоимости в конечной продукции между странами. |
60 | База данных региональной интеграции. Проект ЦИИ ЕАБР | В «Базу данных региональной интеграции» (БДРИ) Центра интеграционных исследований Евразийского банка развития включены все классические многосторонние соглашения о свободной торговле между странами, все таможенные и экономические союзы мира, соглашения между отдельными таможенными союзами, организации сотрудничества в рамках бассейнов рек и региональные форумы, новые мега-проекты экономической интеграции (92 интеграционных объединения). |
Индексы
№ | Название | Аннотация |
---|---|---|
1 | Индекс восприятия коррупции, барометр мировой коррупции, индекс взяткодателей (Transparency International) | Индекс восприятия коррупции, индекс взяткодателей и барометр мировой коррупции, рассчитываемые международной организацией Transparency International, позволяют измерить уровень коррупции на глобальном и региональном уровнях. Индекс восприятия коррупции — показатель, отражающий оценку уровня коррупции экспертами по шкале 10 баллов. Индекс взяткодателей отражает склонность компаний ведущих стран-экспортёров мира давать взятки в развивающихся странах. Барометр мировой коррупции, основанный на опросах общественного мнения, измеряет отношение граждан к коррупции. Индексы лишь относительно надежны, и степень надежности различна для всех государств. Критика индексов сводится в частности к тому, что реальный уровень коррупции замерить очень сложно в силу ее скрытого характера, а мнения экспертов субъективны. Информация очень удобно представлена в рейтингах, интерактивных графиках, диаграммах и картах. Аналитические доклады Transparency International можно скачать в формате PDF. |
2 | Рейтинги демократии (Freedom House) | Рейтинги, составленные Freedom House, оценивают уровень свободы и демократии в странах мира. Freedom House работает над следующими проектами: «Свобода в мире», «Свобода прессы», «Интернет-свободы», «Переходные нации», «Страны на перепутье». Объективность рейтингов критикуется в связи с тем, что независимая организация в значительной степени финансируется правительством США. Критике подвергаются также пренебрежение статистическими данными и субъективность экспертных оценок. Шкала сравнения одномерна и не позволяет учитывать национальную специфику. Достоинством рейтингов является то, что опытные эксперты могут дать достаточно глубокий и качественный анализ исследуемой проблемы. Информация представлена в виде карт, рейтингов, страновых отчетов, эссе, таблиц и графиков. Все данные можно скачать в форматах PDF и HTML. |
3 | Индекс трансформации фонда им. Бертельсманна (Bertelsmann Stiftung) | Индекс трансформации дает сравнительный анализ уровня развития демократии и рыночной экономики, качества политического управления в 128 странах. В рамках индекса трансформации выпускаются два обновляемых рейтинга: статусный индекс и индекс управления. Данные представлены в форме рейтингов, страновых отчетов и интерактивного «Атласа трансформации». Все данные скачиваются в форматах EXCEL и PDF. |
4 | Индекс политики (Polity IV Project) | Индекс политии оценивает динамику политических режимов 164 независимых государств с населением не менее 500 тыс. человек за временной период 1800–2010. В данном случае под «политией» понимается определенное состояние политического режима, характеризующееся соотношением автократических и демократических черт. Преимущество проекта в том, что он позволяет анализировать различные политические режимы в глобальном масштабе. Все выводы поддаются верификации, поскольку используемые переменные отражают характеристики формальных институтов. Обширный временной анализ дает уникальную информацию о циклах и тенденциях политической динамики. В то же время универсальность проекта приводит к абстрактности переменных и выводов. Информация представлена в графиках, таблицах и аналитических докладах. Страновые графики фиксируют различные состояния режима, а также исторические события, которые связаны с открытыми конфликтами, конфронтацией, применением насилия. Данные можно скачивать в форматах PDF, EXCEL, а также есть возможность создавать собственные графики в легко скачиваемых SPSS файлах. |
5 | Индекс экономической свободы (The Heritage Foundation and The Wall Street Journal) | Индекс экономической свободы для 183 стран мира ежегодно рассчитывается фондом Heritage совместно с газетой Wall Street Journal. Индекс анализирует 10 основных показателей — от прав собственности до свободы торговли. Экономическое развитие страны привязано к динамике индекса. Информация очень удобно представлена в рейтингах, графиках и диаграммах и сопровождается сравнением индекса страны с показателями в прошлом году и индексом в других странах региона. Все данные скачиваются в формате PDF. |
6 | Индекс развития человеческого потенциала (UNDP) | Индекс развития человеческого потенциала — составной индекс, ежегодно рассчитываемый Программой развития ООН. Индекс измеряет уровень жизни, грамотности, образованности и продолжительности жизни как основных характеристик человеческого потенциала. В соответствии со значением индекса происходит классификация стран по уровню развития. Положенная в основу индекса официальная статистика делает его относительно объективным. Одним из недостатков индекса является то, что при его расчете не учитываются политические и культурные характеристики страны. Данные скачиваются в формате PDF. |
7 | Глобальный индекс миролюбия (Institute for Economics and Peace) | Глобальный индекс миролюбия характеризует миролюбие стран и регионов. Индекс был разработан международными экспертами из Института мира совместно с центром мира и изучения конфликтов Университета Сиднея. Индекс учитывает как внутренние факторы — например, уровень насилия в стране и преступность, так и внешние — международные отношения страны, расходы на военные нужды. Индекс критикуется за отсутствие дополнительных индикаторов, оценивающих, например, уровень насилия в ряде стран по отношению к женщинам и детям. Также критике подвергается субъективность некоторых данных и несовместимость ряда компонентов, из которых составляется рейтинг. Рейтинги и аналитические доклады скачиваются в формате PDF. |
8 | Индекс демократии (Economist Intelligence Unit) | При составлении классификации учитываются 60 разных показателей, сгруппированных по 5 категориям: выборы и плюрализм, гражданские свободы, деятельность правительства, политическая ангажированность населения и политическая культура. Отчет доступен для скачивания в формате PDF, необходима бесплатная регистрация. |
9 | Индекс вовлеченности стран в международную торговлю (Всемирный экономический форум) | Исследование вовлеченности стран в международную торговлю измеряет эффективность работы различных учреждений и политику государств в сфере ведения международной торговли и развития экономического сотрудничества. Публикация докладов была начата в 2008 году в рамках Программы по вовлеченности в международную торговлю. Исследование публикуется каждые два года и оценивает способности экономик стимулировать торговлю, а также уделяет внимание тем областям, в которых особенно необходимы меры по улучшению ситуации. В рамках исследования аналитическая группа ВЭФ составляет рейтинг государств на основе анализа четырех основных показателей открытости их экономик для международной торговли: доступ к внутреннему рынку, административное управление на границах, деловой климат, а также транспортная и коммуникационная инфраструктура. При подсчете индекса используются статистические данные международных организаций, а также результаты ежегодно составляемого ВЭФ «Обзора мнений менеджеров» (Executive Opinion Survey). |
10 | Индекс процветания стран мира (Legatum Institute) | Индекс процветания стран мира Института Legatum (The Legatum Prosperity Index) — комбинированный показатель, который измеряет достижения стран мира с точки зрения их благополучия и процветания. Выпускается с 2006 года британским аналитическим центром The Legatum Institute (подразделение международной инвестиционной группы Legatum). Цель исследования — изучение общественного благополучия и его развитие в глобальном масштабе. Индекс составляется на основе различных 79 показателей, объединенных в восьми категориях, которые отражают различные аспекты жизни общества и параметры общественного благосостояния: экономика, предпринимательство, управление, образование, здравоохранение, безопасность, личные свободы, социальный капитал. Рейтинг каждой страны определяется путем вычисления средневзвешенного значения указанных индикаторов, каждый из которых определяется в качестве основы процветания. Показатели базируются на статистическом анализе, социологических исследованиях и экспертных оценках участников опроса. Статистические данные, используемые в рейтинге, получены из Организации Объединенных Наций, Всемирного банка, Организации экономического сотрудничества и развития, Всемирной торговой организации, Gallup, Economist Intelligence Unit, IDC, Pyramid Research и других институтов. |
11 | Индекс свободы прессы Агентства «Репортеры без границ» (Reporters Without Borders) | Рейтинг стран основан на индивидуальном опросе журналистов, юристов, активистов общественных движений, корреспондентов и партнерских организациях разных стран. Опрос включает в себя данные о прямых атаках на журналистов, а также о косвенных угрозах свободы прессы. Чем меньше значение индекса, тем выше свобода прессы в той или иной стране. В силу своей специфики, а именно индивидуального восприятия, позиции стран в рейтингах разных лет могут сильно различаться. |
12 | Индекс уровня глобализации городов (Global Cities Index) | Индекс составляется политологическим журналом Foreign Policy совместно с консалтинговой компанией A. T. Kearney и исследовательским институтом The Chicago Council on Global Affairs. Данный индекс включает в себя следующие показатели: 1. уровень деловой активности 2. человеческий капитал 3. информационный обмен. 4. культурный уровень 5. политический вес. Данные доступны как для просмотра на сайте, так и для скачивания в формате PDF. |
13 | Глобальный индекс инноваций (Global Innovation Index) | Рейтинг стран по уровню инновационности экономики, подготовленный Всемирной организацией интеллектуальной собственности (ВОИС) и международной бизнес-школой INSEAD. За основу берутся две категории анализа: 1. располагаемые ресурсы и условия для проведения инноваций (институты, человеческий капитал и исследования, инфраструктура, развитие внутреннего рынка, развитие бизнеса) 2. достигнутые практические результаты осуществления инноваций (развитие технологий и экономики знаний, результаты креативной деятельности). Отчет доступен для скачивания в формате PDF. |
14 | Индекс экономики знаний Европейского банка реконструкции и развития | Индекс экономики знаний оценивает насколько инновации и знания в целом востребованы в экономике той или иной страны. Оцениваются 46 стран Европы и Азии |
15 | Индекс Глобализации (Globalization Index) | Индекс составлен консалтинговой компанией A.T. Kearney. Индекс базируется на сложном сочетании таких факторов, как размер ВВП, объем прямых иностранных инвестиций, внешнеторговые операции, участие страны в миротворческих операциях, количество пользователей сети Интернет, объем Интернет-траффика, и т.д. Ежегодный отчет доступен для скачивания в формате PDF. |
16 | Индекс надежности прямых иностранных инвестиций (Foreign Direct Investment Confidence Index) | Индекс составляется консалтинговой компанией A.T. Kearney, на основе опроса руководителей крупнейших мировых компаний и показывает уровень доверия глобальных частных инвесторов к той или иной экономике. |
17 | Индекс глобальных услуг (Global Services Location Index) | Индекс составляется консалтинговой компанией A.T. Kearney и показывает 50 стран, с наилучшими условиями для аутсорсинга отдельных участков производства. За основу берутся такие показатели, как финансовая привлекательность, рабочая сила (численность и навыки), условия ведения бизнеса. |
18 | Индекс Глобализации Швейцарского федерального технологического института Цюриха | Индекс оценивает параметры глобализации той или иной страны по трем основным категориям: экономическая, социальная и политическая глобализация. В качестве основных показателей берутся текущие финансовые потоки, действующие в разных странах мира экономические ограничения, информационные потоки, личные контакты граждан и межкультурное взаимодействие. Данные доступны в период с 1970 по 2011 год по 158 странам, можно сравнивать несколько государств в таблицах или диаграммах. Данные доступны для скачивания в формате Excel. |
19 | Индекс ведения бизнеса Всемирного Банка (Doing Business) | Глобальное исследование Всемирного банка и сопровождающий его рейтинг стран мира по показателю создания ими условий ведения бизнеса. В рамках проекта оцениваются и отслеживаются изменения нормативно-правовых актов, регулирующих деятельность местных, прежде всего малых и средних компаний, на протяжении всего их жизненного цикла — от создания и до ликвидации. Рейтинг составляется на основании 10 индикаторов регулирования предпринимательской деятельности, учитывающих время и стоимость выполнения предпринимателем требований государства по регистрации нового предприятия, деятельности предприятия, ведению торговых операций, обеспечению исполнения контрактов, налогообложению и закрытию предприятия. Каждый индикатор имеет равный вес. При этом не учитываются такие переменные, как макроэкономическая политика, качество инфраструктуры, квалификация рабочей силы, колебания валютных курсов, мнения инвесторов, безопасность и уровень коррупции. Таким образом, условия организации и ведения бизнеса рассматриваются без учета политических аспектов, исключительно на уровне законодательных положений и нормативов. |
20 | Индекс религиозности Gallup | Международный индекс религиозности, подготовленный агентством Gallup International на основе опросов общественного мнения, выполненных официальными представителями/партнерами компании в странах мира. Показывает процент населения, причисляющих себя к той или иной конфессии, а также число активных верующих и атеистов. Отчет доступен для скачивания в формате PDF. |
21 | Индекс восприятия «Запад-исламский мир» | Исследование подразделения Gallup Internationalв Абу-Даби показывает, как воспринимают друг друга общества западных и мусульманских стран. Отчет доступен для скачивания в формате PDF. |
22 | Сервис Google Public Data | Интересный сервис интегрирует статистические данные по различным аспектам международных отношений из 77 источников, как международных, так и страновых. Одной из особенностей сервиса является возможность представить данные в удобном виде (график, точечная диаграмма, диаграммы рассеивания, точечная диаграмма с политической картой мира). |
23 | Индекс глобальной конкурентоспособности Всемирного экономического форума | Данный индекс отражает условия ведения бизнеса и общую конкурентоспособность экономик 140 стран мира. Одной из отличительных черт является наличие отдельных индикаторов для факторов, препятствующих повышению конкурентоспособности экономики. Отчет по странам можно скачать в формате PDF или MSExcel, также можно скачать полный отчет по проведенному исследованию. |
24 | Индекс международной безопасности International Security Index (iSi) | Данный индекс, иногда называемый «Dow-Jones глобальной безопасности» является совместным проектом исследовательского «ПИР-центра» и издательства «Коммерсант». Данный индекс является универсальным индикатором глобальной безопасности и показывает, насколько международная ситуация с точки зрения безопасности отличается от идеальной (принятой, в соответствии с разработанной методологией, за 4210 пунктов) на каждый конкретный момент его определения. Целью iSi является разработка количественного исчисления динамики общемировых процессов, объединенных понятием «международная безопасность». Он также показывает, как международная безопасность меняется под воздействием различных факторов военного и невоенного характера. |
Рейтинги
№ | Название | Аннотация |
---|---|---|
1 | Рейтинги агентства Standard&Poor’s | Кредитный рейтинг выражает мнение Standard&Poor’s относительно кредитоспособности эмитента в целом либо его способности и готовности своевременно и в полном объеме выполнять конкретные финансовые обязательства. За последнее время кредитные рейтинги завоевали широкое признание инвесторов как удобный инструмент дифференциации качества кредитоспособности. Доступны кредитные рейтинги как для государств, так и для отдельных компаний. По ссылке доступны данные для домашнего региона. Чтобы посмотреть данные для других стран необходимо выбрать другой регион в панели выбора. Для доступа к данным необходимо пройти бесплатную регистрацию. |
2 | Рейтинги агентства Fitch Ratings | Как и S&P, Fitch Ratings является одним из 3 рейтинговых агентств, мнение которых подчас оказывает решающее значение на всю мировую экономику. Доступны кредитные рейтинги как для государств, так и для наднациональных финансовых организаций. Для получения доступа к данным необходима регистрация на сайте. |
3 | Рейтинги агентства «Эксперт РА» | Российское издательство «Эксперт» предоставляет финансово-экономическую аналитику, которой занимается рейтинговое агентство «Эксперт РА». Для получения доступа к данным необходима регистрация на сайте. Данные доступны только для российских регионов, муниципальных образований и компаний, осуществляющих свою деятельность в РФ. |
4 | Рейтинги издания Financial Times | Ежегодное исследование крупнейших компаний мира изданием “Financial Times”. Критерием оценки выступает рыночная капитализация компании. Данные доступны в нескольких форматах: глобальный рейтинг компаний, рейтинг по странам (500 крупнейших компаний для США, Соединенного Королевства Великобритании и Северной Ирландии, Японии, Европы и развивающихся стран), рейтинг по отраслям, по доле занимаемого рынка, а также по времени входа на рынок. Для просмотра отчета необходима бесплатная регистрация на сайте. Текущий годовой отчет можно найти, в строке поиска (FTGlobal 500). Отчет доступен для скачивания в формате PDF. |
5 | Рейтинги журнала Forbes | Рейтинг крупнейших частных компаний журнала Forbes. Оценка производится на основе сложного индикатора, включающего объем продаж, прибыль, стоимость активов и рыночную капитализацию. |
6 | Рейтинги журнала Fortune | Рейтинг крупнейший мировых компаний из расчета выручки. Также можно посмотреть присутствие компаний в странах мира, а также географическое распределение прибыли по государствам и регионам. |
7 | Рейтинги компании Bentley Systems | Компания Bentley Systems публикует ежегодные отчеты о крупнейших собственниках инфраструктурных объектов по всему миру, включая государственные и негосударственные структуры. |
8 | Рейтинг наукоемких экономик Национального комитета по науке США (Национальный научный фонд США) | Сравнительный анализ международных затрат на научную деятельность (научные исследования и опытно-конструкторские разработки). Сравнение проводится по таким критериям, как интенсивность НИОКР, исследования по отраслям экономики и источнику финансирования, приоритеты государственных научно-исследовательских программ и частных научно-исследовательских программ, поддержка университетских и академических исследований со стороны бизнес-структур. Данные доступны для скачивания в формате PDFи MSExcel. |
9 | Страновые рейтинги проекта «Политический атлас современности» | Российский исследовательский проект «Политический атлас современности» классифицирует 192 страны мира по таким показателям, как: 1. Индекс государственности 2. Индекс внешних и внутренних угроз 3. Индекс потенциала международного влияния 4. Индекс качества жизни 5. Индекс институциональных основ демократии Индексы отличаются высокой степенью проработанности. |
10 | Индекс «Верховенства права» (“The Rule of Law Index”) | Индекс подготовлен международной некоммерческой организацией The World Justice Project. Индекс рассматривает то, насколько страны мира следуют принципам верховенства закона и защиты прав человека в своей внутренней политике. Данные доступны для скачивания в форматах MS Excel и PDF, а также могут быть представлены в формате интерактивной карты мира. |
11 | Рейтинг несостоятельности государства (Failed States Index) | Рейтинг составлен двумя ведущими исследовательскими и аналитическими организациями США – Фондом мира (The Fund for Peace) и журналом Foreign Policy. Рейтинг отражает способность (и неспособность) властей контролировать целостность территории, а также демографическую, политическую и экономическую ситуацию в стране. |
12 | Индекс свободы прессы Global Press Freedom (Freedom House) | Данный индекс оценивает степень свободы печатных, вещательных и онлайновых средств массовой информации в каждой стране мира. За основание анализа берутся оценки таких критериев, как свобода слова, степень правительственного контроля над СМИ, условия работы журналистов в стране, случаи применения насилия по отношению к журналистам, экономическая и политическая ситуация в стране, и так далее |
13 | Рейтинг конкурентоспособности стран мира (The World Competitiveness Yearbook) | Рейтинг составляется одним из ведущих европейских исследовательских центров – Институтом менеджмента (Institute of Management) в Лозанне (Швейцария). Под конкурентоспособностью страны Институт менеджмента понимает способность национальной экономики создавать и поддерживать среду, в которой возникает конкурентоспособный бизнес. |
14 | Рейтинг Brand Finance Nation Brands 100 | Рейтинг национальных брендов по версии британской транснациональной консалтинговой компании Brand Finance представляет собой 100 стран мира, ранжированных по силе влияния и ценности их «торговой марки». |
15 | Рейтинг репутации стран мира (The Country Rep Trak) | Рейтинг репутации стран мира (The Country Rep Trak) — рейтинг стран и территорий мира по показателю их репутации. Выпускается международной консалтинговой компанией Reputation Institute, которая специализируется в сфере исследований, аудита и управления репутацией. На сегодняшний день является единственным периодическим аналитическим рейтингом, оценивающим репутацию различных стран мира. |
16 | Международный индекс развития Интернета (The Web Index) | Индекс развития Интернета разработан World Wide Web Foundation в 2012 году под руководством Тимоти Бернерса-Ли (Tim Berners-Lee), который является создателем концепции Всемирной паутины, включая протокол HTTP, язык HTML и идентификаторы URI в 1989–1990 годах. Авторы исследования считают, что уровень развития Интернета сегодня является важным показателем общественного развития. Предполагается, что индекс может использоваться государствами в качестве инструмента для проведения анализа проблемных моментов в их политике и осуществления мониторинга своего прогресса в области внедрения интернет-технологий. Индекс измеряет уровень развития и влияния Интернета на общество по различным параметрам, объединенным в три основные группы: 1. Web Readiness. Оценка уровня развития и качества коммуникационной инфраструктуры в стране, а также развития институциональной инфраструктуры и ее регуляторных аспектов. 2. Web Use. Оценка уровня и интенсивности использования Интернета в стране. 3. Impact of the Web. Оценка социальных, экономических и политических показателей развития государства в контексте влияния на них Интернета. |
17 | Глобальный индекс терроризма (Global Terrorism Index) | Данный индекс разработан Институтом экономики и мира (Institute for Economics and Peace) и является первым индексом, который измеряет влияние такого явления, как международный терроризм в 158 странах за последние 10 лет, как на международные, так и на внутриполитические процессы отдельных государств. |
18 | Индекс глобальной конкурентоспособности городов (The Global City Competitiveness Index) | Индекс разработан командой исследователей Economist Intelligence Unit и аналитическим подразделением Citi Group и направлен на сравнительный анализ конкурентоспособности и развития 120 крупнейших мировых городов и агломераций. |
19 | Рейтинг стран мира по уровню развития электронного правительства (исследование ООН) | Данный рейтинг, подготовленный Организацией Объединенных Наций, оценивает готовность и возможности национальных государственных структур в 190 странах в использовании информационно-коммуникационных технологий (ИКТ) для предоставления гражданам государственных услуг. |
20 | Рейтинги Sovereign Wealth Funds Institute | Институт специализируется на изучении т.н. «суверенных фондов» или «фондов национального благосостояния», весьма распространенном механизме государственного инвестирования сверхдоходов от т.н. природной ренты. В рамках данного проекта составляется рейтинг крупнейших суверенных фондов, а также анализируется структура и формы их инвестирования. |
Прошедший опрос
-
Увеличение количества мусора 228 (66.67%) Вырубка лесов 214 (62.57%) Загрязнение воды 186 (54.39%) Загрязнение воздуха 153 (44.74%) Проблема захоронения ядерных отходов 106 (30.99%) Истощение полезных ископаемых 90 (26.32%) Глобальное потепление 83 (24.27%) Сокращение биоразнообразия 77 (22.51%) Звуковое загрязнение 25 (7.31%)
Рассмотрим инструмент Описательная статистика, входящий в надстройку Пакет Анализа. Рассчитаем показатели выборки: среднее, медиана, мода, дисперсия, стандартное отклонение и др.
Задача
описательной статистики
(descriptive statistics) заключается в том, чтобы с использованием математических инструментов свести сотни значений
выборки
к нескольким итоговым показателям, которые дают представление о
выборке
.В качестве таких статистических показателей используются:
среднее
,
медиана
,
мода
,
дисперсия, стандартное отклонение
и др.
Опишем набор числовых данных с помощью определенных показателей. Для чего нужны эти показатели? Эти показатели позволят сделать определенные
статистические выводы о распределении
, из которого была взята
выборка
. Например, если у нас есть
выборка
значений толщины трубы, которая изготавливается на определенном оборудовании, то на основании анализа этой
выборки
мы сможем сделать, с некой определенной вероятностью, заключение о состоянии процесса изготовления.
Содержание статьи:
- Надстройка Пакет анализа;
-
Среднее выборки
;
-
Медиана выборки
;
-
Мода выборки
;
-
Мода и среднее значение
;
-
Дисперсия выборки
;
-
Стандартное отклонение выборки
;
-
Стандартная ошибка
;
-
Ассиметричность
;
-
Эксцесс выборки
;
-
Уровень надежности
.
Надстройка Пакет анализа
Для вычисления статистических показателей одномерных
выборок
, используем
надстройку Пакет анализа
. Затем, все показатели рассчитанные надстройкой, вычислим с помощью встроенных функций MS EXCEL.
СОВЕТ
: Подробнее о других инструментах надстройки
Пакет анализа
и ее подключении – читайте в статье
Надстройка Пакет анализа MS EXCEL
.
Выборку
разместим на
листе
Пример
в файле примера
в диапазоне
А6:А55
(50 значений).
Примечание
: Для удобства написания формул для диапазона
А6:А55
создан
Именованный диапазон
Выборка.
В диалоговом окне
Анализ данных
выберите инструмент
Описательная статистика
.
После нажатия кнопки
ОК
будет выведено другое диалоговое окно,
в котором нужно указать:
входной интервал
(Input Range) – это диапазон ячеек, в котором содержится массив данных. Если в указанный диапазон входит текстовый заголовок набора данных, то нужно поставить галочку в поле
Метки в первой строке (
Labels
in
first
row
).
В этом случае заголовок будет выведен в
Выходном интервале.
Пустые ячейки будут проигнорированы, поэтому нулевые значения необходимо обязательно указывать в ячейках, а не оставлять их пустыми;
выходной интервал
(Output Range). Здесь укажите адрес верхней левой ячейки диапазона, в который будут выведены статистические показатели;
Итоговая статистика (
Summary
Statistics
)
. Поставьте галочку напротив этого поля – будут выведены основные показатели выборки:
среднее, медиана, мода, стандартное отклонение
и др.;-
Также можно поставить галочки напротив полей
Уровень надежности (
Confidence
Level
for
Mean
)
,
К-й наименьший
(Kth Largest) и
К-й наибольший
(Kth Smallest).
В результате будут выведены следующие статистические показатели:
Все показатели выведены в виде значений, а не формул. Если массив данных изменился, то необходимо перезапустить расчет.
Если во
входном интервале
указать ссылку на несколько столбцов данных, то будет рассчитано соответствующее количество наборов показателей. Такой подход позволяет сравнить несколько наборов данных. При сравнении нескольких наборов данных используйте заголовки (включите их во
Входной интервал
и установите галочку в поле
Метки в первой строке
). Если наборы данных разной длины, то это не проблема — пустые ячейки будут проигнорированы.
Зеленым цветом на картинке выше и в
файле примера
выделены показатели, которые не требуют особого пояснения. Для большинства из них имеется специализированная функция:
Интервал
(Range) — разница между максимальным и минимальным значениями;
Минимум
(Minimum) – минимальное значение в диапазоне ячеек, указанном во
Входном интервале
(см.статью про функцию
МИН()
);
Максимум
(Maximum)– максимальное значение (см.статью про функцию
МАКС()
);
Сумма
(Sum) – сумма всех значений (см.статью про функцию
СУММ()
);
Счет
(Count) – количество значений во
Входном интервале
(пустые ячейки игнорируются, см.статью про функцию
СЧЁТ()
);
Наибольший
(Kth Largest) – выводится К-й наибольший. Например, 1-й наибольший – это максимальное значение (см.статью про функцию
НАИБОЛЬШИЙ()
);
Наименьший
(Kth Smallest) – выводится К-й наименьший. Например, 1-й наименьший – это минимальное значение (см.статью про функцию
НАИМЕНЬШИЙ()
).
Ниже даны подробные описания остальных показателей.
Среднее выборки
Среднее
(mean, average) или
выборочное среднее
или
среднее выборки
(sample average) представляет собой
арифметическое среднее
всех значений массива. В MS EXCEL для вычисления среднего выборки используется функция
СРЗНАЧ()
.
Выборочное среднее
является «хорошей» (несмещенной и эффективной) оценкой
математического ожидания
случайной величины (подробнее см. статью
Среднее и Математическое ожидание в MS EXCEL
).
Медиана выборки
Медиана
(Median) – это число, которое является серединой множества чисел (в данном случае выборки): половина чисел множества больше, чем
медиана
, а половина чисел меньше, чем
медиана
. Для определения
медианы
необходимо сначала
отсортировать множество чисел
. Например,
медианой
для чисел 2, 3, 3,
4
, 5, 7, 10 будет 4.
Если множество содержит четное количество чисел, то вычисляется
среднее
для двух чисел, находящихся в середине множества. Например,
медианой
для чисел 2, 3,
3
,
5
, 7, 10 будет 4, т.к. (3+5)/2.
Если имеется длинный хвост распределения, то
Медиана
лучше, чем
среднее значение
, отражает «типичное» или «центральное» значение. Например, рассмотрим несправедливое распределение зарплат в компании, в которой руководство получает существенно больше, чем основная масса сотрудников.
Очевидно, что средняя зарплата (71 тыс. руб.) не отражает тот факт, что 86% сотрудников получает не более 30 тыс. руб. (т.е. 86% сотрудников получает зарплату в более, чем в 2 раза меньше средней!). В то же время медиана (15 тыс. руб.) показывает, что
как минимум
у 50% сотрудников зарплата меньше или равна 15 тыс. руб.
Для определения
медианы
в MS EXCEL существует одноименная функция
МЕДИАНА()
, английский вариант — MEDIAN().
Медиану
также можно вычислить с помощью формул
=КВАРТИЛЬ.ВКЛ(Выборка;2) =ПРОЦЕНТИЛЬ.ВКЛ(Выборка;0,5).
Подробнее о
медиане
см. специальную статью
Медиана в MS EXCEL
.
СОВЕТ
: Подробнее про
квартили
см. статью, про
перцентили (процентили)
см. статью.
Мода выборки
Мода
(Mode) – это наиболее часто встречающееся (повторяющееся) значение в
выборке
. Например, в массиве (1; 1;
2
;
2
;
2
; 3; 4; 5) число 2 встречается чаще всего – 3 раза. Значит, число 2 – это
мода
. Для вычисления
моды
используется функция
МОДА()
, английский вариант MODE().
Примечание
: Если в массиве нет повторяющихся значений, то функция вернет значение ошибки #Н/Д. Это свойство использовано в статье
Есть ли повторы в списке?
Начиная с
MS EXCEL 2010
вместо функции
МОДА()
рекомендуется использовать функцию
МОДА.ОДН()
, которая является ее полным аналогом. Кроме того, в MS EXCEL 2010 появилась новая функция
МОДА.НСК()
, которая возвращает несколько наиболее часто повторяющихся значений (если количество их повторов совпадает). НСК – это сокращение от слова НеСКолько.
Например, в массиве (1; 1;
2
;
2
;
2
; 3;
4
;
4
;
4
; 5) числа 2 и 4 встречаются наиболее часто – по 3 раза. Значит, оба числа являются
модами
. Функции
МОДА.ОДН()
и
МОДА()
вернут значение 2, т.к. 2 встречается первым, среди наиболее повторяющихся значений (см.
файл примера
, лист
Мода
).
Чтобы исправить эту несправедливость и была введена функция
МОДА.НСК()
, которая выводит все
моды
. Для этого ее нужно ввести как
формулу массива
.
Как видно из картинки выше, функция
МОДА.НСК()
вернула все три
моды
из массива чисел в диапазоне
A2:A11
: 1; 3 и 7. Для этого, выделите диапазон
C6:C9
, в
Строку формул
введите формулу
=МОДА.НСК(A2:A11)
и нажмите
CTRL+SHIFT+ENTER
. Диапазон
C
6:
C
9
охватывает 4 ячейки, т.е. количество выделяемых ячеек должно быть больше или равно количеству
мод
. Если ячеек больше чем м
о
д, то избыточные ячейки будут заполнены значениями ошибки #Н/Д. Если
мода
только одна, то все выделенные ячейки будут заполнены значением этой
моды
.
Теперь вспомним, что мы определили
моду
для выборки, т.е. для конечного множества значений, взятых из
генеральной совокупности
. Для
непрерывных случайных величин
вполне может оказаться, что выборка состоит из массива на подобие этого (0,935; 1,211; 2,430; 3,668; 3,874; …), в котором может не оказаться повторов и функция
МОДА()
вернет ошибку.
Даже в нашем массиве с
модой
, которая была определена с помощью
надстройки Пакет анализа
, творится, что-то не то. Действительно,
модой
нашего массива значений является число 477, т.к. оно встречается 2 раза, остальные значения не повторяются. Но, если мы посмотрим на
гистограмму распределения
, построенную для нашего массива, то увидим, что 477 не принадлежит интервалу наиболее часто встречающихся значений (от 150 до 250).
Проблема в том, что мы определили
моду
как наиболее часто встречающееся значение, а не как наиболее вероятное. Поэтому,
моду
в учебниках статистики часто определяют не для выборки (массива), а для функции распределения. Например, для
логнормального распределения
мода
(наиболее вероятное значение непрерывной случайной величины х), вычисляется как
exp
(
m
—
s
2
)
, где m и s параметры этого распределения.
Понятно, что для нашего массива число 477, хотя и является наиболее часто повторяющимся значением, но все же является плохой оценкой для
моды
распределения, из которого взята
выборка
(наиболее вероятного значения или для которого плотность вероятности распределения максимальна).
Для того, чтобы получить оценку
моды
распределения, из
генеральной совокупности
которого взята
выборка
, можно, например, построить
гистограмму
. Оценкой для
моды
может служить интервал наиболее часто встречающихся значений (самого высокого столбца). Как было сказано выше, в нашем случае это интервал от 150 до 250.
Вывод
: Значение
моды
для
выборки
, рассчитанное с помощью функции
МОДА()
, может ввести в заблуждение, особенно для небольших выборок. Эта функция эффективна, когда случайная величина может принимать лишь несколько дискретных значений, а размер
выборки
существенно превышает количество этих значений.
Например, в рассмотренном примере о распределении заработных плат (см. раздел статьи выше, о Медиане),
модой
является число 15 (17 значений из 51, т.е. 33%). В этом случае функция
МОДА()
дает хорошую оценку «наиболее вероятного» значения зарплаты.
Примечание
: Строго говоря, в примере с зарплатой мы имеем дело скорее с
генеральной совокупностью
, чем с
выборкой
. Т.к. других зарплат в компании просто нет.
О вычислении
моды
для распределения
непрерывной случайной величины
читайте статью
Мода в MS EXCEL
.
Мода и среднее значение
Не смотря на то, что
мода
– это наиболее вероятное значение случайной величины (вероятность выбрать это значение из
Генеральной совокупности
максимальна), не следует ожидать, что
среднее значение
обязательно будет близко к
моде
.
Примечание
:
Мода
и
среднее
симметричных распределений совпадает (имеется ввиду симметричность
плотности распределения
).
Представим, что мы бросаем некий «неправильный» кубик, у которого на гранях имеются значения (1; 2; 3; 4; 6; 6), т.е. значения 5 нет, а есть вторая 6.
Модой
является 6, а среднее значение – 3,6666.
Другой пример. Для
Логнормального распределения
LnN(0;1)
мода
равна =EXP(m-s2)= EXP(0-1*1)=0,368, а
среднее значение
1,649.
Дисперсия выборки
Дисперсия выборки
или
выборочная дисперсия (
sample
variance
) характеризует разброс значений в массиве, отклонение от
среднего
.
Из формулы №1 видно, что
дисперсия выборки
это сумма квадратов отклонений каждого значения в массиве
от среднего
, деленная на размер выборки минус 1.
В MS EXCEL 2007 и более ранних версиях для вычисления
дисперсии выборки
используется функция
ДИСП()
. С версии MS EXCEL 2010 рекомендуется использовать ее аналог — функцию
ДИСП.В()
.
Дисперсию
можно также вычислить непосредственно по нижеуказанным формулам (см.
файл примера
):
=КВАДРОТКЛ(Выборка)/(СЧЁТ(Выборка)-1) =(СУММКВ(Выборка)-СЧЁТ(Выборка)*СРЗНАЧ(Выборка)^2)/ (СЧЁТ(Выборка)-1)
– обычная формула
=СУММ((Выборка -СРЗНАЧ(Выборка))^2)/ (СЧЁТ(Выборка)-1)
–
формула массива
Дисперсия выборки
равна 0, только в том случае, если все значения равны между собой и, соответственно, равны
среднему значению
.
Чем больше величина
дисперсии
, тем больше разброс значений в массиве относительно
среднего
.
Размерность
дисперсии
соответствует квадрату единицы измерения исходных значений. Например, если значения в выборке представляют собой измерения веса детали (в кг), то размерность
дисперсии
будет кг
2
. Это бывает сложно интерпретировать, поэтому для характеристики разброса значений чаще используют величину равную квадратному корню из
дисперсии – стандартное отклонение
.
Подробнее о
дисперсии
см. статью
Дисперсия и стандартное отклонение в MS EXCEL
.
Стандартное отклонение выборки
Стандартное отклонение выборки
(Standard Deviation), как и
дисперсия
, — это мера того, насколько широко разбросаны значения в выборке
относительно их среднего
.
По определению,
стандартное отклонение
равно квадратному корню из
дисперсии
:
Стандартное отклонение
не учитывает величину значений в
выборке
, а только степень рассеивания значений вокруг их
среднего
. Чтобы проиллюстрировать это приведем пример.
Вычислим стандартное отклонение для 2-х
выборок
: (1; 5; 9) и (1001; 1005; 1009). В обоих случаях, s=4. Очевидно, что отношение величины стандартного отклонения к значениям массива у
выборок
существенно отличается.
В MS EXCEL 2007 и более ранних версиях для вычисления
Стандартного отклонения выборки
используется функция
СТАНДОТКЛОН()
. С версии MS EXCEL 2010 рекомендуется использовать ее аналог
СТАНДОТКЛОН.В()
.
Стандартное отклонение
можно также вычислить непосредственно по нижеуказанным формулам (см.
файл примера
):
=КОРЕНЬ(КВАДРОТКЛ(Выборка)/(СЧЁТ(Выборка)-1)) =КОРЕНЬ((СУММКВ(Выборка)-СЧЁТ(Выборка)*СРЗНАЧ(Выборка)^2)/(СЧЁТ(Выборка)-1))
Подробнее о
стандартном отклонении
см. статью
Дисперсия и стандартное отклонение в MS EXCEL
.
Стандартная ошибка
В
Пакете анализа
под термином
стандартная ошибка
имеется ввиду
Стандартная ошибка среднего
(Standard Error of the Mean, SEM).
Стандартная ошибка среднего
— это оценка
стандартного отклонения
распределения
выборочного среднего
.
Примечание
: Чтобы разобраться с понятием
Стандартная ошибка среднего
необходимо прочитать о
выборочном распределении
(см. статью
Статистики, их выборочные распределения и точечные оценки параметров распределений в MS EXCEL
) и статью про
Центральную предельную теорему
.
Стандартное отклонение распределения выборочного среднего
вычисляется по формуле σ/√n, где n — объём
выборки, σ — стандартное отклонение исходного
распределения, из которого взята
выборка
. Т.к. обычно
стандартное отклонение
исходного распределения неизвестно, то в расчетах вместо
σ
используют ее оценку
s
—
стандартное отклонение выборки
. А соответствующая величина s/√n имеет специальное название —
Стандартная ошибка среднего.
Именно эта величина вычисляется в
Пакете анализа.
В MS EXCEL
стандартную ошибку среднего
можно также вычислить по формуле
=СТАНДОТКЛОН.В(Выборка)/ КОРЕНЬ(СЧЁТ(Выборка))
Асимметричность
Асимметричность
или
коэффициент асимметрии
(skewness) характеризует степень несимметричности распределения (
плотности распределения
) относительно его
среднего
.
Положительное значение
коэффициента асимметрии
указывает, что размер правого «хвоста» распределения больше, чем левого (относительно среднего). Отрицательная асимметрия, наоборот, указывает на то, что левый хвост распределения больше правого.
Коэффициент асимметрии
идеально симметричного распределения или выборки равно 0.
Примечание
:
Асимметрия выборки
может отличаться расчетного значения асимметрии теоретического распределения. Например,
Нормальное распределение
является симметричным распределением (
плотность его распределения
симметрична относительно
среднего
) и, поэтому имеет асимметрию равную 0. Понятно, что при этом значения в
выборке
из соответствующей
генеральной совокупности
не обязательно должны располагаться совершенно симметрично относительно
среднего
. Поэтому,
асимметрия выборки
, являющейся оценкой
асимметрии распределения
, может отличаться от 0.
Функция
СКОС()
, английский вариант SKEW(), возвращает коэффициент
асимметрии выборки
, являющейся оценкой
асимметрии
соответствующего распределения, и определяется следующим образом:
где n – размер
выборки
, s –
стандартное отклонение выборки
.
В
файле примера на листе СКОС
приведен расчет коэффициента
асимметрии
на примере случайной выборки из
распределения Вейбулла
, которое имеет значительную положительную
асимметрию
при параметрах распределения W(1,5; 1).
Эксцесс выборки
Эксцесс
показывает относительный вес «хвостов» распределения относительно его центральной части.
Для того чтобы определить, что относится к хвостам распределения, а что к его центральной части, можно использовать границы μ +/-
σ
.
Примечание
: Не смотря на старания профессиональных статистиков, в литературе еще попадается определение
Эксцесса
как меры «остроконечности» (peakedness) или сглаженности распределения. Но, на самом деле, значение
Эксцесса
ничего не говорит о форме пика распределения.
Согласно определения,
Эксцесс
равен четвертому
стандартизированному моменту:
Для
нормального распределения
четвертый момент равен 3*σ
4
, следовательно,
Эксцесс
равен 3. Многие компьютерные программы используют для расчетов не сам
Эксцесс
, а так называемый Kurtosis excess, который меньше на 3. Т.е. для
нормального распределения
Kurtosis excess равен 0. Необходимо быть внимательным, т.к. часто не очевидно, какая формула лежит в основе расчетов.
Примечание
: Еще большую путаницу вносит перевод этих терминов на русский язык. Термин Kurtosis происходит от греческого слова «изогнутый», «имеющий арку». Так сложилось, что на русский язык оба термина Kurtosis и Kurtosis excess переводятся как
Эксцесс
(от англ. excess — «излишек»). Например, функция MS EXCEL
ЭКСЦЕСС()
на самом деле вычисляет Kurtosis excess.
Функция
ЭКСЦЕСС()
, английский вариант KURT(), вычисляет на основе значений выборки несмещенную оценку
эксцесса распределения
случайной величины и определяется следующим образом:
Как видно из формулы MS EXCEL использует именно Kurtosis excess, т.е. для выборки из
нормального распределения
формула вернет близкое к 0 значение.
Если задано менее четырех точек данных, то функция
ЭКСЦЕСС()
возвращает значение ошибки #ДЕЛ/0!
Вернемся к
распределениям случайной величины
.
Эксцесс
(Kurtosis excess) для
нормального распределения
всегда равен 0, т.е. не зависит от параметров распределения μ и σ. Для большинства других распределений
Эксцесс
зависит от параметров распределения: см., например,
распределение Вейбулла
или
распределение Пуассона
, для котрого
Эксцесс
= 1/λ.
Уровень надежности
Уровень
надежности
— означает вероятность того, что
доверительный интервал
содержит истинное значение оцениваемого параметра распределения.
Вместо термина
Уровень
надежности
часто используется термин
Уровень доверия
. Про
Уровень надежности
(Confidence Level for Mean) читайте статью
Уровень значимости и уровень надежности в MS EXCEL
.
Задав значение
Уровня
надежности
в окне
надстройки Пакет анализа
, MS EXCEL вычислит половину ширины
доверительного интервала для оценки среднего (дисперсия неизвестна)
.
Тот же результат можно получить по формуле (см.
файл примера
):
=ДОВЕРИТ.СТЬЮДЕНТ(1-0,95;s;n)
s —
стандартное отклонение выборки
, n – объем
выборки
.
Подробнее см. статью про
построение доверительного интервала для оценки среднего (дисперсия неизвестна)
.
Содержание
- Использование описательной статистики
- Подключение «Пакета анализа»
- Применение инструмента «Описательная статистика»
- Вопросы и ответы
Пользователи Эксель знают, что данная программа имеет очень широкий набор статистических функций, по уровню которых она вполне может потягаться со специализированными приложениями. Но кроме того, у Excel имеется инструмент, с помощью которого производится обработка данных по целому ряду основных статистических показателей буквально в один клик.
Этот инструмент называется «Описательная статистика». С его помощью можно в очень короткие сроки, использовав ресурсы программы, обработать массив данных и получить о нем информацию по целому ряду статистических критериев. Давайте взглянем, как работает данный инструмент, и остановимся на некоторых нюансах работы с ним.
Использование описательной статистики
Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.
В Экселе существует отдельный инструмент, входящий в «Пакет анализа», с помощью которого можно провести данный вид обработки данных. Он так и называется «Описательная статистика». Среди критериев, которые высчитывает данный инструмент следующие показатели:
- Медиана;
- Мода;
- Дисперсия;
- Среднее;
- Стандартное отклонение;
- Стандартная ошибка;
- Асимметричность и др.
Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.
Подключение «Пакета анализа»
Как уже было сказано выше, инструмент «Описательная статистика» входит в более широкий набор функций, который принято называть Пакет анализа. Но дело в том, что по умолчанию данная надстройка в Экселе отключена. Поэтому, если вы до сих пор её не включили, то для использования возможностей описательной статистики, придется это сделать.
- Переходим во вкладку «Файл». Далее производим перемещение в пункт «Параметры».
- В активировавшемся окне параметров перемещаемся в подраздел «Надстройки». В самой нижней части окна находится поле «Управление». Нужно в нем переставить переключатель в позицию «Надстройки Excel», если он находится в другом положении. Вслед за этим жмем на кнопку «Перейти…».
- Запускается окно стандартных надстроек Excel. Около наименования «Пакет анализа» ставим флажок. Затем жмем на кнопку «OK».
После вышеуказанных действий надстройка Пакет анализа будет активирована и станет доступной во вкладке «Данные» Эксель. Теперь мы сможем использовать на практике инструменты описательной статистики.
Применение инструмента «Описательная статистика»
Теперь посмотрим, как инструмент описательная статистика можно применить на практике. Для этих целей используем готовую таблицу.
- Переходим во вкладку «Данные» и выполняем щелчок по кнопке «Анализ данных», которая размещена на ленте в блоке инструментов «Анализ».
- Открывается список инструментов, представленных в Пакете анализа. Ищем наименование «Описательная статистика», выделяем его и щелкаем по кнопке «OK».
- После выполнения данных действий непосредственно запускается окно «Описательная статистика».
В поле «Входной интервал» указываем адрес диапазона, который будет подвергаться обработке этим инструментом. Причем указываем его вместе с шапкой таблицы. Для того, чтобы внести нужные нам координаты, устанавливаем курсор в указанное поле. Затем, зажав левую кнопку мыши, выделяем на листе соответствующую табличную область. Как видим, её координаты тут же отобразятся в поле. Так как мы захватили данные вместе с шапкой, то около параметра «Метки в первой строке» следует установить флажок. Тут же выбираем тип группирования, переставив переключатель в позицию «По столбцам» или «По строкам». В нашем случае подходит вариант «По столбцам», но в других случаях, возможно, придется выставить переключатель иначе.
Выше мы говорили исключительно о входных данных. Теперь переходим к разбору настроек параметров вывода, которые расположены в этом же окне формирования описательной статистики. Прежде всего, нам нужно определиться, куда именно будут выводиться обработанные данные:
- Выходной интервал;
- Новый рабочий лист;
- Новая рабочая книга.
В первом случае нужно указать конкретный диапазон на текущем листе или его верхнюю левую ячейку, куда будет выводиться обработанная информация. Во втором случае следует указать название конкретного листа данной книги, где будет отображаться результат обработки. Если листа с таким наименованием в данный момент нет, то он будет создан автоматически после того, как вы нажмете на кнопку «OK». В третьем случае никаких дополнительных параметров указывать не нужно, так как данные будут выводиться в отдельном файле Excel (книге). Мы выбираем вывод результатов на новом рабочем листе под названием «Итоги».
Далее, если вы хотите чтобы выводилась также итоговая статистика, то нужно установить флажок около соответствующего пункта. Также можно установить уровень надежности, поставив галочку около соответствующего значения. По умолчанию он будет равен 95%, но его можно изменить, внеся другие числа в поле справа.
Кроме этого, можно установить галочки в пунктах «K-ый наименьший» и «K-ый наибольший», установив значения в соответствующих полях. Но в нашем случае этот параметр так же, как и предыдущий, не является обязательным, поэтому флажки мы не ставим.
После того, как все указанные данные внесены, жмем на кнопку «OK».
- После выполнения этих действий таблица с описательной статистикой выводится на отдельном листе, который был нами назван «Итоги». Как видим, данные представлены сумбурно, поэтому их следует отредактировать, расширив соответствующие колонки для более удобного просмотра.
- После того, как данные «причесаны» можно приступать к их непосредственному анализу. Как видим, при помощи инструмента описательной статистики были рассчитаны следующие показатели:
- Асимметричность;
- Интервал;
- Минимум;
- Стандартное отклонение;
- Дисперсия выборки;
- Максимум;
- Сумма;
- Эксцесс;
- Среднее;
- Стандартная ошибка;
- Медиана;
- Мода;
- Счет.
Если какие-то из вышеуказанных данных для конкретного вида анализа не нужны, то их можно удалить, чтобы они не мешали. Далее производится анализ с учетом статистических закономерностей.
Урок: Статистические функции в Excel
Как видим, с помощью инструмента «Описательная статистика» можно сразу получить результат по целому ряду критериев, которые в ином случае рассчитывались с применением отдельно предназначенной для каждого расчета функцией, что заняло бы значительное время у пользователя. А так, все эти расчеты можно получить практически в один клик, использовав соответствующий инструмент — Пакета анализа.
Еще статьи по данной теме: