Корреляционная матрица

Корреляционная матрица показывает коэффициенты корреляции для пар столбцов заданного набора данных. TableTorch поддерживает как коэффициенты Пирсона, так и ранговые коэффициенты Спирмена.

В следующих разделах вычисляются различные варианты корреляционных матриц для набора данных об автомобилях. Видео, представленное ниже, демонстрирует, как использовать TableTorch для создания цветной корреляционной матрицы прямо в электронной таблице.

Смотреть на YouTube: Как построить корреляционную матрицу в Google Таблицах с TableTorch 4:33

Запуск TableTorch

  1. Установите TableTorch для Google Таблиц через Google Workspace Marketplace. Подробнее о начальной настройке.
  2. Нажмите на иконку  TableTorch на правой боковой панели Google Таблиц.

Иконка TableTorch на правой боковой панели Google Таблиц

Коэффициенты Пирсона для каждой пары столбцов

Выберите весь диапазон листа и нажмите пункт меню Матрица корреляций в TableTorch.

Пункт меню «Матрица корреляций» в TableTorch

Нечисловые столбцы будут автоматически отфильтрованы.

Параметры корреляционной матрицы, TableTorch

Нажмите кнопку Вычислить матрицу, чтобы создать новый лист с корреляционной матрицей. Созданная матрица будет выглядеть следующим образом:

Пример корреляционной матрицы, TableTorch

Уже с настройками по умолчанию матрица оказывается весьма полезной. Например, если цель — построить регрессию для прогнозирования значений столбца selling_price, из полученной матрицы можно сделать такие выводы:

  1. selling_price имеет пренебрежимо малую корреляцию со столбцом from trustmark dealer, что говорит о том, что использовать этот признак в регрессии не имеет смысла. То же самое относится к столбцу more than 5 seats.
  2. petrol сильно коррелирует с max torque min RPM, что указывает на то, что в регрессии selling_price имеет смысл использовать только один из этих признаков.
  3. То же самое может быть справедливо для столбцов engine cc и max power bhp.

Настройка

TableTorch можно настроить для создания различных матриц путём редактирования следующих параметров:

Параметры корреляционной матрицы, TableTorch

  • Коэффициент: Пирсона или ранг Спирмена. Если вы хотите применить ранговое масштабирование только к определённым столбцам перед вычислением коэффициентов, используйте отдельную функцию Масштабирование TableTorch перед созданием корреляционной матрицы.
  • Цветовая схема: следует ли и как выделять ячейки созданной матрицы.
  • Выбрать столбцы: по умолчанию TableTorch вычисляет коэффициенты для каждой пары столбцов таблицы. Однако можно выбрать только нужные столбцы в этом разделе.

Ранговые коэффициенты Спирмена для выбранных пар столбцов

Ранговый коэффициент Спирмена — это коэффициент Пирсона, применённый к данным столбцов, масштабированным по рангу. TableTorch использует дробное ранжирование, эквивалентное функции Google Таблиц RANK.AVG(значение, данные, TRUE), т.е. двум одинаковым значениям будет присвоен их средний ранг. Таким образом, созданная корреляционная матрица выявит как нелинейные, так и линейные корреляции. Однако следует отметить, что реализация линейной регрессии в TableTorch не поддерживает автоматическое ранговое масштабирование. Поэтому, если выявлены сильные нелинейные корреляции, рекомендуется использовать отдельную функцию Масштабирование и выполнять регрессию на масштабированных данных.

TableTorch создаёт следующую матрицу с ранговыми коэффициентами Спирмена для выбранных столбцов:

Пример корреляционной матрицы с ранговыми коэффициентами Спирмена, TableTorch

Заключение

Изучив корреляционную матрицу набора данных, можно перейти к линейной регрессии и построить модель для прогнозирования интересующей переменной.

Смотрите также:

Google, Google Таблицы, Google Workspace и YouTube являются товарными знаками Google LLC. Gaujasoft TableTorch не связан с Google и не одобрен компанией Google.

Свяжитесь с нами!

Спасибо, что используете или рассматриваете TableTorch!

Точно и полно ли эта страница описывает соответствующую функцию? Действительно ли всё работает так, как здесь описано, или вы столкнулись с проблемой? Есть ли у вас предложения по улучшению?

Пожалуйста, свяжитесь с нами, если у вас есть вопросы.