Что такое категориальные признаки? Понимаем вещественные признаки в машинном обучении
Категориальные и вещественные признаки - это основные типы данных, которые используются в машинном обучении для описания характеристик объектов. Понимание разницы между этими типами признаков критически важно для правильного построения моделей машинного обучения.
Категориальные признаки представляют собой набор значений, которые могут принимать конечное количество категорий или классов. Эти признаки обычно не имеют порядка между собой, они просто относят объекты к определенным группам или категориям.
Примеры категориальных признаков:
- Цвет: красный, синий, зеленый.
- Тип животного: собака, кошка, птица.
- Марка автомобиля: Toyota, BMW, Ford.
<ol start="2">Вещественные признаки, также известные как количественные признаки или числовые признаки, представляют собой значения, которые находятся на непрерывной числовой шкале. Эти признаки могут быть измерены и имеют смысл в контексте их величины.
Примеры вещественных признаков:
- Возраст: 25 лет, 30 лет, 40 лет.
- Вес: 60 кг, 70 кг, 80 кг.
- Доход: $50000, $60000, $70000.
Пример:
Рассмотрим набор данных о клиентах банка, который включает в себя различные признаки, в том числе категориальные и вещественные. Некоторые из признаков могут быть следующими:
- Имя (категориальный признак): Мария, Иван, Анна.
- Возраст (вещественный признак): 30 лет, 45 лет, 55 лет.
- Доход (вещественный признак): $50000, $75000, $100000.
- Образование (категориальный признак): Высшее, Среднее, Неполное среднее.
- Семейное положение (категориальный признак): Женат/Замужем, Холост/Не замужем, Разведен/Разведена.
В этом примере, "Имя", "Образование" и "Семейное положение" являются категориальными признаками, так как они представляют собой категории или классы, в то время как "Возраст" и "Доход" являются вещественными признаками, так как они представляют собой числовые значения на непрерывной шкале.