иконка discount

Скидка 15% по промокоду

кибер понедельник до 01.12иконка discount
CYBER2025
логотип PurpleSchool
логотип PurpleSchool

Работа с RFR в Python

Автор

Олег Марков

Введение

Random Forest Regressor (RFR) — один из популярных алгоритмов машинного обучения для регрессии, основанный на ансамбле деревьев решений. Он применяется для предсказания числовых значений, устойчив к переобучению и хорошо справляется с разнообразными наборами данных.

В этой статье мы разберемся, как настроить RFR, обучить модель на данных, выполнять предсказания и оценивать её качество в Python с использованием библиотеки scikit-learn.

Если вы хотите детальнее погрузиться в машинное обучение и работу с моделями регрессии — приходите на наш курс Основы Python. На курсе 209 уроков и 34 упражнения, AI-тренажеры для безлимитной практики с кодом и задачами 24/7, решение задач с живым ревью наставника, еженедельные встречи с менторами. Вы освоите работу с RFR и другими алгоритмами машинного обучения.

Установка и подключение библиотек

Для работы с RFR используется библиотека scikit-learn. Установите её, если ещё не сделали:

pip install scikit-learn

Импортируем необходимые модули:

from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
import pandas as pd

Подготовка данных

Предположим, у нас есть набор данных о домах с признаками size, rooms и целевой переменной price:

data = pd.DataFrame({
    "size": [50, 60, 70, 80, 90],
    "rooms": [1, 2, 2, 3, 3],
    "price": [150, 200, 250, 300, 350]
})

X = data[["size", "rooms"]]
y = data["price"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Обучение модели RFR

Создаём объект модели и обучаем:

rfr = RandomForestRegressor(n_estimators=100, random_state=42)
rfr.fit(X_train, y_train)
  • n_estimators — количество деревьев в лесу.
  • random_state — фиксирует случайность для воспроизводимости результатов.

Предсказание и оценка качества

y_pred = rfr.predict(X_test)

# Оценка качества
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print("MSE:", mse)
print("R2 score:", r2)

Настройка гиперпараметров

Основные параметры, которые можно настраивать:

  • max_depth — максимальная глубина дерева.
  • min_samples_split — минимальное количество выборок для разбиения узла.
  • min_samples_leaf — минимальное количество выборок в листе.

Пример:

rfr = RandomForestRegressor(
    n_estimators=200,
    max_depth=5,
    min_samples_split=4,
    random_state=42
)
rfr.fit(X_train, y_train)

Важность признаков

Random Forest позволяет оценить, какие признаки наиболее влияют на предсказания:

import matplotlib.pyplot as plt

importances = rfr.feature_importances_
features = X.columns

plt.bar(features, importances)
plt.title("Feature Importances")
plt.show()

Частые ошибки

  • Передача категориальных признаков без кодирования → ValueError.
  • Неправильное разбиение на train/test → смещенные результаты.
  • Использование слишком малого числа деревьев → нестабильные предсказания.
  • Игнорирование масштабирования для других моделей в пайплайне (не критично для RFR, но важно для смешанных моделей).

Часто задаваемые вопросы

  1. Можно ли использовать RFR для классификации? Нет, для классификации существует RandomForestClassifier.

  2. Как выбрать количество деревьев? Чаще всего используют 100–500 деревьев. Большее количество повышает точность, но увеличивает время обучения.

  3. Нужно ли масштабировать данные для RFR? Нет, алгоритм не чувствителен к масштабам признаков.

  4. Как избежать переобучения? Используйте ограничение глубины дерева (max_depth), минимальное количество выборок на разбиение (min_samples_split) и кросс-валидацию.

Заключение

Random Forest Regressor — мощный инструмент для предсказания числовых значений и работы с разнообразными признаками. В Python его легко использовать через scikit-learn, обучать на данных, делать предсказания и оценивать качество модели. Настройка гиперпараметров и анализ важности признаков позволяет создавать точные и устойчивые модели.

Для системного изучения машинного обучения, работы с RFR и другими алгоритмами Python рекомендую пройти курс Основы Python. В первых 3 модулях уже доступно бесплатное содержание — начните погружаться в мир Python прямо сегодня.

Стрелочка влевоРабота с таблицами в Python с помощью DataFrameРабота с пробелами в PythonСтрелочка вправо

Постройте личный план изучения Python до уровня Middle — бесплатно!

Python — часть карты развития Backend

  • step100+ шагов развития
  • lessons30 бесплатных лекций
  • lessons300 бонусных рублей на счет

Все гайды по Python

Как отправлять запросы с помощью requests в PythonПочему Python выводит значение без команды printКак работает команда print в PythonВозможности Python для автоматизации задачРабота с JSON в Python на примерахPython get — методы получения данныхКак находить и исправлять ошибки в PythonРабота с данными через API и внешние сервисыСтруктура и оформление кода PythonОсновы Django с PythonПолезные приёмы в Python для повседневной работыИспользование locals в Python для отладкиИнтеграция PHP и PythonКак выполнять HTTPS-запросы в PythonКак работать с API в Python
Ввод целого числа в PythonВедение логов в PythonУдаление данных в Python с помощью removeРабота с символами программирования PythonРабота с переменной X в PythonРабота с классами в PythonКак скачать Python на компьютерПростая программа на Python для начинающихОсновы Python для тех, кто начинаетЧто нового в Python 3Поддерживается ли Python 2 и стоит ли его использоватьPython 1 — с чего начиналась история языкаКоманда python print - полное руководство по выводу данныхПравила именования переменных в PythonОсновы Python coreОписание объектов PythonКакой Python выбрать для установкиКак вывести целое число с помощью print в PythonКак установить Python на Windows macOS и LinuxКак пользоваться консолью PythonКак получить последний элемент в PythonКак найти значение в PythonКак настроить PythonКак использовать print для строк в PythonКак работает интерпретатор PythonИнструкция по работе с PythonЦелые числа в Python
Загрузка данных PythonУправление проектами на GitHub с PythonСоздание веб-приложений на Flask PythonСоздание бота на PythonСоздание интерфейсов Python QTСоздание игр с PygameСоздание GUI в PythonКак работать со словарями в PythonРабота с библиотеками через Python PackagingРабота со временем в Python при помощи модуля timePython name — особенности переменнойМатематические операции в Python с модулем mathPython listing — что это и как использоватьОбработка изображений с OpenCV PythonNumPy в Python — основы и применение в задачахМашинное обучение с PythonИспользование Anaconda с PythonБиблиотеки Python и их применение в проектах
Возврат значений из функции в PythonВложенные функции в PythonСоздание собственных декораторов в PythonЦикл while в Python и примеры использованияРабота с функцией map в PythonОбработка чисел, введённых через input в PythonОсновные операторы в Python с примерамиУсловные выражения if else в Python для начинающихКак выполняется вызов функций call в PythonПозиционные и именованные аргументы в PythonОбъявление переменных и управление областью видимости в PythonПередача аргументов по ссылке и по значению в PythonПередача аргументов через args и kwargs в PythonОсновные методы Python и примеры их использованияЛокальные и глобальные переменные в PythonЧасто используемые команды PythonКлючевые слова global и nonlocal в PythonКак создавать функции в PythonКак работает сборщик мусора в PythonКак работает область видимости переменных в PythonКак работает функция callable в PythonКак работает функция any и all в PythonКак проверить тип переменной в PythonКак передать функцию как аргумент в PythonКак использовать функцию isinstance в PythonКак использовать функцию filter в PythonКак использовать функцию filter в PythonКак использовать функцию eval безопасно в PythonКак использовать декораторы в PythonИзменяемые и неизменяемые типы данных в PythonФункции в Python и способы их вызоваФункции как объекты в PythonЧто такое замыкания в PythonЧто делает функция reduce в PythonЧто делает функция id в PythonАргументы по умолчанию в PythonАнонимные функции и lambda в PythonАлгоритмы на Python — примеры и объяснение
Запись данных в PythonУстановка pip в PythonУправление зависимостями requirement в PythonУправление библиотеками с помощью Python PackagingУдаление пробелов с помощью strip в PythonСтруктурирование кода в PythonСоздание исполняемого файла Python в exeРазбор traceback в модуле PythonРазбор site-packages в PythonРазбор Program Files в PythonРабота с системными функциями Python sysРабота с Unicode кодировками в PythonРабота с папкой AppData в PythonРабота с модулем logging в PythonРабота с каталогами в PythonРабота с CSV в PythonВиртуальная среда venv в Python — создание и настройкаКак создать простое приложение на PythonИспользование pip в Python для установки пакетовМодули в Python и организация кода в проектеИмпорт модулей в Python и правила подключенияРабота с файлами в Python пошаговоЧто делает компилятор Python и как он работаетПолучение строки из модуля PythonПодключение файлов в Python с includeПеременные среды в PythonСборка проекта с помощью packaging в PythonНастройка Python сервераИспользование Python на UbuntuИспользование консоли PythonИспользование кодировок в PythonИнициализация пакетов PythonИмпорт модулей PythonИмпорт имен в PythonСреда IDLE Python и базовые возможностиЧтение и запись TXT в PythonЧтение файлов в Python с помощью open file
Удаление элементов из списка PythonТипы данных в Python — обзор и рекомендацииОсновные операции со строками в PythonМетоды str в Python и обработка текстаСписки в Python и их ключевые методыСоздание списков данных в PythonРабота со строками и символами в PythonРабота со столбцами в PythonРабота со списком значений в PythonРабота с таблицами в Python с помощью DataFrameРабота с RFR в PythonРабота с пробелами в PythonРабота с массивами в PythonРабота с кортежами tuple PythonРабота с координатами X и Y в PythonРабота с ключами в PythonРабота с элементами данных PythonРабота с двоичными числами PythonРабота с данными в PythonРабота с данными NumPy PythonРабота с большими числами в PythonРабота с битами в PythonРабота с байтами в PythonЧто такое значение в Python и как его определитьМножества в Python и операции с нимиИспользование range в Python для цикловПроверка на четность в PythonПроверка числа в PythonПреобразование типов в PythonПреобразование списка в строку PythonПреобразование числа в строку в PythonПостроение графиков в PythonОпределение индекса элемента в PythonОкругление чисел в PythonОбъединение списков в Python с помощью zipМножества в PythonМассивы в Python и отличие от списковМассив чисел в PythonКортежи данных в PythonКак вычислить сумму чисел в PythonКак получить остаток от деления в PythonКак найти следующее число в PythonИспользование Unicode в PythonТип int в Python и его особенностиИндекс списка в PythonФункции для работы со строками в PythonЭлементы Python и способы доступа к нимДоступ к элементам массива в PythonДеление чисел в PythonРабота с данными в Python на практикеКак работать с числами в Python
Открыть базу знаний

Лучшие курсы по теме

Иконка молнииНовый
изображение курса

Основы Python

Антон Ларичев
AI-тренажеры
Практика в студии
Гарантия
Бонусы
иконка звёздочки рейтинга5.0
3 999 ₽ 6 990 ₽
Подробнее
изображение курса

Nest.js с нуля

Антон Ларичев
AI-тренажеры
Практика в студии
Гарантия
Бонусы
иконка звёздочки рейтинга4.6
3 999 ₽ 6 990 ₽
Подробнее
изображение курса

Docker и Ansible

Антон Ларичев
AI-тренажеры
Гарантия
Бонусы
иконка звёздочки рейтинга4.8
3 999 ₽ 6 990 ₽
Подробнее

Отправить комментарий