Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 

По завершению модуля - большой отчёт.

Лабораторная 4. Линейная регрессия

Линейная регрессия. Теоретическая часть (1)

Задание

  • Выбор датасетов:
  • Получите и визуализируйте статистику по датасету (включая количество, среднее значение, стандартное отклонение, минимум, максимум и различные квантили).
  • Проведите предварительную обработку данных, включая обработку отсутствующих значений, кодирование категориальных признаков и нормировка.
  • Разделите данные на обучающий и тестовый наборы данных.
  • Реализуйте линейную регрессию с использованием метода наименьших квадратов без использования сторонних библиотек, кроме NumPy и Pandas (для использования коэффициентов использовать библиотеки тоже нельзя). Использовать минимизацию суммы квадратов разностей между фактическими и предсказанными значениями для нахождения оптимальных коэффициентов.
  • Постройте три модели с различными наборами признаков.
  • Для каждой модели проведите оценку производительности, используя метрику коэффициент детерминации, чтобы измерить, насколько хорошо модель соответствует данным.
  • Сравните результаты трех моделей и сделайте выводы о том, какие признаки работают лучше всего для каждой модели.
  • Бонусное задание
    • Ввести синтетический признак при построении модели