ИНСТРУМЕНТЫ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ В МАШИННОМ ОБУЧЕНИИ
СВЕТЛАНА ГОВОР
ФЕДЕРАЛЬНЫЙ ТЬЮТОР ПО ПРОГРАММАМ СОВРЕМЕННЫХ МАТЕМАТИЧЕСКИХ МЕТОДОЛОГИЙ ДЕПАРТАМЕНТА ОБРАЗОВАТЕЛЬНЫХ ПРОГРАММ ДЛЯ ДЕТЕЙ И МОЛОДЕЖИ, ТЕХНОПАРКИ «КВАНТОРИУМ». РУКОВОДИТЕЛЬ СЕКЦИИ ПО МАТЕМАТИЧЕСКОМУ ОБРАЗОВАНИЮ В НАПРАВЛЕНИИ «ИНФОРМАЦИОННАЯ АНАЛИТИКА МГТУ ИМ. Н.Э. БАУМАНА
ОСТРОВ 10−21. ВЛАДИВОСТОК, ОСТРОВ РУССКИЙ
ОБРАЗОВАТЕЛЬНЫЙ ИНТЕНСИВ ДЛЯ ТЕХНОЛОГИЧЕСКИХ ЛИДЕРОВ
Один из самых сложных и нетривиальных моментов в машинном обучении — это создание адекватной, точной математической модели, которая сможет включить в себя значимые факторы и на выходе получить эффективное, оптимальное решение. Эту модель необходимо будет закладывать в любой программный продукт и проводить детальный анализ. Анализ будет настолько качественным, насколько хорошо продуманной окажется математическая модель.

Поэтому необходима детальная проработка предметной области для создания модели, которая описывает реальные процессы.
Разбор примера 1. Полный факторный эксперимент
Подробнее о ПФЭ вы можете прочитать в статье на Википедии
Разбор примера 2
ГДЕ МОЖЕТ ПРИМЕНЯТЬСЯ МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ?


На рисунке изображена метапредметность знаний. Математические методы используются в медицине, инженерии, политологии, финансовом секторе, геодезии и т. д.
ОСНОВНЫЕ ХАРАКТЕРИСТИКИ СТАТИСТИКИ
Нулевая гипотеза (H0): связи между переменными нет, H0: 1 = X̅2.
Альтернативная гипотеза (H1): связь между признаками есть.
Генеральная совокупность — группа объектов, которые интересны исследователю
Выборка — часть генеральной совокупности, доступная для исследования
Наблюдение — измеренный объект
На рисунке проиллюстрировано пояснение к определениям связи генеральной совокупности, выборки и наблюдения.
ПРИМЕРЫ ГИПОТЕЗ
Гипотеза в статистике — научное предположение, которое необходимо проверить и далее принять или отвергнуть.
Нулевая гипотеза (H0): связи между переменными нет, H0: 1 = X̅2.
Альтернативная гипотеза (H1): связь между признаками есть.
Пример — различный уровень подготовки учащихся двух групп к зачетной работе:
H0: Различный уровень подготовки учащихся двух групп к зачетной работе вызван незначительными параметрами, случайными причинами, не влияющими на общий уровень образования (разница в подготовке двух групп студентов равна нулю)
H1: Различный уровень в подготовке к зачетной работе у учащихся двух групп вызван применением педагогами разных методик обучения (разница в подготовке двух групп существенна, и на то есть объяснение
МЕРЫ ИЗМЕНЧИВОСТИ
Размах — разность между максимальным и минимальным значениями
1 3 2 4 3 6 5
R = 6 – 1 = 5
Отклонение — это разность между средним арифметическим и конкретным значением
X̅ - X j
Пример: производственное изделие (гвозди)
МЕРЫ ИЗМЕНЧИВОСТИ
Корреляция — статистическая взаимосвязь двух или более случайных величин.
Пример: cуществует ли взаимосвязь между интеллектом и уровнем дохода:
Виды коэффициентов корреляции:
Коэффициент корреляции Спирмена — мера линейной связи между случайными величинами.
Корреляция Спирмена является ранговой, то есть для оценки силы связи используются не численные значения, а соответствующие им ранги.
Критерий корреляции Пирсона — это метод параметрической статистики, позволяющий определить наличие или отсутствие линейной связи между двумя количественными показателями, а также оценить ее тесноту и статистическую значимость. Другими словами, критерий корреляции Пирсона позволяет определить, есть ли линейная связь между изменениями значений двух переменных. В статистических расчетах и выводах коэффициент корреляции обычно обозначается как rxy или Rxy.
РЕГРЕССИОННЫЙ АНАЛИЗ
Позволяет измерить величину зависимости между какой-то переменной и исходом:
ПРИМЕР МОДЕЛИРОВАНИЯ С ИСПОЛЬЗОВАНИЕМ РЕГРЕССИОННОЙ МОДЕЛИ
Проверка гипотезы адекватности статистической модели при ротатабельном планировании эксперимента
С.А. Говор, Н. И. Сидняев, «Вестник МГТУ». Серия «Естественные науки». 2016. № 1 (64). С. 3−16.
Социальная проблема: дискриминация по половому признаку на рабочем месте. На практике: мужчины зарабатывают больше, чем женщины. Влияющие факторы:
Образование
Производственный стаж
Род занятий
Тип работодателя
Количество реально отработанных часов
В реальности чем обусловлена разница в уровнях заработной платы мужчин и женщин?
Разница в уровне знаний, полученных в ВУЗе
Большие перерывы в стаже работы
Разница в количестве реально отработанных часов
ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ
Это статистическая модель, у которой значение функции является вероятность того, что данное исходное значение принадлежит к определенному классу. Результат содержится в интервале от [0, 1].
Логистическая функция:
Пример
Требуется предсказать эффективность операции по пересадке сердца. Такие операции очень сложны, и результата их проведения может быть только два — пациент жив или умер
Факторы
Возраст, уровень холестерина в крови, давление, группа крови
Результат
Решение о проведении операции — да или нет?
РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА
Исследование ортогональных и ротатабельных планов при планировании эксперимента математическими методами
С.А. Говор в сборнике: «Наука. Технологии. Инновации». Сборник научных трудов: в 9 частях. Под редакцией М.Э. Рояка. 2015. С. 85-88.
t — распределение (Стьюдента) используется для маленьких выборок n < 30
Особенности:
Меньшие выборки порождают больший разброс исходов
Чем больше данных, тем больше степеней свободы
Чем больше степеней свободы, тем больше истинность
С увеличением степеней свободы — нормальное распределение:
#кружковое движение #проектная работа #наставник #детско-взрослый проект #остров10-21 #ДВФУ #фаблаб #инженерный проект #нейронет #нейротехнологии