Курс состоит из 4 модулей:
1) Знакомство с обобщенными линейными моделями
Обобщенные линейные модели (GLM) позволяют моделировать поведение величин, не подчиняющихся нормальному распределению. Чтобы первые шаги в мире GLM были легче, мы разберем их устройство на примере GLM для нормально распределенных величин - так вы сможете проводить параллели с простыми линейными моделями. Вы узнаете, что такое функция связи, как работает метод максимального правдоподобия и научитесь тестировать гипотезы о GLM при помощи тестов Вальда и тестов отношения правдоподобий.
2) Проблема выбора модели
В этом модуле мы поговорим о методологических проблемах, связанных с построением моделей. Модель есть упрощенное отображение реальности и выбор между разными конкурирующими способами такого упрощения - частая задача аналитика. В этом модуле вы научитесь сравнивать модели при помощи информационных критериев. Мы обсудим основные варианты хода анализа при выборе моделей и поговорим о сложностях, возникающих в связи со скрытой множественностью моделей. Наконец, мы научим вас распознавать основные виды злоупотреблений при выборе моделей (data-fishing, p-hacking).
3) Обобщенные линейные модели для счетных данных
В этом модуле мы обсудим основные методы моделирования счетных величин. Для начала мы обсудим, почему обычные линейные модели не годятся для счетных данных. Свойства счетных распределений помогут вам понять отличия разновидностей GLM для счетных данных и особенности их диагностики. Вы своими глазами увидите работу функции связи, когда будете визуализировать предсказания GLM в масштабе функции связи и в масштабе переменной отклика.
4) Обобщенные линейные модели с бинарным откликом
Иногда возникает необходимость моделировать наступило ли какое-то событие или нет, выиграла ли футбольная команда или проиграла, выздоровел ли пациент после лечения или нет, совершил ли клиент покупку или нет. Для модели рования таких бинарных данных (событий с двумя исходами) не подходят обычные линейные модели, но это легко можно сделать при помощи обобщенных линейных моделей. В этом модуле вы научитесь моделировать вероятности наступления событий, представляя их в виде шансов. Мы разберем, как устроена функция связи логит и как интерпретируются коэффициенты GLM в случае ее применения. Наконец, вы сможете попрактиковаться в анализе обобщенных линейных моделей с разными распределениями, выполнив проект по анализу данных. Результаты этого анализа нужно будет представить в виде отчета в формате html, написанного при помощи rmarkdown/knitr.