Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ
Материал из MachineLearning.
м (→Оценки) |
м (→Оценки) |
||
(60 промежуточных версий не показаны.) | |||
Строка 2: | Строка 2: | ||
= Оценки = | = Оценки = | ||
{|class = "wide sortable" | {|class = "wide sortable" | ||
- | ! | Студент || №1 (1 б.) || №2 (1 б.) || №3 (2 б.) || Рецензирование №3 (1 б.) || №4 (2 б.) || Рецензирование №4 (1 б.) || Дополнительно || <tex>\sum</tex> | + | ! | Студент || №1 (1 б.) || №2 (1 б.) || №3 (2 б.) || Рецензирование №3 (1 б.) || №4 (2 б.) || Рецензирование №4 (1 б.) || Дополнительно || <tex>\sum</tex> || Оценка |
|- | |- | ||
- | || Старожилец Всеволод || 1 || 1 || 2 || (Рыскина) || || || 2|| | + | || Старожилец Всеволод || 1 || 1 || 2 || 1 (Рыскина) || 2 || 1 (Мангатаев) || 2|| 10 ||10 |
|- | |- | ||
- | || Вялый Евгений || 0.9 || || || (Петров) || || || 2 || | + | || Вялый Евгений || 0.9 || || 1.4 || 0 (Петров) || 1.8 || (Бескровный) || 2 || 6.1 || 6 |
|- | |- | ||
- | || Гончаров Фёдор || 1 || 1 || || (Бескровный)|| || || 4 || | + | || Гончаров Фёдор || 1 || 1 || 2 || (Бескровный)|| 2 || 1 (Старожилец) || 4 || 11 || 10 |
|- | |- | ||
- | || Каледин Станислав || 0.8 || 1 || || (Балицкий) || || || || | + | || Каледин Станислав || 0.8 || 1 || 1.8 || 1 (Балицкий) || || || || 4.6 || 5 |
|- | |- | ||
- | || Капаев Евгений || 1 || 0.9 || || || || || 2|| | + | || Капаев Евгений || 1 || 0.9 || || || 2 || 0 (Вялый) || 2|| 5.9 || 6 |
|- | |- | ||
- | || Коновалов Андрей || 1 || 1 || || (Неклюдов) || || || 4 || | + | || Коновалов Андрей || 1 || 1 || 1.8 || 1 (Неклюдов) || || || 4 || 8.8 || 9 |
|- | |- | ||
- | || Кузнецов Роман || 1 || 1 || || (Шепелев) || || || 2 || | + | || Кузнецов Роман || 1 || 1 || 1.9 || 0 (Шепелев) || 2 || 1 (Трофимов) || 2 || 8.9 || 9 |
|- | |- | ||
- | || Петров Михаил || 0.7|| || || (Хрипко) || || || || | + | || Петров Михаил || 0.7|| || 1.8 || 0 (Хрипко) || 2 || 1 (Соколова) || 2 || 7.5 || 8 |
|- | |- | ||
- | || Хрипко Кирилл || 0.8 || 1 || || 0 (Яшков) || || || || | + | || Хрипко Кирилл || 0.8 || 1 || || 0 (Яшков) || 1.9 || 1 (Капаев) || ||4.7 || 5 |
|- | |- | ||
- | || Шепелев Денис || 1 || 1 || || | + | || Шепелев Денис || 1 || 1 || 1.8 || 1 (Харченко) || || || || 4.8 || 5 |
|- | |- | ||
- | || Вдовина Евгения || 1 || 0.9|| || 0 (Коновалов) || || || || | + | || Вдовина Евгения || 1 || 0.9|| 1.8 || 0 (Коновалов) || 1.8 || 1 (Рыскина) || || 6.5 || 7 |
|- | |- | ||
- | || Воронов Сергей || 1 || 1 || || (Перекрестенко) || || || 4 || | + | || Воронов Сергей || 1 || 1 || 2 || 1 (Перекрестенко) || || || 4 || 9 || 9 |
|- | |- | ||
- | || Гринчук Олег || 1|| 1 || || (Папанов) || || || 2 || | + | || Гринчук Олег || 1|| 1 || 2 || 0 (Папанов) || || || 2 || 6 || 6 |
|- | |- | ||
- | || Катруца Александр || 1 || 1 || 2 || 1 (Пушняков) || || || 4 || | + | || Катруца Александр || 1 || 1 || 2 || 1 (Пушняков) || 2 || 0 (Костин) || 4 || 11 || 10 |
|- | |- | ||
- | || Кащеева Мария || 0.9 || 0.8 || || (Вялый)|| || || || | + | || Кащеева Мария || 0.9 || 0.8 || 1.1 || 1 (Вялый)|| || 0 (Вдовина) ||2 || 5.8 || 6 |
|- | |- | ||
- | || Костин Александр || 0.5 || || || || || || || | + | || Костин Александр || 0.5 || || || || 1.1 || 1 (Хрипко) || || 2.6 || 3 |
|- | |- | ||
- | || Неклюдов Кирилл || 1 || 1 || || (Кащеева)|| || || | + | || Неклюдов Кирилл || 1 || 1 || 2 || 1 (Кащеева)|| || || 4 || 9 || 9 |
|- | |- | ||
- | || Перекрестенко Дмитрий|| 1|| 1 || || (Вдовина) || || || 2|| | + | || Перекрестенко Дмитрий|| 1|| 1 || 2|| 0 (Вдовина) || || || 2|| 6 || — |
|- | |- | ||
- | || Пушняков Алексей || 1 || 1 || 2 || 1 (Старожилец)|| || || 4 || | + | || Пушняков Алексей || 1 || 1 || 2 || 1 (Старожилец)|| 2 || 1 (Довгаль) || 4 || 12 || 10 |
|- | |- | ||
- | || Рыскина Мария || 1 || 1 || || (Довгаль) || || || 2 || | + | || Рыскина Мария || 1 || 1 || 2 || 1 (Довгаль) || 1.5 || 1 (Пушняков) || 2 || 9.5 || 10 |
|- | |- | ||
- | || Яшков Даниил || 1 || 1 || 2 || (Воронов) || || || 4 || | + | || Яшков Даниил || 1 || 1 || 2 || 1 (Воронов) || || || 4 || 9 || 9 |
|- | |- | ||
- | || Бескровный Александр || 0.7|| 0.6 || || (Гончаров)|| || || || | + | || Бескровный Александр || 0.7|| 0.6 || 0 || 1 (Гончаров)|| 0 || 1 (Кузнецов) || || 3.3 || 3 |
|- | |- | ||
- | || Поляков Сергей || || 1 || || (Трофимов) || || || || 1 | + | || Поляков Сергей || || 1 || || 0 (Трофимов) || || || || 1 || — |
|- | |- | ||
- | || Соколова Евгения || 1 || 1 || || || || || 2|| | + | || Соколова Евгения || 1 || 1 || 1.1 || || 2 || 1 (Катруца) || 2|| 8.1 || 8 |
|- | |- | ||
- | || Харченко Наталья || 1|| 1 || 2 || (Кузнецов)|| || || 2|| | + | || Харченко Наталья || 1|| 1 || 2 || 1 (Кузнецов)|| 2 || || 2|| 9 || 9 |
|- | |- | ||
- | || Балицкий Алексей || 1 || 1 || || (Мангатаев) || || || 4 || | + | || Балицкий Алексей || 1 || 1 || 2 || 1 (Мангатаев) || || || 4 || 9 || 9 |
|- | |- | ||
- | || Довгаль Сергей || 1 || 0.9 || || (Поляков) || || || 2 || | + | || Довгаль Сергей || 1 || 0.9 || 1.7 || (Поляков) || 1.7 || 1 (Гончаров) || 2 || 8.3 || 8 |
|- | |- | ||
- | || Трофимов Михаил || 1 || 1 || || | + | || Трофимов Михаил || 1 || 1 || 1.8 || 1 (Катруца) || 8 || (Кащеева) || 2 ||8.8 || 9 |
|- | |- | ||
- | || Папанов Артём || 1 || 1 || || (Гринчук) || || ||2 || | + | || Папанов Артём || 1 || 1 || 1.8 || 1 (Гринчук) || 2 || || 2 || 8.8 || 9 |
|- | |- | ||
- | || Мангатаев Доржи || 0.9 || 1 || || (Каледин) || || || || | + | || Мангатаев Доржи || 0.9 || 1 || 2 || 0 (Каледин) || 2 || 1 (Петров) || || 6.9 || 7 |
|} | |} | ||
* Задание считается сданным на момент получения проверяющим письма с отчётом (и кодом, если это указано в задании), при условии отсутствия необходимости внесения дополнений и исправлений. | * Задание считается сданным на момент получения проверяющим письма с отчётом (и кодом, если это указано в задании), при условии отсутствия необходимости внесения дополнений и исправлений. | ||
Строка 121: | Строка 121: | ||
[[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ/4|Постановки задач]]. | [[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014, ФУПМ/4|Постановки задач]]. | ||
- | Предварительные версии отчётов принимаются до '''23:59 5.05''', финальные, по результатам работы с рецензентом — до '''23:59 | + | Предварительные версии отчётов принимаются до '''23:59 5.05''', финальные, по результатам работы с рецензентом — до '''23:59 14.05'''. |
= Ссылки = | = Ссылки = |
Текущая версия
|
Оценки
Студент | №1 (1 б.) | №2 (1 б.) | №3 (2 б.) | Рецензирование №3 (1 б.) | №4 (2 б.) | Рецензирование №4 (1 б.) | Дополнительно | Оценка | |
---|---|---|---|---|---|---|---|---|---|
Старожилец Всеволод | 1 | 1 | 2 | 1 (Рыскина) | 2 | 1 (Мангатаев) | 2 | 10 | 10 |
Вялый Евгений | 0.9 | 1.4 | 0 (Петров) | 1.8 | (Бескровный) | 2 | 6.1 | 6 | |
Гончаров Фёдор | 1 | 1 | 2 | (Бескровный) | 2 | 1 (Старожилец) | 4 | 11 | 10 |
Каледин Станислав | 0.8 | 1 | 1.8 | 1 (Балицкий) | 4.6 | 5 | |||
Капаев Евгений | 1 | 0.9 | 2 | 0 (Вялый) | 2 | 5.9 | 6 | ||
Коновалов Андрей | 1 | 1 | 1.8 | 1 (Неклюдов) | 4 | 8.8 | 9 | ||
Кузнецов Роман | 1 | 1 | 1.9 | 0 (Шепелев) | 2 | 1 (Трофимов) | 2 | 8.9 | 9 |
Петров Михаил | 0.7 | 1.8 | 0 (Хрипко) | 2 | 1 (Соколова) | 2 | 7.5 | 8 | |
Хрипко Кирилл | 0.8 | 1 | 0 (Яшков) | 1.9 | 1 (Капаев) | 4.7 | 5 | ||
Шепелев Денис | 1 | 1 | 1.8 | 1 (Харченко) | 4.8 | 5 | |||
Вдовина Евгения | 1 | 0.9 | 1.8 | 0 (Коновалов) | 1.8 | 1 (Рыскина) | 6.5 | 7 | |
Воронов Сергей | 1 | 1 | 2 | 1 (Перекрестенко) | 4 | 9 | 9 | ||
Гринчук Олег | 1 | 1 | 2 | 0 (Папанов) | 2 | 6 | 6 | ||
Катруца Александр | 1 | 1 | 2 | 1 (Пушняков) | 2 | 0 (Костин) | 4 | 11 | 10 |
Кащеева Мария | 0.9 | 0.8 | 1.1 | 1 (Вялый) | 0 (Вдовина) | 2 | 5.8 | 6 | |
Костин Александр | 0.5 | 1.1 | 1 (Хрипко) | 2.6 | 3 | ||||
Неклюдов Кирилл | 1 | 1 | 2 | 1 (Кащеева) | 4 | 9 | 9 | ||
Перекрестенко Дмитрий | 1 | 1 | 2 | 0 (Вдовина) | 2 | 6 | — | ||
Пушняков Алексей | 1 | 1 | 2 | 1 (Старожилец) | 2 | 1 (Довгаль) | 4 | 12 | 10 |
Рыскина Мария | 1 | 1 | 2 | 1 (Довгаль) | 1.5 | 1 (Пушняков) | 2 | 9.5 | 10 |
Яшков Даниил | 1 | 1 | 2 | 1 (Воронов) | 4 | 9 | 9 | ||
Бескровный Александр | 0.7 | 0.6 | 0 | 1 (Гончаров) | 0 | 1 (Кузнецов) | 3.3 | 3 | |
Поляков Сергей | 1 | 0 (Трофимов) | 1 | — | |||||
Соколова Евгения | 1 | 1 | 1.1 | 2 | 1 (Катруца) | 2 | 8.1 | 8 | |
Харченко Наталья | 1 | 1 | 2 | 1 (Кузнецов) | 2 | 2 | 9 | 9 | |
Балицкий Алексей | 1 | 1 | 2 | 1 (Мангатаев) | 4 | 9 | 9 | ||
Довгаль Сергей | 1 | 0.9 | 1.7 | (Поляков) | 1.7 | 1 (Гончаров) | 2 | 8.3 | 8 |
Трофимов Михаил | 1 | 1 | 1.8 | 1 (Катруца) | 8 | (Кащеева) | 2 | 8.8 | 9 |
Папанов Артём | 1 | 1 | 1.8 | 1 (Гринчук) | 2 | 2 | 8.8 | 9 | |
Мангатаев Доржи | 0.9 | 1 | 2 | 0 (Каледин) | 2 | 1 (Петров) | 6.9 | 7 |
- Задание считается сданным на момент получения проверяющим письма с отчётом (и кодом, если это указано в задании), при условии отсутствия необходимости внесения дополнений и исправлений.
- Штраф за просрочку сдачи заданий начисляется из расчета 0.1 балла за сутки.
- Для получения зачёта необходимо сдать как минимум два задания: хотя бы одно из первых двух и хотя бы одно из последних двух.
- Балл за рецензирование можно получить только при условии сдачи соответствующего задания.
- Способы получения дополнительных баллов:
- cертификат по курсу Statistical Learning: https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about (первый дедлайн — 21.03) — 2 балла;
- доклад на занятии — 2 балла.
Доклады
- Неклюдов Кирилл. Двухэтапная проверка равенства средних с помощью критериев Стьюдента и Уэлша.
- Балицкий Алексей. Сравнение парных выборок посредством quantile matching functions.
- Воронов Сергей. Почему многие опубликованные исследования неверны.
- Катруца Александр. Статистическое сравнение классификаторов.
- Пушняков Алексей. Взаимосвязи порядковых признаков.
- Яшков Даниил. Определение скрытых зависимостей переменных при анализе зависимостей.
- Коновалов Андрей. Доверительный интервал для .
Задание 1. Исследование свойств одномерных статистических критериев на модельных данных
Необходимо провести исследование одного или нескольких классических критериев проверки статистических гипотез. Интерес представляет поведение достигаемого уровня значимости (p-value) как функции размера выборок и параметров распределения. В соответствии с индивидуальными параметрами задания необходимо указанным способом сгенерировать одну или несколько выборок из заданного распределения, выполнить проверку гипотезы при помощи соответствующего критерия, а затем многократно повторить эту процедуру для различных значений параметров. По результатам расчётов необходимо построить требуемые в задании графики, среди которых могут быть следующие:
- график зависимости достигаемого уровня значимости от значений параметров при однократном проведении эксперимента;
- график зависимости достигаемого уровня значимости одного или двух критериев от значений параметров, усреднённого по большому количеству повторений эксперимента (например, по 1000 повторений);
- график с эмпирическими оценками мощности одного или двух критериев для разных значений параметров.
В качестве оценки мощности принимается доля отвержений нулевой гипотезы среди всех проверок. То есть, если эксперимент повторялся раз для каждого набора значений параметров, и в из случаев гипотеза была отвергнута на некотором фиксированном уровне значимости (примем ), оценкой мощности будет отношение
Необходимо сдать: выполненный в Tex или Microsoft Word отчёт с описанием алгоритма, построенными графиками и выводами (объяснение полученных результатов моделирования, границы применимости критерия и т. д.), а также код на R, Матлабе или Питоне, при запуске которого на экран выводятся графики, соответствующие имеющимся в отчёте.
Пример решения: чувствительность двухвыборочного критерия Стьюдента.
Задание принимается до 23:59 03.03.
Задания 2-4. Работа с реальными данными
Требуется подобрать и применить наилучший статистический метод, позволяющий ответить на вопрос прикладной задачи; обосновать выбор метода, его применимость и оптимальность. Помимо выводов, касающихся математических особенностей решения, необходимо в терминах предметной области сформулировать выводы, которые могли бы быть понятны гипотетическому заказчику-нематематику.
Необходимо сдать: подробный отчёт по проведённому исследованию, содержащий визуализацию исходных данных, описания и выводы каждого этапа анализа — используемые методы, обоснование их применимости, графики.
По заданиям 3 и 4 отчёт каждого студента рецензируется назначенным одногруппником. Задачей рецензента является проверка корректности выбора метода решения, полноты его применения и понятности изложения. Рецензент получает балл, если:
- его собственная работа засчитана;
- либо в рецензируемой работе устранены все недостатки и она принимается с первого раза, либо указан полный список недостатков работы, устранить которые не удалось.
Задание 2. Проверка гипотез
Задание принимается до 23:59 2.04.
Задание 3. Регрессия
Предварительные версии отчётов принимаются до 23:59 20.04, финальные, по результатам работы с рецензентом — до 23:59 28.04.
Задание 4. Прогнозирование
Предварительные версии отчётов принимаются до 23:59 5.05, финальные, по результатам работы с рецензентом — до 23:59 14.05.