Обсуждение:Регрессионная модель

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м
 
Строка 12: Строка 12:
* Два учёных, сидящих за двумя столами друг напротив друга в одной комнате, совершенно независимо друг от друга забили в '''МышиныйЛёрнинг.ру''' две статьи об одном и том же, с разными названиями: [[Регрессионная модель]] и [[Модель зависимости]]. '''Шо делать бум, коллега?''' Надо бы слить… Предлагаю сделать статью '''Модель''', на которую перевести ссылки с обеих.
* Два учёных, сидящих за двумя столами друг напротив друга в одной комнате, совершенно независимо друг от друга забили в '''МышиныйЛёрнинг.ру''' две статьи об одном и том же, с разными названиями: [[Регрессионная модель]] и [[Модель зависимости]]. '''Шо делать бум, коллега?''' Надо бы слить… Предлагаю сделать статью '''Модель''', на которую перевести ссылки с обеих.
— ''[[Участник:Vokov|К. В. Воронцов]] 22:13, 1 мая 2008 (MSD)''
— ''[[Участник:Vokov|К. В. Воронцов]] 22:13, 1 мая 2008 (MSD)''
 +
 +
Тестирование, информационная модель, непрерывность – заменил, спасибо.
 +
 +
Относительно терминологии:
 +
# «Регрессионная модель» — устоявшийся термин, в гугле он встречается '''24,600''' раз и всегда связан с регрессионным анализом. Термин «Регрессионная модель» обозначает фиксированных круг понятий, чем он и хорош.
 +
# «Целевая функция» — устоявшийся термин, встречается '''29,000''' раз. Этот термин невозможно ни игнорировать, ни изменить.
 +
# «Целевая зависимость» — новый термин, лабораторный. В гугле встречается '''39''' раз. Пока этот термин не появится на страницах популярного учебника по анализу данных, он останется лабораторным жаргоном. Этот термин легко спутать с устоявшимся термином «целевая функция», хотя значения этих терминов различны.
 +
# «Модель зависимости» — новый термин, в гугле он встречается '''3,560''' раз в очень разных контекстах: «массовые коммуникации», «энергия ионизации», «экономика» и так далее. Термин также нуждается в проверке временем.
 +
 +
Я стараюсь пользоваться общепризнанными терминами. Хотя признаю, что в создании новых есть что-то благородное.
 +
 +
Если действительно есть необходимость строго разграничить (или связать) термины «математическая модель» и «регрессионная модель», то следует заняться этим. А использование новых слов «классическая математическая модель», «информационная модель» здесь ничего не даст.
 +
 +
Резюме: согласен, можно сделать статью «'''Модель'''», где сослаться на эти две статьи, чтобы не путать их со статьями о математических моделях, моделях в математической логике и моделях в аксиоматическом подходе.
 +
 +
— ''[[Участник:Strijov|В. В. Стрижов]] 22:43, 4 мая 2008 (MSD)''

Текущая версия

Терминологический спор

Терминологический спор — сразу по нескольким пунктам:

  • «теория» — ни разу не видел; «гипотеза» — да.
  • тестированиепроверка статистических гипотез
  • Определение при конечном множестве Y покрывает задачи классификации, которые не принято включать как частный случай регрессии. Более того, видел ли кто-нибудь, чтобы задачами регрессии называлось нечто отличное от случая Y=\mathbb{R} или Y=\mathbb{R}^m? Я видел: ранговая регрессия. А ещё что? Здесь надо бы дать классификацию задач регрессии по типу множества Y.
  • целевая функция здесь — это минимизируемый функционал (средняя ошибка, эмпирический риск); на моих страницах целевая зависимость — это неизвестная восстанавливаемая зависимость, которую мы пытаемся аппроксимировать регрессионной моделью. Так жить нельзя — давай приходить к единой терминологии!
  • «Различают математическую модель и регрессионную модель.» Это просто терминологический кошмар. Страшный сон энци-клопо-вики-педиста. Регрессионная модель тоже является математической моделью. Поэтому нельзя их противопоставлять. Рудаков для этого же ввёл термины «физическая» модель (кавычки являются чатью термина) и информационная модель. Но термин информационная модель неудачен, так как уже занят в области построения баз данных. Шо делать бум? Предлагаю такие термины: Классическая математическая модель и Информационная математическая модель. Длиннее, но зато корректно! Надо ещё сказать, что между ними вообще невозможно провести чёткого различия. Я когда-то стороил модель хроматографического пика. За основу взял уравнение, вытекающее из матфизики, а чтобы лучше подогнать под данные, внутрь этой модели… чего только не вставлял: полиномы, дробно-линейные функции, и т. п., что порой не имело никакой физической интерпретации.
  • В данном тексте термин информационная модель также использован — очевидно, автор неаккуратно вычистил исходный текст после копи-паста!
  • «И регрессионная, и математическая модель задает непрерывное отображение.» С какой стати? Вставка сюда «как правило» примирила бы меня с этой формулировкой…
  • …превращать задачи регрессии в задачи классификации… — крайне некорректное высказывание, даже не хочется объяснять, почему…
  • Два учёных, сидящих за двумя столами друг напротив друга в одной комнате, совершенно независимо друг от друга забили в МышиныйЛёрнинг.ру две статьи об одном и том же, с разными названиями: Регрессионная модель и Модель зависимости. Шо делать бум, коллега? Надо бы слить… Предлагаю сделать статью Модель, на которую перевести ссылки с обеих.

К. В. Воронцов 22:13, 1 мая 2008 (MSD)

Тестирование, информационная модель, непрерывность – заменил, спасибо.

Относительно терминологии:

  1. «Регрессионная модель» — устоявшийся термин, в гугле он встречается 24,600 раз и всегда связан с регрессионным анализом. Термин «Регрессионная модель» обозначает фиксированных круг понятий, чем он и хорош.
  2. «Целевая функция» — устоявшийся термин, встречается 29,000 раз. Этот термин невозможно ни игнорировать, ни изменить.
  3. «Целевая зависимость» — новый термин, лабораторный. В гугле встречается 39 раз. Пока этот термин не появится на страницах популярного учебника по анализу данных, он останется лабораторным жаргоном. Этот термин легко спутать с устоявшимся термином «целевая функция», хотя значения этих терминов различны.
  4. «Модель зависимости» — новый термин, в гугле он встречается 3,560 раз в очень разных контекстах: «массовые коммуникации», «энергия ионизации», «экономика» и так далее. Термин также нуждается в проверке временем.

Я стараюсь пользоваться общепризнанными терминами. Хотя признаю, что в создании новых есть что-то благородное.

Если действительно есть необходимость строго разграничить (или связать) термины «математическая модель» и «регрессионная модель», то следует заняться этим. А использование новых слов «классическая математическая модель», «информационная модель» здесь ничего не даст.

Резюме: согласен, можно сделать статью «Модель», где сослаться на эти две статьи, чтобы не путать их со статьями о математических моделях, моделях в математической логике и моделях в аксиоматическом подходе.

В. В. Стрижов 22:43, 4 мая 2008 (MSD)