Результаты поиска

Материал из MachineLearning.

По запросу «Softmax»

Перейти к: навигация, поиск

Страницы с названием «Softmax» не существует.

Для получения более подробной информации о поиске на страницах проекта, см. справочный раздел.

Ниже показаны 15 результатов, начиная с № 1.


Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)

Нет совпадений в названиях статей

Совпадения в текстах статей

  1. Машинное обучение (курс лекций, К.В.Воронцов) (70 667 байт)
    378: ...аммы [[word2vec]]. Иерархический SoftMax.
  2. Машинное обучение (курс лекций, К.В.Воронцов)/Семестровый курс (27 171 байт)
    200: ... UCB (upper confidence bound). Стратегия Softmax.
  3. Практикум на ЭВМ (317)/Autoencoder (30 048 байт)
    90: ...en.wikipedia.org/wiki/Softmax_activation_function softmax]. Это естественная функция ...
  4. Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Примеры (13 067 байт)
    180: ===Title: Optimal Brain Damage for softmax classifier===
  5. Практикум на ЭВМ (317)/2012-2013/Autoencoder (28 968 байт)
    90: ...en.wikipedia.org/wiki/Softmax_activation_function softmax]. Это естественная функция ...
  6. Словарь терминов машинного обучения (8727 байт)
    66: '''Softmax function''' — функция мягкого м...
  7. Практикум на ЭВМ (317)/2018 (весна) (19 180 байт)
    224: | CBOW, Skip-Gram, Hierarchical softmax, Negative sampling
  8. Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 474, весна 2018 (35 373 байта)
    90: ... Чем отличается gating function от softmax в случае смеси экспертов?
  9. Глубинное обучение (курс лекций)/2019 (7469 байт)
    70: ...s://arxiv.org/abs/1611.01144 A paper about Gumbel-Softmax]
  10. Математические методы прогнозирования (практика, В.В. Стрижов)/Группа 574, осень 2019 (5338 байт)
    73: * Gumbel-Softmax
  11. Математические методы распознавания образов (конференция)/Программа ММРО-20 (43 282 байта)
    122: ...ц, обученных с применением softmax с отступами]
  12. Компьютерное зрение (24 997 байт)
    61: ...ью вероятность (после слоя Softmax). Данная функция нестабиль...
  13. Трансформер (модель) (13 457 байт)
    33: :<tex>\text{Attention}(Q, K, V) = \text{softmax}\!\left(\frac{QK^\top}{\sqrt{d_k}}\right) V.</tex...
    35: ...вращает насыщение функции softmax при большой размерности. М...
  14. Механизм внимания (10 099 байт)
    18: ...енки нормируются функцией softmax:
    32: :<tex>\text{Attention}(Q, K, V) = \text{softmax}\!\left(\frac{QK^\top}{\sqrt{d_k}}\right) V.</tex...
    34: ...с малым градиентом функции softmax при больших значениях скал...
    42: ...), получают <tex>-\infty</tex> перед softmax, что обнуляет соответствую...
    60: ...erformer) — аппроксимация ядра softmax случайными признаками, лин...
  15. Дистилляция моделей (20 701 байт)
    23: ...ощью стандартной функции [[Softmax|софтмакс]]:
    81: * [[Softmax]]

Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)



Искать в пространствах имён:

Показывать перенаправления
Искать
Личные инструменты