Участник:EvgSokolov/Песочница

Материал из MachineLearning.

Перейти к: навигация, поиск

Вычисление концентрации с помощью контрольных проб

Известно, что пробы на днк-микрочипах бывают двух типов: целевые, предназначенные для определения концентрации РНК определенных генов в растворе, и «spike-in»-пробы, комплементарные к последовательностям, отсутствующим в ДНК исследуемого организма. Как правило, «spike-in»-РНК добавляется в раствор в известных концентрациях, и эту информацию можно использовать для настройки модели интенсивности.

Для использования данного метода необходимо несколько чипов с одинаковыми концентрациями целевой РНК, но

Рассматривается модель Ленгмюра, описывающая зависимость интенсивности свечения пробы от концентрации РНК:

 I_{spi} = \left( \frac{a_{sp} c_{si}}{c_{si} + b_{sp}} + d_{sp} \right) \varepsilon_{spi} ,

где i — номер микрочипа, s — номер набора проб, p — номер пробы в наборе, I_{spi} — интенсивность свечения пробы, c_{si} — абсолютная концентрация РНК, соответствующей s-му гену i-го микрочипа, \varepsilon_{spi} — логарифмически нормальная случайная величина с нулевым средним; a_{sp}, b_{sp}, d_{sp} — параметры модели.

Предполагается, что параметры описываются следующей линейной моделью:

 \begin{bmatrix} \log a_{sp} \\ \log b_{sb} \\ \log d_{sp} \end{bmatrix} = \begin{bmatrix} \gamma_A^a & \gamma_C^a & \gamma_G^a \\ \gamma_A^b & \gamma_C^b & \gamma_G^b \\ \gamma_A^d & \gamma_C^d & \gamma_G^d \end{bmatrix} * \begin{bmatrix} n_{A, sp} \\ n_{C, sp} \\ n_{G, sp} \end{bmatrix} + \begin{bmatrix} \beta_1 \\ \beta_2 \\ \beta_3 \end{bmatrix} + \begin{bmatrix} \varepsilon_1 \\ \varepsilon_2 \\ \varepsilon_3 \end{bmatrix} ,

где n_{A, sp}, n_{C, sp}, n_{G, sp} — число нуклеотидов типа A, C и G соответственно на пробе p набора s.

Личные инструменты