【生物信息】调控基因组学 (Regulatory Genomics) 和Deep CNN

news/2024/7/5 8:42:34 标签: cnn, 深度学习, 神经网络, 生物信息

文章目录

  • Regulatory Genomics
    • Biological motivation of Deep CNN
    • Multi-task CNN

来自Manolis Kellis教授(MIT计算生物学主任)的课《人工智能与机器学习》

主要内容就是调控基因组学和深度卷积网络的结合

由于这部分在我学习的课程中内容很少,下面贴出油管链接(这个每节课一个半小时):

教授详细的课1:Deep Learning for Regulatory Genomics - Regulator binding, Transcription Factors TFs

教授详细的课2:Regulatory Genomics - Deep Learning in Life Sciences - Lecture 07 (Spring 2021)

Regulatory Genomics

Biological motivation of Deep CNN

深度序列模型"或"深度位点特异性模型"的特殊类型的深度卷积神经网络(Deep Convolutional Neural Networks,简称 Deep CNNs),它在处理生物序列(如DNA,RNA或蛋白质序列)时,将滤波器初始化为位点特异性评分矩阵(Position-Specific Scoring Matrix,简称PSSM)或其他有生物学意义的模式(motifs)。这种模型的优点是可以利用已有的生物学知识来指导模型的学习,从而加速训练过程,提高模型的准确性。

以下是这种模型的工作流程:

  1. 将生物序列转化为数值型的表示:和之前一样,我们需要将生物序列(如DNA)转化为数值型的表示,常用的方式是独热编码(one-hot encoding)。
  2. 使用生物学意义的滤波器扫描序列:在这个步骤,我们首先将卷积层的滤波器初始化为PSSM或其他有生物学意义的模式(motifs)。这些滤波器会在序列上滑动,根据每个滤波器对应的模式,计算序列在各个位置的匹配程度。(与边缘检测不同的是,这里使用的卷积核(滤波器)是有生物意义的motifs)
  3. 通过ReLU进行阈值化:ReLU(Rectified Linear Unit)是一种常见的激活函数,它对负数输出0,对正数保持不变。这个操作可以增加模型的非线性,使得模型可以学习更复杂的模式。
  4. 最大池化(Max Pooling):这是一种减小序列长度,同时保留关键信息的操作。在卷积神经网络中,池化层通常跟在卷积层后面,用于降低特征的维度和控制过拟合。
  5. 使用逻辑回归预测概率:在所有处理步骤之后,我们可以用一个逻辑回归层(通常是一个全连接层,加上一个sigmoid激活函数)来预测类别。

值得注意的是,虽然我们在开始时将滤波器初始化为PSSM或其他有生物学意义的模式,但在训练过程中,滤波器的参数会被进一步调整,以更好地适应训练数据。这就使得我们既可以利用已有的生物学知识,又可以从数据中学习到新的知识。

Multi-task CNN


http://www.niftyadmin.cn/n/356641.html

相关文章

Windows主机中构建适用于K8S Operator开发环境

基于 win 10 打造K8S应用开发环境 一、wsl子系统安装 在cmd命令行终端或powershell中操作 1.1 确认windows操作系统版本 1.2 开启wsl功能 1.3 wsl配置 PS C:\Users\cpf> wsl提示:适用于 Linux 的 Windows 子系统没有已安装的分发版。可以通过访问 Microsoft St…

Prompt Engineering | 对话聊天prompt

😄 使用LLM来搭建一个定制的聊天机器人,只需要很少的工作量。 ⭐ 本文将讲解如何利用聊天格式与个性化或专门针对特兹那个任务或行为的聊天机器人进行多伦对话。 文章目录 1、提供对话的早期部分,引导模型继续聊天2、示例:构建一个…

深入理解 SOCKS5 代理和网络安全

在当今信息时代,网络安全问题日益突出,对于企业和个人而言,保护隐私和数据安全至关重要。为了达到这一目标,许多人选择使用 SOCKS5 代理服务来保护自己的在线活动。本文将深入探讨 SOCKS5 代理的工作原理、优势以及网络安全方面的…

PIC18F26单片机波特率配置

只需要配置以下三个寄存器: BRGCON1 BRGCON2 BRGCON3 BRGCON10x07; > 0000 0111 BRGCON20x90; > 1001 0000 BRGCON30x42; > 0101 0010 BRGCON1: Sync_Sog (bit7~bit6)1TQ,BRP(bit5~bit0)1 ,则TQ((2*(BRP1))/Fosc16/32M&am…

QT桌面(实现界面的滑动切换)

文章目录 前言一、使用QStackedLayout管理主界面二、重写鼠标处理事件总结 前言 在ARM Linux中使用QT如何实现滑动翻页切换界面的效果呢?在ARM中是没有自带的鼠标的,那么我们如何实现滑动翻页呢?经过测试发现在ARM中运行QT程序也是可以通过重…

03-AJAX-jQuery实现方式

1、$.ajax():用于执行 Ajax 请求的最常用方法。它可以设置请求类型、请求 URL、请求参数等。 $.ajax({type: 请求类型,url: 请求 URL,data: { 请求数据 },dataType: 返回数据类型,beforeSend: function () {},success: function (response) {},error: function (XM…

ubuntu换镜像源(ubuntu换源)

ubuntu换镜像源(ubuntu换源) 文章目录 ubuntu换镜像源(ubuntu换源)1. 备份镜像源文件2. 根据不同 ubuntu 版本设置不同的镜像源2.1 focal 版本镜像源2.2 bionic 版本镜像源2.3 ubuntu 自带源: 参考文献 1. 备份镜像源文…

HTTPS和SSH的区别

这里写目录标题 1.什么是HTTPS?2.什么是SSH?3.两者的区别1.用途不同2.实现方式不同3.加密算法不同4.安全级别不同 4.总结 1.什么是HTTPS? HTTPS是一种网络通信协议,全称为“Hyper Text Transfer Protocol Secure”,即…