单细胞scATAC-seq测序基础知识笔记

news/2024/7/5 8:57:19 标签: 笔记, 生物信息, 数据分析

单细胞scATAC-seq测序基础知识笔记

  • 单细胞ATAC测序前言
  • scATAC-seq数据怎么得出的?

笔记来源于 Costa Lab - Bioinformatics Course

另一篇关于scRNA-seq的请移步

单细胞ATAC测序前言

因为我的最终目的是scATAC-seq的数据,所以这部分只是分享下我刚学的(不是)相关的生物学知识,而且我本身也没有生物学的背景知识,所以我尽量从计算机专业的角度去理解这些内容,数据的介绍下边那一节。

首先是细胞分化,同一来源的细胞可以分化成不同功能和类型的细胞,是因为虽然它们都具有相同的DNA,但是起作用(专业的叫 “基因表达”)部分的DNA是不同的。如下图,DNA长链很多部位是紧缩在一起的,这些就不表达,只有打开链的基因部分才会表达,而我们现在就要获取打开的这部分基因的数据。

在这里插入图片描述

scATAC-seq数据怎么得出的?

接下来的才是重点,首先我们拿到了一堆样本细胞(正常来说应该是切片组织,薄薄一片肉?哈哈),然后使用 TN5酶,这个酶会将打开的基因切断,我们就得到了来自一大堆细胞的一大堆DNA片段。如下图所示,绿色的就是TN5酶,它的红色和蓝色部分相当于剪刀一样,会切断DNA片段。

在这里插入图片描述
如下图,剪开了DNA,得到很多片段

在这里插入图片描述

然后!我们先做一个 alignment(做个对齐吧),这样就能知道各个基因片段相对整条DNA的位置,然后我们统计这些基因片段的位置,如下图下边那条曲线,在某个位置的基因片段越多就形成了一个峰值 (peak calling),当然统计出来在不同位置会有很多个这样的“山峰”,这样我们就知道了峰值位置的基因是关注的重点,然后我们以峰值的最高峰那个位置,为中心,设定这个峰的一个位置范围。

然后再拿着这些峰的位置范围,再回去统计,单个细胞的各个DNA片段,看有哪些片段落在了哪个峰的范围内,最后就得到一个统计矩阵。

在这里插入图片描述

scATAC-seq矩阵数据如下图,列是每一个细胞,行是每个峰,里面的数字,比如左上角第一个数字 “0” 表示细胞 cell-1 在峰 peak-1 这里没有基因片段,就等于是这部分的DNA链它没打开也就没表达。

而 cell-3 peak-2这个点的数字 “2” 表示这个细胞的peak2峰值范围内有两段基因片段在这个范围内。
在这里插入图片描述
嗯,大概就是这样就得到了scATAC-seq的数据.


http://www.niftyadmin.cn/n/5360653.html

相关文章

大模型系列课程学习-prompt指令快速入门

提示工程入门 1. 提示工程简介及使用技巧 1.1 提示工程简介 1.2 提示工程使用技巧 2. prompt 赋能 NLP场景能力 2.1 文本分类 2.2 要素抽取 你是⼀个世界顶尖的⼀流翻译⼤师,精通所有语⾔与⽂化背景,在各个知识领域都有深刻 的理解与充分的知识。…

组播目的地址

路由器收到目的地址为224.0.0.5和239.0.0.5的组播报文如何处理? 224.0.0.5为永久组地址,是IANA为路由协议预留的IP地址(也称为保留组地址),用于标识一组特定的网络设备,供路由协议,目前被分配于OSPF协议使用,运行了OSPF协议的网络设备默认都会加入该组播组。 当路由器…

vulhub靶机activemq环境下的CVE-2015-5254(ActiveMQ 反序列化漏洞)

影响范围 Apache ActiveMQ 5.x ~ Apache ActiveMQ 5.13.0 远程攻击者可以制作一个特殊的序列化 Java 消息服务 (JMS) ObjectMessage 对象,利用该漏洞执行任意代码。 漏洞搭建 没有特殊要求,请看 (3条消息) vulhub搭建方法_himobrinehacken的博客-CSD…

最近nvm安装报错的原因找到了——npm原淘宝镜像正式到期!

前言 📫 大家好,我是南木元元,热爱技术和分享,欢迎大家交流,一起学习进步! 🍅 个人主页:南木元元 目录 背景 错误原因 问题排查 淘宝镜像 证书到期 问题解决 结语 背景 我们…

飞腾固件在线更新

这次尝试给飞腾D2000+X100的机器在线更新固件。 1 测试说明 首先说下固件版本: D2000 UEFI:edk2-code-3.5.0.rar PBF:imagefixd2000_v1.70.rar X100 x100packv1.7_0909-2.tar 我们今天试验让固件自己升级自己,也就是先用上面的版本做好固件,先烧到D2000和X100的flash…

Linux操作系统——管道(二) 进程池

概念层面理解进程池 比如说我们一开始有一个父进程,分别创建5个管道,5个子进程,这5个子进程都向管道里面进行读取,而我们对应的父进程,因为我们前面谈过管道的4种情况里面,有一个种情况是,正常…

【Android】高仿京东三级类型列表Demo

本demo基于二级分类双列表联动Demo进行了改进,高仿实现了京东的三级类型列表。 京东的如图: 本demo的: 改进之处 实现了三级列表联动,二三级列表之间的滑动监听优化了一下,将二级类型选中交予自身的点击事件&#…

labview高低拼接的理解

1.高低拼接的原因 计算机的一个字节由8位组成,无符号的8位整形表示的范围为0~255,范围太小了,所以用双字节,即16位整形表示更大范围的数字0 ~65535 2.labview中的高低拼接实质是高8位字节左移8位与低8位字节相加,结果是双字节整形 3.类似的C语言中的表达为: (U8)DataO…