最新文章

  • 改版并重新录制的R语言数据挖掘大课来啦!

    一起学习,共同进步。

    Aug 27, 2021, 7:20:02 AM
    3,390
  • 视频小教程_如何画出没有教程的图?

    最近有人在群里提问,下面的热图该怎么画。这张热图,在每一个格子里面用对角线一分为二,呈现了两类信息。图片来自于这篇文章的图1D。通常,遇到这种需求,我都会直接检索,看看有没有现成的R包可用。可以提取检索词检索一下,这里主要信息应该是"对角线热图R语言",查阅字典后,关键词就变成了

    Jan 17, 2020, 3:38:48 AM
    2,838
  • 视频小教程_R语言中的批量操作

    (本次操作有配套的视频教程,在果子学生信公众号回复“果子爱批量”自行获取,和代码一起以project的形式分享)目前而言,我学R语言,受益最大的是批量操作。比如,我们可以实现批量计算2万个基因的生存分析。这里有个例子:8秒完成2万个基因的生存分析,人人都可以!如果更猛一点,用双基因来分开样本,可以实

    Jan 17, 2020, 3:34:09 AM
    2,238
  • 果子的TCGA教程汇总,持续更新。

    ​首先看这几个帖子:从GDC下载TCGA肿瘤数据库的数据把GDC下载的多个TCGA文件批量读入RTGCA数据的标准化以及差异分析很有诚意!人人可做的转录组数据下游分析下面几个也可以看看TCGA真实数据下的批量生存分析TCGA提取非编码RNA并完成下游分析GTF文件有什么用啊?别的不谈,最起码能提ln

    Jan 4, 2020, 7:04:25 PM
    4,320
  • 果子的GEO芯片分析教程汇总, 持续更新。

    这是个导航帖,可以有效解决芯片分析的大部分问题。内容抵得上一个GEO的培训班。首先用20%的精力解决80%的分析,可以看这篇,可以对GEO表达谱芯片有个大致的了解来完成你的生信作业,这是最有诚意的GEO数据库教程在果子学生信公众号回复"果子学生信",可以自助获取R语言环境的配置教

    Jan 4, 2020, 6:51:36 PM
    6,164
  • dplyr需要掌握的6个函数

    dplyr是我十分喜欢的包,这里面需要掌握的函数并不多,但是很有用。数据集介绍这次我们使用R语言内置的数据集iris来示范鸢尾花(iris)是数据挖掘常用到的一个数据集 这个数据集150行,5列该数据包含150种鸢尾花的信息 每50种取自三个鸢尾花种之一(setosa,versicolour或vir

    Jan 4, 2020, 2:21:45 AM
    2,265
  • group_by和summrise连用后,分组计算就很方便!

    关于分组计算这个话题,我在写过的那些帖子里面,经常用到的就是group_by联合summarise比如多探针求最大值,多甲基化位点求平均值,TCGA中miRNA求最大值GEO芯片中多个探针对应一个基因,是求平均值还是保留最大值?批量读入TCGA的miRNA数据(注意细节)R语言学习路上的忆苦思甜凡是

    Jan 4, 2020, 12:15:48 AM
    1,832
  • 30分钟的教程写了13年,这回正则表达式有救了!

    关于正则表达式一定要看完,收藏就是雪藏。如果我们要在一段mRNA序列里查找起始密码子“ATG”的位置,在word中使用查找就可以,也可以使用快捷键Ctrl+F,输入ATG就行。这是常规操作,人人都会。但是如果我们要寻找一段CDS区(蛋白编码序列),他通常是以ATG起始,以TGA,TAG,TAA三个中

    Jan 4, 2020, 12:10:18 AM
    2,370
  • 我喜欢的gather快要被淘汰了,好在来了更好的宽长转换工具!

    果子唠嗑不断地有人问我,你的简书文章哪里去了。很难受,我的简书被封掉了。而我一直把简书当作写作工具在使用,也一直在蹭他的图床。今天在熊的帮助下,我用上了新的markdown工具,用上了自己的图床,工作又可以开展了。具体的过程在明天的帖子里面。(在发这个帖子的过程中,又获得了熊的极其骚的操作,我现在跪

    Dec 24, 2019, 12:56:49 AM
    2,817