改版并重新录制的R语言数据挖掘大课来啦!

我们的生信数据挖掘课更新版来了!
课程目前已经迭代多次,是个有体系的课程,对于初学者比较友好。
整个课程的设计和迭代,依托于两句话。

第一: 美图虽好,不是首选。

我们在一开始就强调过:

尽管漂亮的图表是刚需,无论基金还是文章都需要,却是初学者最不应该学的。初学者应该把有限的精力用在数据清理上。R语言的特点就是R包多,我们只要把数据调整到R包需要的格式,就可以轻易做出漂亮的图片。

所以,这门课不会教某一个图的画法,而是尝试教会大家任意常见图的画法,这在其他软件里面可能性很小,但是R语言可以做到。因为我们有R包!
借助于前人的智慧,我们可以轻松地画出以下的图片:
从转录本层面给出某个mRNA或者lncRNA在癌症亚型配对样本中的表达

某个基因和免疫浸润细胞的相关性作图

基于lasso的模型构建系列图

重点在这!

所以,R语言初学者最重要的技能是数据调整,这是架设在已知和未知间的桥梁。正因为有了这样的理念,我们的课程有了灵魂,我们知道了技能的优先主次,我们从不花大量时间挨个去一张张教作图。

第二:好的课程,要让学员觉得自己牛逼,而不是让学员觉得讲师牛逼。

这句话极其有魔力,只要看过一遍,你就不能适应课程中讲师炫耀的环节。
培训,首先要要保证的是学员是否能有收获,脱离了当前的例子,是不是能把数据处理和转换的能力泛化。
每次想到这句话,我就知道应该用浅白的语言体系来描述知识点以及授课,
比如关于因子的部分,我只讲了两个知识点,一是因子就是分类器,二是因子如何排序:

在讲order和sort区别的时候,干脆做了个动画,讲清楚为什么sort返回的是数值,order返回的是位置。

在讲数据结构的时候,我想化繁为简,提出向量,矩阵,数据框,列表本质上都是一个东西,是挂在晾衣绳上的小盒子:这样我们就能理解,对于data.frame而言,为什么names()和colnames()返回的结果一样,为什么获列的时候df[,1]和df[1]的结果也一样,
还有,对于批量读入的数据如果存为列表,可以使用do.call(cbind,list)把列表变成数据框,因为本质上他们都是一个结构。

这样还不够,为了让学员相信,只要愿意,每个人都可以通过检索画出美图,我们和学员一起配合,从零开始,
只用学员给出的关键词检索网络,画出如下的火山图,学员们自己都不敢想象!

既然检索这么有魅力,我们索性在课程中穿插讲解了检索的实际运用,
没有哪个大神是别人教出来的,他们都是在入门后自学成才。自学过程中,检索是最重要的技能。

  • 我们教过大家如何用检索解决R语言报错
  • 如果通过检索获取想要的资源和教程
  • 如何用检索查询本领域的数据,无论你是心内科还是神内科,都有数据可用
  • 我们还展示过一次无敌人肉

上课后就会听到学员的反馈,我也很开心
第一个,博士陪伴

第二个,双基金

第三个,持续成长

拥有自己解决问题的信心,觉得自己牛逼,心里有满满的膨胀感,这才是这个课程想要达到的效果。

最高光的时刻是这个:有一个小姑娘,她直到上课时,都不知道数据挖掘是什么,一脸懵圈。
但是令人欣慰的是,她回去后不停学习,现在把文章也投了。
知道我要去北京,她送了本书给我,还带了一张满带感情,让我欣慰的卡片:

学完课程并掌握后能收获什么技能?

  1. 没有课题的时候找到课题,没有机制的时候挖掘机制。
  2. 为基金申请保驾护航,发表paper如虎添翼
  3. 掌握R语言的核心技能,掌握批量分析数据的能力,掌握自我迭代的思维体系
  4. 掌握表达谱芯片数据,RNAseq转录组数据,甲基化芯片数据,GEO数据库和TCGA数据库等数据的处理
  5. 科研绘图:常见科研需求自我满足不求人,特殊需求实现自己定制高端大气。

这是一份带有诚意且注重实战的数据挖掘课程。我们的目标是:一次学习,不再报班。

涉及议题:

  1. 如何使用生物信息学,在没有课题的时候如何找课题,在没有机制的找机制?
  2. 科研中细胞系处理的两大刚需,加药以及基因敲减,有什么好的分析方案可以让我们精准定位到下游核心分子?
  3. 为什么大部分公司给的分析结果都用不了啊,导师和我都很着急,怎么处理才能够变废为宝?
  4. GEO表达谱芯片数据如何挖掘分析,才能避免画个热图火山图,聚类图就草草了事?
  5. TCGA数据库中的数据,如何从下载到分析,到变成可以任意基因任意癌症轻松出图的清洁数据?
  6. 生存分析的多种方案,包含一个基因的生存分析,两个基因的生存分析,一群基因的生存分析,8秒完成2万个基因的批量相关性分析。
  7. 如何学会编程的看家本领,让重复的工作批量执行(批量分析,批量作图,批量处理文件)?
  8. 构建临床预后模型的完整方案是什么?
  9. 课题组比较关心免疫浸润分析,目前有哪些方案可以提供?
  10. 我入门的有点晚了,数据都被别人挖完了,有什么开挂的解决方案?
  11. 为什么做KEGG富集分析的时候,肝癌的数据会聚类出系统性红斑狼疮通路,我该怎么解释?
  12. 给你一个基因,在不做实验的情况下,你对他能了解到什么程度,以及能产生多少可放在文章中的数据?
  13. 给你两个基因,在不做实验的情况下,你对他们之间的关系能了解到什么程度,以及能产生多少可放在文章中的数据?
  14. 给你一群基因,在不做实验的情况下,你对他们能了解到什么程度,以及能产生多少可放在文章中的数据?
  15. 我做基础研究的,老板不需要纯生信的文章,数据挖掘怎么才能得体的用到自己课题上面来啊?
  16. 差异分析是数据挖掘的灵魂,那么小样本,大样本,配对样本,多分组样本的差异分析怎么做?
  17. GSEA分析是富集分析的神器,他好在哪里,如何使用?如何用GSEA给自己的课题提速?
  18. ceRNA如何分析,分析的前提是要掌握mRNA,lncRNA,miRNA的分析
  19. 目前的signature文章中有哪些埋好的雷等着你去踩?
  20. 那么多的GEO平台,如何以不变应万变地进行探针ID转换?
  21. GEO多芯片数据如何批次矫正?
  22. 为什么ssGSEA算法是批次效应的终结者?
  23. 如何使用Guilt of association 方案注释手上的长链非编码RNA?
  24. 单基因GSEA的用途在哪里?为什么出来的结果跟我想要的不一样?
  25. 我手上的样本有点多,WGCNA怎么做?
  26. 如何才能提取出转移和非转移配对的TCGA样本出来进行下一步分析?
  27. 我想进一步学习,但不想到处折腾了,有哪些你珍藏的资源推荐?
  28. 你是通过什么途径学会自己想要的技能的?有什么固定的流程么?

课程设计:

这么多内容怎么讲得玩呢?

讲不完,我们只能合理设计,增加时长了。

我们根据科研人学习的四个层面,把课程分成了四个部分。
第1,学会手把手教学的技能:
这一部分是就是大课的主体部分,

授课的时长是2天1晚,总共40节课

有些人是需要别人陪伴才能学习的,因此本次更新是全程带妆出境的。

第2,看视频学会技能:
该部分课程需要前面的基础,属于应用部分的技能。
GEO高级技能,TCGA的临床信息,生存信息,表达探索,模型构建,单基因功能探索都在这里。
这是重新录制的部分,目前没有人看过。
也是40个视频左右。

第3,看文字学会技能:
我们在课程的文档中穿插了100个文字教程,解决一些小而精巧的问题.
这部分技能训练的是学员自学的能力,有利于让学员形成自我迭代的能力。
在数据挖掘的过程中,并不是每一个技能都能找到合适的教程。
生信工作者长期在做的事情就是阅读文档。
以下是一些经典的技能:
我喜欢的gather快要被淘汰了,迎面走来了更好用的宽长转换工具
group_by和summrise连用后,分组计算就很方便。
30分钟的教程写了13年,被名字耽误的正则表达式!

第4,学会没有人教的技:
课程结束后布置涉及到高频操作的家庭作业,作为对课程的巩固和升华,需要学员在一月内提交然后讲师团队评阅。
这部分习题没有标准答案,类似于开放课题,要求学员通过自我学习,互相合作来完成。
学会没人教的技能,是数据挖掘的常态,你不能老是重复别人的套路,因为**"既是套路,就为俗物,终将废物"**。
我们希望将来在你思路到了的时候,要有能力从源头用代码来实现,而不是碰到了报错完全懵圈,不知进退。
这是数据挖掘的终极技能。

此外我个人也开启了GZ系利提高课程的开发,
本次更新中,所有新学员都将获得GZ课程的前三个。
分别是,泛组织相关性分析,批次矫正,探针转换。

其中泛组织相关性分析最近刚刚更新过,是技能练习的绝好材料。
实用!跟CELL文章一起学习任意基因集打分的泛组织相关性可视化

这样,总共100个视频的学习量,我们重新开始。
全套更新课程中,包含了视频,数据,代码,结果。
看到大家半途而废,经常反复参加别人的课程,挺心疼的,但是碍于面子又不好讲明。
我要强调一下,这些就是我会的全部技能了,我处理数据就只用到我讲到的技能,我没有感到束缚。
有了这些基础,我还可以很快学会其他技能。

我跟大家如果在R语言上有区别的话,可能是两个。
第一,我教了3年R语言,对基本操作十分熟悉,
当前很多问题,我脑子想不清楚的,双手放在键盘上就可以自动产生代码。
这是很神奇的体验(大概率是没有经历无法相信的体验)。

第二,突破了新手村后,我更加关注技能所能解决的问题,而不是掌握技能本身。

当前课程是重新录制的适合从零开始学习的视频教程,
支持新学员直接购买,支持长期答疑,可开发票。
GZ00_果子数据挖掘大课 (点击直达!)
有任何疑问,请加我微信guotosky盘问。
https://shop449275017.v.weidian.com/item.html?itemID=4410312838

如果你是老学员,并且认同授课理念觉得靠谱,欢迎推荐给身边关系好的并且有需求的人。
但是,不需要劝说别人过来上课,当你们在推荐时,本质上搭上了自己的信誉,
我希望你们确实是因为这个课程受益,而不是抹不开情面。