昨天的视频号直播:踏入生物信息学海洋的必修课是什么,举办方精选出来的读者提问都是很精锐的辩论题,包括:狂敲代码和玩转思路的二选一,临床问题和基础科研孰轻孰重。安排到我和Y叔的一个共同讨论题是:生信分析和实验结果哪个更可靠?
蛮有意思的, 我本来是以为这样的问题我和Y叔肯定是都是站生信分析这一边,根本就没办法辩论起来。不过Y叔首先作答的时候选择的角度也让人有所启发,主要是强调了常规生物信息学数据分析所依赖的数据本身会有错误所以造成了生信分析的不准确性,然后是大规模的生物信息学初学者对数据分析的认识不足导致数据分析出错误也会造成生信分析的不准确性。Y叔最后的结论大概是相比起来实验结果反而是更可靠一点。
我的作答大纲:
首先,生信分析和实验结果如果排除掉人为的造假操作外其实都是可信的,生信分析和实验操作它们应该是手段层面的差异,可以简单的类比是:
- 实验相当于是口算,心算,算盘等
- 而生物信息学数据分析是计算器
并不会因为计算手段的差异而得到不一样的计算结果结果,无论是口算,心算还是计算器,2+3都是得到5
我们需要关心的是生信分析和实验谁更容易出错: - 实验环境的稳定性,试剂的有效性,耗材的准确性
- 数据的质量控制,统计学算法的选择,结果的解读
以及生信分析和实验结果谁更经得起考验(横向和纵向比较): - 图片误用,秦桧法(莫须有的原因删除不符合预期的结果),赵高法(到处移植同一个内参)
- 差异与否(文库),如何解读差异,全部的基因都在
结果可靠的真正的来源应该是: - 需要是多次独立的结果表现一致
- 而且结果是可以有逻辑推理的合理的解释的
直播过后很多细节我就忘记了,大概的大纲是如上所示了,但是细节可能是需要自己看视频号回放了解更多了。
最后我还给观众了一个简单的寄语:科研人生很长,勇敢一点,去积极地掌握生物信息学技能!无论是网页工具在线数据库还是编程软件,一定会是你的科研助力!
感兴趣的可以去看长达两个小时的回放,详见视频号直播:踏入生物信息学海洋的必修课是什么,里面的二维码扫描即可观看回放: