浪花东星斑
浪花东星斑我们去医院打药,会对它的剂量感兴趣。剂量是怎么影响我们的病情呢?这个研究就是,对一组病人(n=365)随机给他们剂量,评估他们的反应。然后呢,我们想要掌握药物剂量和病人的反应,这两者之间具体的关系,对吧
浪花东星斑那你说一下,给药剂量和病人反应哪个是自变量,哪个是因变量?
小伊我睡了睡了
小伊晚安晚安
浪花东星斑别走,我保证你能听明白
浪花东星斑自变量是给药剂量,因变量是病人反应。我们已知的条件是,给药剂量平均为62.7,标准差11.5(标准差是表示给药剂量的发散程度,标准差越小,给药剂量越一致,标准差为0就代表我们对于每个病人,都给了这么多剂量。)
小伊……但我们想研究病人的反应和给药剂量之间的函数关系,所以不能给一样的剂量吧!!
浪花东星斑对的。
浪花东星斑通过某种手段测量病人的反应,我们得到平均数145.3,标准差38.4。此外还有一个数据,correlation coefficient,相关系数(r)。这个系数是测量我们的自变量、因变量是否成线性关系。相关系数如果为1,就是完全线性关系,如果画张坐标图,所有(x,y)会落到同一条线上
浪花东星斑现在是0.56,就是它俩有些关系,虽然不会完全落到同一条直线上,但是会有那个趋势
小伊那我们要这个关系有啥用呢?
浪花东星斑我们可以根据这个关系,大概预测一个给定剂量下,病人的反应
小伊为什么是大概呢?我们不能精确一点吗?
浪花东星斑因为这一切并不是完美无缺的理想状态。由这个解析式,给定用药剂量之下(比如90mg),我们可以给出一个病人反应的区间(也就是范围),这个范围有95%的概率包含了真正的结果。
浪花东星斑首先我们要求出那条直线。就是那个趋势。这个直线的原理,就是所有点到它的距离之和最小。经过数学家的发明,这条直线是y(x)=病人反应的平均数+b1(x-给药剂量的平均数)。两个平均数分别是145.3, 62.7,要求的就是b1。b1=病人反应标准差/给药剂量标准差·相关系数,这三个都已知,求得答案1.87。那这条直线的解析式就得到了,y=28.1+1.87x
浪花东星斑但是世事无常,这条直线的斜率也可能有误差,我们求得的误差范围越大,我们越有信心它真正的值落在误差内。如果范围是正无穷到负无穷,那这百分之百包含正确答案。
小伊但是你跟我说给我一个数据它的误差是正负无穷我肯定要打你的
浪花东星斑不要打我,我们可以在这两者之间艰难的找到一个平衡,我们艰难的一致同意了给出一个有95%可能包含正确答案的误差范围
小伊行吧,95%,合情合理
浪花东星斑那么精彩的事情就来了,这就是为什么我们有一堆概率分布,这些概率分布是干什么用的呢?我们给出我们想要的误差概率95%,它们能直接吐出误差范围是多少个标准差!很神奇吧!但是概率分布有N T卡方F,这个情况用哪个呢,这就是一个易错点了,我们用T分布
浪花东星斑正态分布:总体标准差已知;T分布:样本标准差已知;卡方分布是方差的分布,F分布是两组数据方差之比的分布。
浪花东星斑现在我们解析式也有了,误差范围也有了,想知道给定药品剂量90mg,病人反应怎么样,那就直接代入解析式,得到一个值,给它加上误差范围。这就是我们解决问题的思路
浪花东星斑明白了吗?如果有什么地方不理解,那是我讲的问题