Open
Description
概率论学的一般,对于偏差与方差的推导有以下疑问,希望大佬解答我的疑惑.
南瓜书2.5.1节,在推导公式 2.41 的3步 → 4步时, 写到“由于噪声和 f 无关,所以 f(x; D) 和 y_D 是两个相互独立的随机变量。”
疑问:D是随机抽取的数据集,y_D是数据集D中数据x的标签, f(x;D)是用数据集D训练的模型然后对y_D所对应的x的预测结果,也就是D的不同会同时导致训练的模型f(x;D)和y_D的不同。
(1)模型f(x;D)是用含有噪声的数据集D训练的,那么f(x;D) 应该是依赖y_D的,两者不是无关的。
(2)在周老师的修订中(https://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/MLbook2016.htm ),写的是“考虑到噪声不依赖于f”, 即使按这个说法,是怎么得到y_D和f(x;D)独立的?
Metadata
Metadata
Assignees
Labels
No labels