Advice for Applying Machine Learning

get more training examplestry smaller sets of featuretry getting additional featurestry adding polynomial featurestry increasing/decreasing λ\lambdaλEvaluating a hypothesis将数据集划分成训练集和测试集，大约按7:...

guojunxiu

241人浏览 · 2019-02-21 09:02:48

guojunxiu · 2019-02-21 09:02:48 发布

get more training examples
try smaller sets of feature
try getting additional features
try adding polynomial features
try increasing/decreasing $\lambda$

Evaluating a hypothesis

将数据集划分成训练集和测试集，大约按7:3进行划分。划分的时候注意要随机划分。

Model Selection and training/validation/test sets

model selection
将假设的次幂d也看做是一个参数。然后模型选取的过程如下：

每个假设（d不相同）通过训练集来学习 $\theta$
对每个假设得到交叉验证集的误差 $J(\theta)_{cv}$ ，选择最小的 $J(\theta_{opt})$ 。这一步实际是对交叉验证集的拟合，所以为了避免过拟合，需要进行第三部
在测试集上得到测试集误差 $J(\theta_{opt})$ ，即当前模型的评估。