提高城市天际线模型稳定性的方法可以归纳为以下几点:
样本选择和多样性
确保样本量足够大且具有代表性。如果模型要求普适性,则应拉长样本选择的时间轴,增加样本多样性,防止样本偏移,并减小因前端风控策略变化对模型稳定性的影响。
如果模型是专用的,则应使用近期的样本进行建模,并确保抽取到近期表现稳定的样本。
目标变量的定义
在信用模型中,目标变量的定义非常重要。好客户标签应具有“纯粹”的性质,坏客户标签应具有“多样化、全量性”。
可以尝试将目标变量从二分类转化为多分类,或者从建模样本中剔除中间不确定客群。
特征选择
根据业务经验选择稳定性特征。例如,多平台借贷由于市场变化或政策影响,特征可能不稳定,可以进行策略或特征修正,如转化为分位数。
验证特征在时间序列上的稳定性,筛选手段包括观察变量覆盖率的变化和两个时间点的PSI差异。选择跨时间验证的时间时,需注意时间的序列性,避开大型运营活动、节假日和相关策略变化。
慎重选择区分度过强的特征,以免模型过于敏感。
通过以上方法,可以有效提高城市天际线模型的稳定性,使其在各种环境变化下仍能保持较好的预测性能。