AUC值及校准度很差

我有908例三个中心的数据,通过手术时间把数据分为训练集和验证集,分别用LR,LR+LASSO,RF,xgboost跑数据,最终AUC最高只有0.68,校准度和曲线看起来也挺离谱,我应该怎么去改善这个模型呢?