🗒️浅谈“过拟合”技术分享在小数据集上,过拟合是常见问题,解决方法包括数据增强、冻结预训练参数、蒸馏学习等。微调大模型时需考虑数据量和模型复杂度,以避免过拟合带来的负面影响。适当的技术路线和方法可以有效缓解这一问题。2025-2-23 推荐 工具 开发
🗒️关于Deepseek技术分享DeepSeek通过纯强化学习训练推理模型,提升了自主推理能力,解决了可读性问题,并在数学和编程任务上表现优异。未来计划扩展应用场景并引入多语言支持。2025-1-29 文字 推荐 思考