回归日常
最近的一周结束了练车时期的忙碌,主要是练车会打断不少连续的时间,而且科目三的地方是真的好远啊。
# 练车的感想
练完之后感觉确实不难,科目二是我最担心的,当时考试的时候心脏都在不停的加速。
考完之后感觉其实也就还好,几个项目都是很正常的难度,稍微慢一点就能稳稳的通过,而且他的项目是非常的宽松。
科目三上路反而没有什么压力,或许是旁边有教练坐着,或者是心大,在两天后终于是过了第一次,之后就是不断的重复重复重复,而且一练就是一下午,加上坐车的一小时,基本上一天只有上午那一会是自己的时光了
拿到驾照后日常的给几个朋友发了一下,然后估计就是永远的封存吧。
# 强化学习
强化学习开始慢慢的上路了,之前的一些不收敛的代码也开始表现的正常了,DQN一直不收敛,也没有思路,现在弄下来,发现是自己当初了epsilon设置的减小太快了,导致1000步之后都不怎么 work 。抄了一下别人的,效果相当不错,开开心心的准备后面的代码实践了。
还学到一点小操作,比如target网络和原来的网络其实可以直接公用一个,效果是差不多的,而且感觉下来速度要快一些。
更新时间: 6/10/2024, 8:42:55 PM