Articles
806
Tags
240
Categories
164
Yan 的杂物志_个人主页分享
Search
Tag - 强化学习
2025
2025-05-07
对谈_250411_人的奖励函数
2025-05-05
对谈_250319上_有的人更需要价值观
2025-03-21
论文阅读_Search-R1:大模型+搜索引擎
2024
2024-04-22
股票预测强化学习模型解析
2024-03-24
强化学习与大模型结合研究
2024-03-19
大模型+强化学习_精典方法_RLHF
2023
2023-04-15
医学论文_ICU_强化学习_SEPSIS
2023-03-10
7_1_强化学习_ChatGPT为什么使用强化学习
2023-03-04
论文阅读_近端策略优化_PPO
2023-02-17
论文阅读_AlphaGo_Zero
1
2
Yan.xie
顺流而下还是逆流而上?
Articles
806
Tags
240
Categories
164
Follow Me
Announcement
This is my Blog
Recent Post
250523_对谈_用叙事打磨世界观
2025-05-23
250512_对谈_股票操作中的概率与心理
2025-05-21
250520_对谈_最近发展区理论与实践
2025-05-21
论文阅读_现实的叙事构建
2025-05-21
2505xx_对谈_家长的角色2
2025-05-20
Categories
0_IMO
54
工作
1
说给一个人听
53
01_自我建构
21
思考与觉悟
11
行动与进化
10
02_情绪心理
12
03_关系互动
9
Tags
用户验证
菜谱
异常检测
公众号
自我调节
心情
云计算
卷积神经网络
笔记工具
工作思考
社会学
社会关系
自动驾驶
医学
网络
心理
插件开发
运动
随笔
阅读/电影
CentOS
数据存储
自然语言处理/大模型
法律
GitHub Actions
视频处理
Docker
程序员
决策哲学
编程工具
自然语言处理/工具
数据存储/Hadoop
神经网络
Pytorch
目标管理
深度学习
android
编程语言/前端
音视频处理
深度学习/模型结构
Archives
May 2025
65
April 2025
16
March 2025
12
February 2025
2
January 2025
6
December 2024
2
November 2024
6
October 2024
4
Info
Article :
806
Total Count :
1095.3k
UV :
PV :
Last Push :
Search
Loading the Database