Articles
844
Tags
265
Categories
176
Yan 的杂物志_个人主页分享
Search
Tag - 强化学习
2025
2025-06-04
对谈_250411_人的奖励函数
2025-05-05
对谈_250319上_有的人更需要价值观
2025-03-21
论文阅读_Search-R1:大模型+搜索引擎
2024
2024-04-22
股票预测强化学习模型解析
2024-03-24
强化学习与大模型结合研究
2024-03-19
大模型+强化学习_精典方法_RLHF
2023
2023-04-15
医学论文_ICU_强化学习_SEPSIS
2023-03-10
7_1_强化学习_ChatGPT为什么使用强化学习
2023-03-04
论文阅读_近端策略优化_PPO
2023-02-17
论文阅读_AlphaGo_Zero
1
2
Yan.xie
顺流而下还是逆流而上?
Articles
844
Tags
265
Categories
176
Follow Me
Announcement
This is my Blog
Recent Post
基金交易量预测比赛_基金交易量与净值讨论
2025-07-29
以色列一个民族的重生_读后感
2025-07-29
以色列一个民族的重生_背景知识
2025-07-29
250711_对谈_主人道德vs奴隶道德
2025-07-21
高敏感与自我修正的思考
2025-07-21
Categories
0_IMO
84
工作
1
方法
1
工作
1
说给一个人听
82
01_自我建构
32
实修
3
思考与觉悟
16
Tags
价值观
人生哲学
效率
插件开发
佛教
卷积神经网络
多模态
阅读/心理学
股票预测
Web服务
网络
深度学习/知识蒸馏
理财规划
编程语言/C
语音
SSH
知识管理
饮食
异常检测
禅宗
后端
商业化
公众号
叙事心理学
图形图像
强化学习
AI功能
辅助编程
关系维护
编程语言/JNI
社会学
模型优化
生物医学
模型转换
多代理系统
沟通
心理学
数据存储/Hadoop
云计算
音视频处理
Archives
July 2025
41
June 2025
38
May 2025
30
April 2025
16
March 2025
8
February 2025
2
January 2025
6
December 2024
2
Info
Article :
844
Total Count :
1174.1k
UV :
PV :
Last Push :
Search
Loading the Database