Articles
806
Tags
240
Categories
164
Yan 的杂物志_个人主页分享
Search
Category - LLM_RL
2024
2024-03-24
强化学习与大模型结合研究
2024-03-21
大模型+强化学习_利用AI反馈扩展强化学习_RLAIF
2024-03-19
大模型+强化学习_在线交互调参_GLAM
2024-03-19
大模型+强化学习_精典方法_RLHF
2024-03-19
大模型+强化学习_自我对弈偏好优化
2024-03-16
大模型+强化学习_通过强化学习对齐大模型和环境
2023
2023-12-08
论文阅读_反思模型_Reflexion
1
Yan.xie
顺流而下还是逆流而上?
Articles
806
Tags
240
Categories
164
Follow Me
Announcement
This is my Blog
Recent Post
250523_对谈_用叙事打磨世界观
2025-05-23
250512_对谈_股票操作中的概率与心理
2025-05-21
250520_对谈_最近发展区理论与实践
2025-05-21
论文阅读_现实的叙事构建
2025-05-21
2505xx_对谈_家长的角色2
2025-05-20
Categories
0_IMO
54
工作
1
说给一个人听
53
01_自我建构
21
思考与觉悟
11
行动与进化
10
02_情绪心理
12
03_关系互动
9
Tags
自信
#编程语言/前端
版本管理
父母教育
关系
论文阅读
神经网络
数据库
社会
Docker
心理建设
LLM
目标管理
教育
大语言模型
软件版权
社交
网络服务
成瘾
Web服务
插件推荐
自我表达
方法论
视频生成
多模态
自然语言处理
阅读心理学
决策哲学
嵌入表示
多代理系统
情绪表达
技巧
GitHub Actions
用户验证
驱动
推荐系统
反思
职场
语音识别
音频处理
Archives
May 2025
65
April 2025
16
March 2025
12
February 2025
2
January 2025
6
December 2024
2
November 2024
6
October 2024
4
Info
Article :
806
Total Count :
1095.3k
UV :
PV :
Last Push :
Search
Loading the Database