关于 WordPress
登录
注册
Course Builder

搜索

深网 deepoo.net

从此走进深度人生 Deep net, deep life.

学习 study
生活 life
工作 work
社区 forum

搜索

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning

作者：

在

2501.12948v1 下载

Post Views: 243

←余少祥：论社会法的本质属性[节]

俞可平： “奴婢贱人，律比畜产” —— 中国古代贱民的政治学分析→

评论

发表回复取消回复

要发表评论，您必须先登录。

更多文章

海瑞：治安疏

2026-07-16
陈志武等：清代妻妾价格研究——传统社会里女性如何被用作避险资产

2026-07-15
顾春芳：敦煌星图与古代天文[节]

2026-07-14
李泽椿等：从“75·8”到“21·7”的思考

2026-07-12

深网 deepoo.net

从此走进深度人生 Deep net, deep life.

问题反馈

关于我们

交流空间