关于 WordPress
WordPress.org
文档
学习 WordPress
支持
反馈
登录
注册
搜索
深网 deepoo.net
从此走进深度人生 Deep net, deep life.
学习 study
生活 life
工作 work
社区 forum
登录
搜索
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning
作者:
deepoo
在
自然科学
2501.12948v1
下载
计算机
←
余少祥:论社会法的本质属性[节]
俞可平: “奴婢贱人,律比畜产” —— 中国古代贱民的政治学分析
→
评论
发表回复
取消回复
要发表评论,您必须先
登录
。
更多文章
钱立卿:从现象学的角度看逻辑推理的基础——论卡罗尔疑难与分离规则的合法性根源
2026-01-20
周振忠:何谓实质性的真理论?
2026-01-20
苏力:从“骑射”到“别男女”——胡服在中原农耕区的功能变迁
2026-01-20
王尔:两汉之际“天子”“皇帝”名号
2026-01-19
发表回复
要发表评论,您必须先登录。