关于 WordPress
WordPress.org
文档
学习 WordPress
支持
反馈
登录
注册
Course Builder
搜索
跳至内容
深网 deepoo.net
从此走进深度人生 Deep net, deep life.
学习 study
生活 life
工作 work
社区 forum
登录
搜索
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning
作者:
deepoo
在
自然科学
2501.12948v1
下载
Post Views:
230
计算机
←
余少祥:论社会法的本质属性[节]
俞可平: “奴婢贱人,律比畜产” —— 中国古代贱民的政治学分析
→
评论
发表回复
取消回复
要发表评论,您必须先
登录
。
更多文章
杨文炯 桑凡:国家话语与民间选择:“土人”到土族的历史人类学考察
2026-05-25
郑天挺:清代皇室之氏族与血系
2026-05-23
郑天挺:清代考试的文字:八股文和试帖诗
2026-05-23
郑天挺:清代包衣制度与宦官
2026-05-23
发表回复
要发表评论,您必须先登录。