第166章 重启SLRM研究 二
⚡ 自动翻页
开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽
看到章尾自动进入下一章,追书不用一直点。
  “让全世界最聪明的工程师去帮我完善它,去帮我验证它。让那些拥有海量算力和数据的科技巨头,去为这个『不成熟』的想法买单。”
  “而我,只需要站在巨人的肩膀上,去摘取那颗最璀璨的果实——完成系统的主线任务,拿到那宝贵的经验值和奖励。”
  “这才是最高效的玩法。”
  ……
  確定了方向,徐辰便正式开启了这场枯燥的“炼丹”闭关。
  上一次的demo测试,主要是为了验证slrm模块在数学原理上的可行性。
  而这一次,他要验证的是一个更具商业价值的假设——搭配常用的llm基模做测试。
  既然slrm是一个独立的逻辑外掛,那么理论上,它应该可以搭配任何一个现有的transformer模型使用。
  徐辰的目光锁定在了开源社区的热门模型——qwen-7b上。
  这是一个典型的“小模型”。虽然在通用对话上表现不错,但在面对clutrr这种需要多步逻辑推理的硬核任务时,它的表现只能用“惨不忍睹”来形容。
  徐辰先查了一下qwen-7b在clutrr上的成绩,结果不出所料:45.2%。
  这基本上就是瞎猜的水平。对於复杂的亲属关係推理,7b参数的小脑瓜显然不够用。
  “很好,起点够低,反差才够大。否则展现不出slrm的威力。”
  本书首发????????????.??????,提供给你无错章节,无乱序章节的阅读体验
  徐辰嘴角勾起一抹笑意。