第165章 重启SLRM研究 一
  “这种动力学,目前还没有任何数学工具能够精確预测。”
  “所以,ai领域才会有那么多『炼丹师』。大家都在试,都在猜,都在赌。”
  事实上,transformer本身就是一个典型的“学术成果”。在它诞生之初,虽然在机器翻译任务上取得了sota,但並没有人预料到它会成为后来大语言模型(llm)的基石。它只是证明了“自注意力机制可以替代循环神经网络(rnn)”这条路是走得通的。
  真正让transformer爆发威力的,是后来openai的gpt系列、谷歌的bert系列,以及无数工程师在海量数据和算力上的疯狂堆叠与调优。是工业界的工程化能力,將这个学术上的“好点子”,变成了改变世界的“核武器”。
  ……
  徐辰的slrm模块,其实也是类似的情况,也是一个学术上证明能走通的路线。
  slrm模块,本质上是给transformer打的一个“补丁”。
  如果把transformer比作人类大脑中的“快系统”,负责直觉、联想和快速生成;那么slrm就是那个冷静、严谨的“慢系统”,负责逻辑校验、推理和纠错。
  当transformer想要“胡说八道”时,slrm会通过几何计算,冷酷地告诉它:“逻辑不通,闭嘴。”
  这个思路是革命性的。
  但徐辰也很清楚,从一个“革命性的思路”到一个“成熟的商业產品”,中间隔著一道名为“工程化”的天堑。
  ……
  虽然工程化还很遥远,那么能不能直接註册专利,或者自己开公司赚钱呢?
  也不行。
  原因很简单。