第108章 意外的物理学经验
⚡ 自动翻页
开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽
看到章尾自动进入下一章,追书不用一直点。
  2025年1月,还有一件事对徐辰影响很大。
  这个月,发生了一件科技界的大事。
  各大国內主流新闻app的头版头条都在推送一条消息:
  標题,充满了科技感与衝击力。
  【“中国ai的『gpt-4时刻』?deepseek-r1横空出世,性能全面超越,並宣布开源!”】
  “deepseek-r1?”徐辰的眉毛,微微一挑。
  在过去的几个月里,以chatgpt为代表的大语言模型(llm),如同平地惊雷,在全球范围內,掀起了一场前所未有的科技革命。
  【大语言模型……ai……】
  徐辰的心中,泛起了一丝好奇。
  他虽然主攻的是纯粹数学,但对於这些代表著人类科技最前沿的“时髦”玩意儿,也並非一无所知。
  他打开电脑,搜索到了deepseek-r1的开源论文。
  他饶有兴致地,开始阅读起来。
  论文的前半部分,是关於模型训练所使用的数学理论。
  “……我们採用了改进的『注意力机制』(attention mechanism),其核心,是將输入序列中的每一个词向量,都映射到『查询(query)』、『键(key)』、『值(value)』这三个向量空间中。通过计算query与所有key的点积相似度,並进行softmax归一化,来得到每个value的权重……”
  【嗯,有点意思。】徐辰的眼中,闪过一丝瞭然。