第744章 新的功能要求
  查尔斯发送消息之后,静静地靠在椅子上,炉火的光芒在他深邃的眼眸中跳动,拿起一旁碟子里几颗红宝石留下的坚果,边吃边思考。
  乌姆里奇的目的,埃莉诺早一步告诉他。
  对於乌姆里奇会利用系统来巩固权力,他並不意外。
  抄袭检测,这本身倒不是一个坏主意,至少从技术角度来看,有其价值。
  查尔斯对乌姆里奇的动作不再理会,开始进入具体的技术规划层面。
  几个小时后,他心中有了底,下达技术指示。
  关於这个查重系统,核心技术原理可以围绕两点构建:
  其一,基於字符串比较的连续重复字符数”检测,这是基础,將提交的文本与资料库中的內容进行逐字比对。
  並设定一个关键閾值,比如默认连续六个及以上单词完全一致或高度相似,即触发標记,並计入整体重复率。
  还需要设置一个专业词组库,像专业术语这类固定搭配,应视作一个独立词汇单位进行计算,避免误判。
  其二,基於语义识別的“智能比对”,这是更进阶的层面。
  系统需尝试理解句子的核心语义,而不仅仅是表面的字符匹配。
  即便使用者替换了同义词、调整了语序,若句子的主旨逻辑与原文高度雷同,系统也应有能力识別为“语义重复”。
  这项技术更具深度,也需要持续的演进,目標是让简单的、机械性的“同义词替换”伎俩逐渐失效。
  “具体的研发工作,交给路易。”查尔斯最后写道,“他在魔法人工智慧领域的积累,最適合负责这个模块的搭建。”