第1745章 一句话点醒了贾瀞雯
⚡ 自动翻页
开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽
看到章尾自动进入下一章,追书不用一直点。
  他们已经连续工作了两个月,做出了这个能跑起来的搜寻引擎。
  可效果实在不理想。
  “速度呢?”贾瀞雯又问。
  “平均响应时间十二秒。”王磊说,“最慢的一次等了半分钟。
  这还只是在我们內网测试,如果放到真实的网络上,有延迟,有带宽限制,可能更慢。”
  贾瀞雯点点头。
  她走到白板前,看著上面密密麻麻的架构图。
  爬虫、索引、分词、排序……每个模块都做了,每个模块都能工作,可组合起来就是这个结果。
  “问题出在哪儿?”她问。
  李明站起来,走到白板前:“首先是索引结构。
  我们现在用的是最简单的倒排索引,但数据量一大,查询效率就低。
  需要优化数据结构。”
  张涛补充:“分词也有问题。
  基於词典的方法太死板,很多新词、专业词切分不准。
  比如『奔腾处理器』,我们的词典里没有这个词,就切成『奔腾』和『处理器』,但用户可能搜『奔腾处理器』整个词。”