第1733章 准备创立百度公司
⚡ 自动翻页
开启后阅读到底自动进入下一章
⚡ 开启自动翻页更爽
看到章尾自动进入下一章,追书不用一直点。
  按下回车,几秒钟后,所有包含这个关键词的网页都会列出来,按照相关程度排好序。”
  贾瀞雯微微张开嘴,想像著那个画面:“这……可能吗?”
  “完全可能。”陈浩拿起那几张纸,“技术上已经具备条件了。
  我把它叫做『百度』,取『眾里寻他千百度』的意思。”
  他从第一页开始讲解:“首先,我们需要写一个程序,叫网络爬虫。
  它会像蜘蛛一样,从一个网页爬到另一个网页,把网上所有的內容都收集起来。”
  “所有?”贾瀞雯惊讶地问,“网上有多少网页啊?”
  (请记住 101 看书网解无聊,?0???????.??????超方便 网站,观看最快的章节更新)
  “现在不多,但以后会有几十亿,几百亿。”陈浩平静地说,“所以这个爬虫要日夜不停地工作,发现新网页就存下来,已经有的就更新。”
  他翻到第二页:“存下来的网页要建立索引。
  就像图书馆的目录卡片,把每个网页里重要的词摘出来,记录这个词出现在哪个网页、出现了多少次、在什么位置。”
  贾瀞雯努力理解著:“就是说,如果有人搜『汽车』,我们马上能知道哪些网页提到了『汽车』?”
  “聪明!”陈浩讚许地看她一眼,“但还不够。
  如果只是简单匹配,会搜出太多没用的结果。
  比如有人搜『苹果』,他可能想找水果,也可能是找苹果电脑,或者叫『苹果』的乐队。”