205 皆大欢喜(4 / 5)

,还有什么家务能做的。

曹深甚至为了防止系统沉迷家务不好好干正经事,严格规定了,只有休息时间才能用做家务来放松。

一天休息两次,每次一个小时……

终于,一星期后见证奇迹的时刻到了。

曹深是设想过的,基于一个好的nl技术做出来的搜索引擎是什么样。

因为在原世界,曹深见过国内一家nl技术很强的团队做出了这样的东西。

非常强大的搜索引擎,导致无法商用,只服务于内部。

曹深知道,原世界的nl技术跟系统拿出来的这个还是有很大差距,但没有想到,系统这套搜索引擎效果如此恐怖。

换句话说,当机器充分理解人类的语言时,结果令人震惊。

曹深随便输入了公司一个普通员工的名字,李大刚。

如果是度度,基本上就是在白名单网站中以这个人名为关键字进行搜索,并返回结果。

你需要根据这个人的其他信息去判断,哪一个链接内容指向的是你要找的这“李大刚”。

如果这个人曾经在网上以这个姓名出现过,那么你能搜索到一些相关的资料。如果没有,那可能度度也搜不到什么信息。

当然,随着技术的发展,度度也用上了nl技术。

不过也就限于,当你输入“李大月工”的时候,度度会提示

已显示“李大刚”的搜索结果。仍然搜索李大月工

但系统做出来的搜索引擎不同。

第一步,输入姓名。

第二步,返回搜索结果。

这个结果表面上和度度的差不多,因为输入的姓名可能有很多重名的,此时的搜索引擎还不知道,你要找的究竟是哪一个人。

第三步,用户根据返回的搜索信息,判断出哪一个链接是你要找的人,点击进去。

这个时候,搜索引擎开始真正工作了。因为通过你的点击,搜索引擎定位了你要找的究竟是哪一个李大刚。

等你再次回到搜索页面的时候,整个搜索内容都变了,全部显示的是跟这个“李大刚”相关的内容。

而这些内容并不是靠“李大刚”这个关键词在网上进行比对后的直接抓取呈现。

系统是阅读并理解了全网的信息,了解了“李大刚”的特征,根据这些特征再关联进行搜索,并返回结果。

换句话说,并不是靠“李大刚”这个名字,而是通过李大刚的行为,他的社交关系,他的关联信息,甚至他语言表达的特征去判断这个人是李大刚,这个网页的信息是李大刚留下来的或者是跟李大刚相关的!

无论他是不是用了李大刚的名字,无论他用的是什么id,无论他是不是匿名!无论别人在讨论李大刚的时候有没有提到他的名字!

依靠nl技术,机器理解了全网的内容,理解了李大刚,并把李大刚“揪”了出来。

于是,曹深在搜索页面看到了李大刚的“一生”,而且是搜索引擎自动整理过的,就像百度百科一样!当然,还贴心的附上了相关链接。

李大刚身份证号码,手机号码,家庭情况,高考分数,大学里各科分数,有几个女朋友叫什么,跟女朋友之间发生过什么事儿,都有哪些社交关系,别人对他的议论,微博上关注评论点赞过的人,对什么事儿感兴趣,过往的购物记录,看过什么电影小说,喜欢什么球队,骂过什么脏话,甚至浏览过什么网页有什么癖好……

并且还按照社交关系亲密程度排序,列了一大帮李大刚的同学,同事,朋友,老师等等。

而且都是有链接可以点击的,点进去就出现这个人的完整资料。

毫无隐私!

曹深又试了一遍,这次没有输入李大刚的名字,而是输入几个李大刚的特征,年龄