,还有什么家务能做的。
曹深甚至为了防止系统沉迷家务不好好干正经事,严格规定了,只有休息时间才能用做家务来放松。
一天休息两次,每次一个小时……
终于,一星期后见证奇迹的时刻到了。
曹深是设想过的,基于一个好的nl技术做出来的搜索引擎是什么样。
因为在原世界,曹深见过国内一家nl技术很强的团队做出了这样的东西。
非常强大的搜索引擎,导致无法商用,只服务于内部。
曹深知道,原世界的nl技术跟系统拿出来的这个还是有很大差距,但没有想到,系统这套搜索引擎效果如此恐怖。
换句话说,当机器充分理解人类的语言时,结果令人震惊。
曹深随便输入了公司一个普通员工的名字,李大刚。
如果是度度,基本上就是在白名单网站中以这个人名为关键字进行搜索,并返回结果。
你需要根据这个人的其他信息去判断,哪一个链接内容指向的是你要找的这“李大刚”。
如果这个人曾经在网上以这个姓名出现过,那么你能搜索到一些相关的资料。如果没有,那可能度度也搜不到什么信息。
当然,随着技术的发展,度度也用上了nl技术。
不过也就限于,当你输入“李大月工”的时候,度度会提示
已显示“李大刚”的搜索结果。仍然搜索李大月工
但系统做出来的搜索引擎不同。
第一步,输入姓名。
第二步,返回搜索结果。
这个结果表面上和度度的差不多,因为输入的姓名可能有很多重名的,此时的搜索引擎还不知道,你要找的究竟是哪一个人。
第三步,用户根据返回的搜索信息,判断出哪一个链接是你要找的人,点击进去。
这个时候,搜索引擎开始真正工作了。因为通过你的点击,搜索引擎定位了你要找的究竟是哪一个李大刚。
等你再次回到搜索页面的时候,整个搜索内容都变了,全部显示的是跟这个“李大刚”相关的内容。
而这些内容并不是靠“李大刚”这个关键词在网上进行比对后的直接抓取呈现。
系统是阅读并理解了全网的信息,了解了“李大刚”的特征,根据这些特征再关联进行搜索,并返回结果。
换句话说,并不是靠“李大刚”这个名字,而是通过李大刚的行为,他的社交关系,他的关联信息,甚至他语言表达的特征去判断这个人是李大刚,这个网页的信息是李大刚留下来的或者是跟李大刚相关的!
无论他是不是用了李大刚的名字,无论他用的是什么id,无论他是不是匿名!无论别人在讨论李大刚的时候有没有提到他的名字!
依靠nl技术,机器理解了全网的内容,理解了李大刚,并把李大刚“揪”了出来。
于是,曹深在搜索页面看到了李大刚的“一生”,而且是搜索引擎自动整理过的,就像百度百科一样!当然,还贴心的附上了相关链接。
李大刚身份证号码,手机号码,家庭情况,高考分数,大学里各科分数,有几个女朋友叫什么,跟女朋友之间发生过什么事儿,都有哪些社交关系,别人对他的议论,微博上关注评论点赞过的人,对什么事儿感兴趣,过往的购物记录,看过什么电影小说,喜欢什么球队,骂过什么脏话,甚至浏览过什么网页有什么癖好……
并且还按照社交关系亲密程度排序,列了一大帮李大刚的同学,同事,朋友,老师等等。
而且都是有链接可以点击的,点进去就出现这个人的完整资料。
毫无隐私!
曹深又试了一遍,这次没有输入李大刚的名字,而是输入几个李大刚的特征,年龄