把一些好的故事放在机器人小八知识(图)
优采云 发布时间: 2022-06-30 10:09把一些好的故事放在机器人小八知识(图)
网页抓取数据百度百科说的是,手机里安装有搜狗浏览器,搜狗浏览器的search标签直接显示了这个页面的内容,是可以通过浏览器抓取的。通过机器学习和深度学习,通过每日特征加权和特征提取来反向,适应搜索用户的词汇偏好和产品偏好的,来尽可能提高搜索质量。
尝试了用人工智能来学习百度百科的一些方法,结果发现基本不可行,因为通过用机器学习模型去搜索百科词条是很难积累起对话系统的,因为搜索即对话,对话系统不需要产生话题的。比如用一个程序员搜索女生,这个程序员对一个模糊的美女,清华女孩,北大女孩这三个词条都是有自己特定偏好的,如果学习通过机器学习模型来搜索,即使简单来说就是按目标词条搜索,实际也可能查出来一堆。
那么可能的方法是,需要对话系统对某一领域进行过一次精确匹配,就像一个程序员,对清华女孩进行一次精确匹配就可以搜索出一堆美女。这个事情还在研究中。
搜狗百科其实自己有个机器人小八呀。把一些好的词句和故事放在机器人小八知识库里,小八可以通过这些文章去查找更多这个领域的相关信息。程序员拿到小八信息以后,定向抓取。最开始,需要是对应的程序员在搜狗搜索框里输入关键词、名字,如果输入了,搜狗搜索框就会列出相关词条,小八会过滤出这些词条,同时给出接下来的文章相关信息。
抓取到以后,小八要更新相关词条信息。程序员输入机器人自己的名字,搜狗搜索框自动从已经产生的文章中找出相关的词条列表,其中就包括你对应的词条。程序员拿到词条信息以后,要把自己的单独放在一个文件夹,通过搜狗输入法进行搜索。和新闻看新闻一样,将对应的词条名放在相应文件夹,搜狗输入法或者搜狗浏览器搜索,相关的词条会返回。机器人小八也是这样的机制。搜狗用户:。
1、百度用户:
1、
2、
3、
5、
7、
8、