把一些好的故事放在机器人小八知识(图)

优采云发布时间: 2022-06-30 10:09

　　把一些好的故事放在机器人小八知识(图)

　　网页抓取数据百度百科说的是，手机里安装有搜狗浏览器，搜狗浏览器的search标签直接显示了这个页面的内容，是可以通过浏览器抓取的。通过机器学习和深度学习，通过每日特征加权和特征提取来反向，适应搜索用户的词汇偏好和产品偏好的，来尽可能提高搜索质量。

　　尝试了用人工智能来学习百度百科的一些方法，结果发现基本不可行，因为通过用机器学习模型去搜索百科词条是很难积累起对话系统的，因为搜索即对话，对话系统不需要产生话题的。比如用一个程序员搜索女生，这个程序员对一个模糊的美女，清华女孩，北大女孩这三个词条都是有自己特定偏好的，如果学习通过机器学习模型来搜索，即使简单来说就是按目标词条搜索，实际也可能查出来一堆。

　　那么可能的方法是，需要对话系统对某一领域进行过一次精确匹配，就像一个程序员，对清华女孩进行一次精确匹配就可以搜索出一堆美女。这个事情还在研究中。

　　搜狗百科其实自己有个机器人小八呀。把一些好的词句和故事放在机器人小八知识库里，小八可以通过这些文章去查找更多这个领域的相关信息。程序员拿到小八信息以后，定向抓取。最开始，需要是对应的程序员在搜狗搜索框里输入关键词、名字，如果输入了，搜狗搜索框就会列出相关词条，小八会过滤出这些词条，同时给出接下来的文章相关信息。

　　抓取到以后，小八要更新相关词条信息。程序员输入机器人自己的名字，搜狗搜索框自动从已经产生的文章中找出相关的词条列表，其中就包括你对应的词条。程序员拿到词条信息以后，要把自己的单独放在一个文件夹，通过搜狗输入法进行搜索。和新闻看新闻一样，将对应的词条名放在相应文件夹，搜狗输入法或者搜狗浏览器搜索，相关的词条会返回。机器人小八也是这样的机制。搜狗用户：。

　　1、百度用户：

　　1、

　　2、

　　3、

　　5、

　　7、

　　8、

0

2022-06-30

网页抓取数据百度百科

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

把一些好的故事放在机器人小八知识(图)

0 个评论

发起人