基于搜索技术搭建博客社区是解决问题的方法之一

优采云 发布时间: 2021-06-12 02:22

  基于搜索技术搭建博客社区是解决问题的方法之一

  博客搜索在应用层上不同于以百度为代表的传统图书馆搜索。后者旨在获得准确的信息。根据博客文章的内容和结构特点,博客搜索更注重信息的时效性特征,利用发现群体正在谈论和关注的话题的手段,试图反映变化和趋势。在社交生活中。

  目前,博客搜索可以分为四类。 一、以国内8方、feedsearch、奇博搜索为代表,根据BSP列表手动设置搜索范围,辅助用户提交RSS或博客地址,除及时性外,与百度搜索结果无实质性差异和其他图书馆搜索的相关性。 二、利用搜索技术构建内容门户,例如:解决博客信息的分散,提取必要信息,满足无目的读者的浏览习惯。 三、以Technorati、IceRocket等国外公司为代表,对帖子的内容和结构进行了深入分析。通过对链接和标签的分析,博客被视为群体思想和行为的风向标,反映了现实社会的变化趋势。 四、日报模特,以megite和memeorandum为代表。这是一个实时监控特定博客列表的相关搜索引擎。通过跟踪帖子中的链接,他们可以探索博主之间的交流上下文并以对话的形式呈现。 .

  大部分博客都分散在BSP中,大量的同一主题的个人帖子未能集中形成社会影响。博客作为个人行为不是为了媒体的目的。但聚合博客具有社交媒体效应,类似于社交网络摘要的实现过程。建立基于搜索技术的博客社区是解决问题的途径之一,为博主加强与读者的互动,形成广阔的人际圈提供帮助。

  从另一个角度来看,博客搜索是许多针对用户生成内容的垂直搜索技术应用程序的一个分支。博客、社交相册(flickr)、公众评论、分类广告等都是用户生成内容的世代

  表。在另一类服务中,用户使用采集、投票等“行为方式”作为表达和传达个人意愿的工具。在众多用户信息搜索领域,博客搜索和分类广告搜索发展最快。

  无论是博客搜索、分类广告搜索还是其他搜索。问题最终回到搜索技术和用户生成内容的结合可以满足人们的哪些需求,以及应该提供哪些服务来满足这些需求。

  博客

  博客的兴起和RSS的广泛使用,将互联网上信息发布的来源从企业、组织、机构扩展到了个人。搜狐博客调查显示,目前国内博客写作内容主要是情感和生活。 IT 博客很活跃。博主从满足个人需求和表达自己出发,通过博客传达个人观点。创作过程充满个性和坦诚。作者看重自己独特的原创见解,但不需要追求内容的全面性或权威性。每个人都通过博客写作。有对话和交流。

  大多数博主不想通过写博客成为名人,但更多的关注和交流可以促进作者原创。

  用户内容是在以传播为导向的创作过程中产生的,可能会聚合社交效果,这与传统门户提供的内容明显不同。用户生成的内容是自给自足的,它是对人们目标和需求的积极描述。获取用户需求和满足用户需求同时发生。在观察用户需求,然后提供满足其需求的内容后,这比传统门户更具优势。

  博客收录大量分散的优质内容,如论坛。一种高效、集中的阅读方式,可以帮助用户轻松获取信息。用内容吸引流量就是“入口”功能。

  内容丰富 博客记录的内容广泛。 Bolaa有16个类别(社会、军事、科技、商业、思想、情感、生活、文化、图片、互联网、旅游、体育、教育、娱乐、随笔、播客),每个类别还收录几个子类别。几乎涵盖了传统新闻网站的所有信息类别。

  信息量巨大。百度的调查结果显示,截至2005年11月末,中文博客站点数量达到3682万个,Blogger达到1600万个。根据2005年6月至7月搜狐博客调查结果,如果博主每周更新3次以上超过60%,则每天产生不少于400万条帖子。

  心理特征 博主的心理过程包括创作中积累的成就感和读者增加的荣誉感。对心理满足的追求,使得博客有迎合既定读者的倾向(转帖盛行)。个人博客推广也有需求。

  收录作者感受、观点和评价的圈子和群博客写作具有明显的对话特征。在同一主题相互欣赏的一组博主中相互分享,引发共鸣者进行新的创作。社会化结果是这些关注同一主题的博主群体之间信息的快速传递、提取和衍生创造所产生的。主题下的内容分散在各自作者的博客上。相关话题的讨论也会成为干扰,普通读者缺乏梳理同一话题的交流脉络的有效工具。博客圈隐藏,作者只能看到以自己为中心的一对多关系,无法完全掌握多对多网络博主网络。

  blog=personal network logo MSN Space以模块化的方式提供相册、文章lists、音乐列表等。博客具有完整的个性表达能力。

  blogger=reader 博主参与信息传递,积极阅读为创作积累。博主通过文章相互交流。

  链接是博客的灵魂。博主在帖子中广泛使用超链接。超链接将分散的帖子连接起来,形成一个难以察觉的上下文。跟踪反向链接可帮助博主找到与他们相关的博客。形成岗位评价体系的基础。 Technorati 的计算方法叫做 Net Attention,就是看有多少人链接到了一个用户的博客。

  博客系统以MSN Space为例。收录的模块有:1、网络杂志; 2、照片; 3、List; 4、音乐; 5、archive 文件;可能的内容包括:1、个人描述; 2、日记,评论; 3、存档、分类; 4、reply,引用; 5、好友列表; 6、专辑; 7、mediaplay 播放列表; 8、网选采集;9、文章Repost; 10、播客; 11、其他聚合内容。

  文章主列表会自动生成RSS,其他博客系统也会为文章分类和读者回复提供RSS输出,以便读者订阅更详细的内容。订阅某个用户的RSS通常是指RSS完成。因此,在一定程度上,博主用户和默认的RSS是一一对应的。在狗购等第三方系统中,用户之间的订阅关系被视为feedburner中人与人之间的社交关系。描述一下。

  blogroll 是博客提要的集合,大多数博客系统都会提供 blogroll。将读者引导至其他主题相似、关系密切或由博主筛选的博客。 Blogroll 促进了 Internet 上的通信。大多数博客都可以在读者请求 blogroll 时管理 blogroll 并生成相应的 XML 格式的文档,例如:opml。同样,大多数 RSS 阅读器可以导入 opml 并自动保留收录的 RSS。以博客为中心,根据blogroll可以绘制出博客用户之间的弱关系链图。

  除了可以记录用户产生的信息的博客系统,还有一种面向服务关系的用户评论,也鼓励用户贡献信息,但博客的目的更明确,信息也是结构化的。例如:flickr、asoboo等。在其他服务中,用户行为被作为评价和个性化需求的标志。例如,社交书签记录用户喜欢的动作,digg 记录用户的投票动作。

  目前,越来越多的互联网公司正在通过各种服务(博客、评论、digg)或手段(搜索、用户关系建立和面向目的)来获取具有足够规模效应和不同数据类型的用户生成数据(评论、博客文章、网址、图片、书名、音乐)。用户生成数据和网络行为收录更丰富、更清晰的用户需求和关注趋势描述,但这些数据并没有以直接可用流量的形式呈现,而是隐藏在无形的博客圈中。这与传统的搜索和门户广告模式不同。

  用户生成内容的使用,基于对标签、链接、RSS订阅关系、引用响应关系、采集行为、digg行为等的分析,使博主的社交网络清晰可见,反映人们的注意力取向和需求趋势是进一步应用。体现在日报模式(megite、memeorandum)和市场跟踪咨询模式(technorati)弥补个人注意力的有限,信息门户模式(bolaa)则体现为集中阅读。

  博客搜索

  一、以国内8fang、feedsearch、feedss为代表,根据BSP列表手动设置搜索范围,辅助用户提交RSS或博客地址,以RSS为入口获取全文。除了反映时效性和相关性外,搜索服务的目的与百度等图书馆没有本质区别。

  特点:1、搜索结果按时间或相关性排列,搜索指定时间段内的数据。

  2、 提供类似于 google 的高级搜索语法

  3、RSS 输出搜索结果

  4、搜索覆盖网络总结(365key)、相册(flickr)

  5、与在线RSS阅读器合作,方便搜索结果订阅

  6、Catalogue 搜索,搜索标题,结果是个人页面,提供博客或网页摘要、图片等服务

  7、feed 搜索,相关的feed

  8、feed 中的典型标签作为判断博客主题的依据

  9、作者blogroll绘制的博客关系图

  10、tag 搜索是一个话题搜索和相关话题

  11、提交用户RSS给搜索引擎

  12、搜索结果的源源和博客网址

  13、作者搜索

  14、使用RSS作为搜索的主体。实现RSS项目拆分

  二、利用搜索技术构建内容门户,如:解决博客信息的分散,提取必要信息,满足漫无目的读者的浏览需求。缓解博客信息分散、阅读困难。

  特点:1、posts 分类精选、推荐、突出作者。她可以告诉读者什么好看,但她不能回答博主在说什么。

  2、各种排名

  3、播客联播

  4、在社交、军事等栏目,大量收入信息转发新闻

  5、内容覆盖论坛

  6、提供网页摘要服务

  在bolaa的服务介绍中,强调会为博客作者带来流量,相信会产生更多的交流。但是,从排名结果来看,高流量的文章往往是在转帖,导致博主过于关注流量。 , 不推广原创,但会增加文章的转发次数。 文章的转发只能引发读者评论,不能促进博主之间的交流,因为博主之间的交流是通过写博来实现的。

  三、分析帖子内容中的链接、帖子结构和标签,以Technorati和IceRocket为代表。通过对链接和标签的分析,我们可以获得群体思想和行为的风向标,反映现实社会的变化趋势。

  technorati 遵循传统的页面排名方法。作为一种统计方法。

  在technorati中,分析特定链接被作者引用的次数作为热门信息的评价标准。以此为基础,在Popular 中提供新闻、书籍、电影和博客排名的热门排名。

  用户可以自定义关注列表,跟踪自己感兴趣的关键词。tailrank中,是个人订阅列表(opml)的流行排列方式,更实用,可以提高读者订阅的rss的阅读效率.

  Blog Finder 是一种基于标签的方法,可帮助人们找到某个主题下最权威的博客。允许博主将他们的博客标记为他们认为最合适的类别。是否可以通过分析Feed获取最常用的标签作为博客的典型标签,等价于博客的分类,避免给博客打标签造成的定义污染。

  technorati 是一个实时搜索引擎,它处于最佳状态。它的实时跟踪可以每1分钟刷新一次结果。与其将 technorati 归类为搜索引擎,不如说它是一个实时跟踪引擎。

  四、meme 引擎,作为搜索的动态发展分支,这种日报模式反映了某个领域(科技、政治)的最新热门趋势,类似于谷歌的新闻搜索。此类服务侧重于将分散的博客舆论凝聚成媒体力量。当突发事件发生时,此类服务将成为人们获取新闻的重要渠道。

  问题

  1、 大多数RSS搜索引擎使用类似于Google的PageRank的机制来判断和优化结果,但相关性并不完全令人满意,更符合博客写作和传播特点的信息评价机制需要。将在线读者数据分析、网络摘要数据分析、digg评论分析作为结果相关性排名的权重可能是一个探索方向。

  2、简单搜索可以满足用户获取信息目的明确的需求,但不适合漫无目的的浏览。同时,人们使用博客搜索的目的并不是为了获取准确的信息,博客的写作特点也决定了人们是不允许这样做的。人们使用博客搜索来跟踪某个主题的动态并实时了解正在发生的交流或事件。 technorati 标签输出的广泛订阅也说明了这一点。

  3、 大部分博客搜索仍然局限于满足准确的信息获取,鄙视搜索用户作为读者之间的交流。同时,搜索虽然可以为博客带来流量,但无法放大这种效果。

  3、spam。 technorati 发布的最新调查数据显示,大约 9% 的博客是垃圾邮件。其中一些是软件创建的博客或软件自动发布的帖子。

  4、一些支持多个 BSP 的帖子发布客户端提供嵌入式广告。广告链接是搜索分析链接的干扰因素。

  主题

  1、建立博客精选或使用日报模式组合搜索

  2、博客搜索用户系统介绍

  两条主线:1、获取用户对搜索结果的补充、评论和搜索历史,并以个人页面的形式组织起来; 2、通过补充内容和评论反向发现用户。关键词是中心。

  1、用户针对某个关键字的搜索结果提交补充链接和博客,并设置公开和隐私设置。当其他用户搜索相同的关键字时,会显示公开的补充结果、博客和用户ID

  2、用户评论系统:1、用户对搜索结果发表评论,可以回溯到源博客,2、提供类似的关键词贴吧服务,包括关键词的搜索频率和相关关键词,以关键字为典型标签的博客,以及用户评论

  3、用户可以选择搜索结果,并结合个人提交的相关链接作为个人搜索历史。此个人提交与(1)“补充”。保存的搜索结果和关键字对搜索结果也有不利影响。排序。

  4、用户阻止垃圾邮件

  5、未注册用户可以使用所有功能。用户注册时,用户信息不会丢失,保证用户顺利过渡

  6、可以将用户在搜索引擎中发布的内容,如搜索历史等发布到自己的博客上。

  7、 用户可以设置他们的个人位置。地缘关系是人际关系的体现。

  8、搜索相同关键词的用户构成一个读者圈

  9、具有相同典型标签的博主,帖子收录具有相同联系的博主,形成一个作者圈,

  3、当博客圈可以清晰可见时,可以在博客圈内进行职业流动和项目合作。

  4、搜索结果可提交至主流网文摘要系统或主流网文文摘系统中该结果的采集数量,作为结果排名依据

  5、Keyword or Tag与该关键词或Tag对应的博主、作者群体或作者数量的对应关系

  6、为主题提供回溯地址,博主可以将自己的作品发送到主题创作区。

  7、 用户在搜索中输入的关键词反映了人们的需求,也从另一个角度反映了人们的关注和关注。

  相关

  1、与BSP或博客软件的关系

  在 technorati 中使用 ping 服务自动获取博客更新。 technorati 和 WP(一种广泛使用的博客程序)属于同一个联盟。 WP系统会自动给Ping-o-Matic发Ping,然后Ping-o-Matic会发Ping给最多22个搜索引擎,自然包括technorati。

  2、在线阅读器与博客搜索的关系

  一个RSS量大的在线服务,对于博客搜索基本上可以获得更好的结果,例如:bloglines。基于比较大的数据积累,并且可以记录用户的阅读和点击,然后通过爬虫。这将成为博客搜索的主要竞争对手,但也可以转变为博客搜索的主要合作伙伴。

  3、blog 搜索和digg服务的兴趣关系

  将搜索直接提交给类digg服务,为类digg服务带来资源和流量,同时可以通过投票获得用户对搜索结果的评价,​​以及相关度排名搜索结果被抵消。

  目标

  1、 作为信息门户和沟通渠道,为博主带来更多流量。

<p>2、通过关键词或标签、链接将隐形博客圈描述为清晰可见,并逐圈反映圈内的相关主题(标签、关键词)和作者。让读者被发送到他们关注的圈子,找到自己喜欢的博客,或者根据主题(关键词或标签)组织自己的阅读圈,创建圈子,分享用户数据(为搜索结果提交的链接)。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线