抓取ajax动态网页java(7开发语言:Myeclipse微博爬虫:Tomcat情感分析算法)
优采云 发布时间: 2022-02-20 19:23抓取ajax动态网页java(7开发语言:Myeclipse微博爬虫:Tomcat情感分析算法)
#WeiboEmotionAnalyzer###系统介绍在本系统中,视图层使用JSP+CSS+JavaScript设计前端界面,包括数据校验、用户交互、图表展示等功能,其中JSON文本格式用于与背景的互动;control 层由servlet实现。servlet根据前端发来的用户的具体请求,选择合适的视图进行展示,对请求进行解释,并以JSON格式返回数据给客户端;本系统模型层的功能是分析微博数据。进行情感分析,并为servlet提供一个使用分析结果的接口,经过一定的处理后发回给客户端。###主要内容1.微博爬虫1. 1 使用 JSOUP 抓取和解析在线微博。2.情感分析算法2.1 中文分词,使用中文自然语言处理(NLPIR)对微博文本进行分词。2.2 情感分析,使用基于情感字典的方法(包括七种情感的概率值)进行情感分析,算法综合表情符号、程度副词和否定副词计算微博的情感值。3.图文展示3.1 数据处理,对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。情感分析算法2.1 中文分词,使用中文自然语言处理(NLPIR)对微博文本进行分词。2.2 情感分析,使用基于情感字典的方法(包括七种情感的概率值)进行情感分析,算法综合表情符号、程度副词和否定副词计算微博的情感值。3.图文展示3.1 数据处理,对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。情感分析算法2.1 中文分词,使用中文自然语言处理(NLPIR)对微博文本进行分词。2.2 情感分析,使用基于情感字典的方法(包括七种情感的概率值)进行情感分析,算法综合表情符号、程度副词和否定副词计算微博的情感值。3.图文展示3.1 数据处理,对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。使用中文自然语言处理 (NLPIR) 来分割微博文本。2.2 情感分析,使用基于情感字典的方法(包括七种情感的概率值)进行情感分析,算法综合表情符号、程度副词和否定副词计算微博的情感值。3.图文展示3.1 数据处理,对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。使用中文自然语言处理 (NLPIR) 来分割微博文本。2.2 情感分析,使用基于情感字典的方法(包括七种情感的概率值)进行情感分析,算法综合表情符号、程度副词和否定副词计算微博的情感值。3.图文展示3.1 数据处理,对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。使用基于情感字典的方法(包括七种情感的概率值)进行情感分析,该算法综合表情符号、程度副词和否定副词计算微博的情感值。3.图文展示3.1 数据处理,对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。使用基于情感字典的方法(包括七种情感的概率值)进行情感分析,该算法综合表情符号、程度副词和否定副词计算微博的情感值。3.图文展示3.1 数据处理,对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。对微博文本情感分析结果进行一定的分析和统计。3.2 图表展示,使用highcharts插件绘制曲线图、饼图、折线图、柱状图等统计图表,直观展示情感分析结果。
###开发环境开发工具:Myeclipse 服务器:Tomcat 7 开发语言:Java、jsp、css、JavaScript(jQuery)js脚本调试:Firebug插件(火狐浏览器)###Deploy复制项目的所有内容tomcat_bin文件夹放入tomcat的bin目录下的###TODO: - 重构代码,尽量消除重复,让代码更具表现力。- 提升微博爬虫性能,增加多进程。- 添加一个数据库来存储爬取的微博数据,而不是静态文件。- 改进情感分析算法,尝试基于机器学习的算法。(待定)——添加新的功能需求,尽可能接近实际需求