毕业设计大数据疫情数据分析可视化系统天天播资讯

来源:哔哩哔哩 2023-03-21 09:57:18

0 前言

这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。

为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是

基于python的疫情爬虫分析可视化系统

(资料图)

学长这里给一个题目综合评分(每项满分5分)

难度系数：3分

工作量：3分

创新点：3分

毕设帮助，选题指导，技术解答，欢迎打扰，见B站个人主页

https://space.bilibili.com/33886978

1 课题背景

自2019年12月12日武汉确诊新型冠状病毒患者开始，历时三年之久的新冠疫情仍未结束。新型冠状病毒肺炎(COVID-19)存在人畜跨界传播、传染性强、影响因素多样、传播途径复杂等特点，导致肺炎疫情发病急、发展快、溯源分析难、社会危害大等问题。随着新型冠状病毒毒株的不断变异，现出现了传播性极强、免疫逃逸能力极高的变异病毒。为更直观、更专业地了解疫情的变化，本文设计了基于爬虫、Dianjo、Pyecharts的COVID-19疫情信息可视化系统。该系统主要包括疫情模型预测、疫情信息可视化以及防疫措施指南三大功能，能够实时动态展示疫情发展趋势，并根据预测模型进行疫情预测以及提供有效的防疫措施。

2 实现效果

首页

动画展示

省份统计

省排名

3 Flask框架

简介

Flask是一个基于Werkzeug和Jinja2的轻量级Web应用程序框架。与其他同类型框架相比，Flask的灵活性、轻便性和安全性更高，而且容易上手，它可以与MVC模式很好地结合进行开发。Flask也有强大的定制性，开发者可以依据实际需要增加相应的功能，在实现丰富的功能和扩展的同时能够保证核心功能的简单。Flask丰富的插件库能够让用户实现网站定制的个性化，从而开发出功能强大的网站。

本项目在Flask开发后端时，前端请求会遇到跨域的问题，解决该问题有修改数据类型为jsonp，采用GET方法，或者在Flask端加上响应头等方式，在此使用安装Flask-CORS库的方式解决跨域问题。此外需要安装请求库axios。

Flask框架图

相关代码：

from flask import Flask, render_templateimport csvimport codecsweb = Flask(__name__)# 首页@web.route('/')def index(): return render_template('index.html')# 疫情可视化动画展示模块@web.route('/movie')def movie_list(): movies = [{'file':'top10省现有确诊病例对比.mp4','title':'Top10省现有确诊病例对比'}, {'file':'Top15国现有确诊病例对比.mp4','title':'Top15国现有确诊病例对比'}] return render_template('movie.html',movies=movies)# 中国新冠疫情实时数据地图模块@web.route('/map')def map(): return render_template('map.html')# 今日发生疫情省份统计模块@web.route('/pie')def pie(): with codecs.open(filename='../data/china_data.csv', mode='r', encoding='utf-8') as f: reader = csv.reader(f) head = next(reader) today_confirm1 = {} today_confirm2 = [] for item in reader: args = tuple(item) today_confirm1.update({args[2]: args[3]}) for key, value in today_confirm1.items(): if (value != '0'): # today_confirm2.append({key: value}) today_confirm2.append({'name': key, 'value': value}) print(today_confirm2) return render_template('pie.html',today_confirm=today_confirm2)# 各省累计确诊排名模块@web.route('/rank')def rank(): with codecs.open('../data/china_data.csv', mode='r', encoding='utf-8') as f: reader = csv.reader(f) head = next(reader) province_name = [] province_confirm = [] for item in reader: args = tuple(item) # print(args) province_name.append(args[2]) province_confirm.append(args[9]) print(province_name) print(province_confirm) return render_template('rank.html', province_name=province_name,province_confirm=province_confirm)web.run(debug=True)

4 Echarts

ECharts（Enterprise Charts）是百度开源的数据可视化工具，底层依赖轻量级Canvas库ZRender。兼容了几乎全部常用浏览器的特点，使它可广泛用于PC客户端和手机客户端。ECharts能辅助开发者整合用户数据，创新性的完成个性化设置可视化图表。支持折线图（区域图）、柱状图（条状图）、散点图（气泡图）、K线图、饼图（环形图）等，通过导入 js 库在 Java Web 项目上运行。

5 爬虫

简介

Scrapy是基于Twisted的爬虫框架，它可以从各种数据源中抓取数据。其架构清晰，模块之间的耦合度低，扩展性极强，爬取效率高，可以灵活完成各种需求。能够方便地用来处理绝大多数反爬网站，是目前Python中应用最广泛的爬虫框架。Scrapy框架主要由五大组件组成，它们分别是调度器(Scheduler)、下载器(Downloader)、爬虫（Spider）和实体管道(Item Pipeline)、Scrapy引擎(Scrapy Engine)。各个组件的作用如下：

调度器(Scheduler)：说白了把它假设成为一个URL（抓取网页的网址或者说是链接）的优先队列，由它来决定下一个要抓取的网址是什么，同时去除重复的网址（不做无用功）。用户可以自己的需求定制调度器。

下载器(Downloader)：是所有组件中负担最大的，它用于高速地下载网络上的资源。Scrapy的下载器代码不会太复杂，但效率高，主要的原因是Scrapy下载器是建立在twisted这个高效的异步模型上的(其实整个框架都在建立在这个模型上的)。

爬虫（Spider）：是用户最关心的部份。用户定制自己的爬虫(通过定制正则表达式等语法)，用于从特定的网页中提取自己需要的信息，即所谓的实体(Item)。用户也可以从中提取出链接,让Scrapy继续抓取下一个页面。

实体管道(Item Pipeline)：用于处理爬虫(spider)提取的实体。主要的功能是持久化实体、验证实体的有效性、清除不需要的信息。

Scrapy引擎(Scrapy Engine)：Scrapy引擎是整个框架的核心.它用来控制调试器、下载器、爬虫。实际上，引擎相当于计算机的CPU,它控制着整个流程。

官网架构图

相关代码：

# -*- coding: utf-8 -*-import scrapyimport randomimport timefrom foodwake.items import FoodwakespiderItemclass FoodwakeSpider(scrapy.Spider): name = 'foodwake' allowed_domains = ['www.foodwake.com'] start_urls = ['http://www.foodwake.com/category/food-class/0'] # //：匹配任意位置的节点 @：匹配属性 def parse(self, response): for box in response.xpath('//div[@class="row margin-b2"]//a'): new_url = box.xpath('.//@href').extract()[0] yield scrapy.http.Request(new_url, callback=self.parse_item) def parse_item(self, response): for box in response.xpath('//div[@class="row margin-b2"]//a'): new_url = box.xpath('.//@href').extract()[0] yield scrapy.http.Request(new_url, meta={"url": new_url}, callback=self.parse_item_info) def parse_item_info(self, response): item = FoodwakespiderItem() name = response.xpath('//h1[@class="color-yellow"]/text()').extract()[0].strip() # food_nickname = "" # try: # nicknames = response.xpath('//h2[@class="h3 text-light"]/text()').extract()[0].strip() # food_nickname = nicknames.split('：')[1] # except: # food_nickname = "无" # url = response.meta["url"] infoList = [] for box in response.xpath('//table[@class="table table-hover"]//tr'): tds = box.xpath('.//td') if len(tds) == 3: info = {} td_name = tds.xpath('.//text()').extract()[0] td_unit = tds.xpath('.//text()').extract()[1] td_value = "" try: td_value = td_unit + tds.xpath('.//text()').extract()[2] info[td_name] = td_value except: info[td_name] = td_unit infoList.append(info) item['name'] = name item['info'] = str(infoList) # item['url'] = url # item['nickname'] = food_nickname yield item print("······休眠 1 至 5 秒······") time.sleep(random.randint(1, 5))

6 最后

毕设帮助，选题指导，技术解答，欢迎打扰，见B站个人主页

https://space.bilibili.com/33886978

0 前言

1 课题背景

2 实现效果

3 Flask框架

4 Echarts

5 爬虫

6 最后

苏州姑苏区打造“吴优数购”服务品牌 让消费者不受限制高效、便捷地退货

奶茶山寨店线上线下“两重天” 外卖平台或充当“保护伞”

算法推荐“越界了”？江苏上线“算法开关”重塑价值观

俄媒：SpaceX一枚火箭残骸将撞上月球，预计在今年3月发生

美国新冠肺炎确诊7335万 死亡87.8万

毕业设计 大数据疫情数据分析可视化系统 天天播资讯

LPR连续7个月维持不变，后续调降动能有待积累

今日热议：精研科技（300709）：3月20日北向资金减持9500股

2023年3月20日广东省四氢呋喃价格最新行情预测-全球快看点

中国巨石: 中国巨石关于公司及公司全资子公司巨石集团有限公司2023年发行公司债及非金融企业债务融资工具的公告_每日速讯

土地规模化经营助推农业现代化

全球看点：项目管理系统可以帮助企业解决哪些问题？

欧洲斯托克50 6月合约跌0.4% 抹去早盘因瑞银收购瑞信后1.4%的涨幅

王者荣耀城市海选赛湖北·武汉青博会站落幕

梅西赛前遭到巴黎球迷巨大嘘声 爆冷输球后拒绝谢场_环球热议

从“一朵花”看消费升级新趋势

数码痴呆症_关于数码痴呆症简介|滚动

世界看热讯：广东外援肌肉拉伤，新外援迫在眉睫，麦克勒莫成摆设

特斯拉的厨卫产品怎么样 环球热消息

正戊酸_天天热消息

可怕！下水管堵塞，女子用疏通剂发生爆炸被毁容，法院判了 世界百事通

今日热讯：主动语态变被动语态例句_主动语态

香奈儿代购香水_香奈儿代购-焦点信息

【世界热闻】sexy_说一说sexy的简介

仿野生养殖 延续江鲜舌尖美味 长江三鲜预制菜轻松“游”入寻常百姓家

山中春尽 全球热文

特朗普呼吁俄方立即实现和平 为了竞选特朗普重返脸书我回来了(今日/头条)

雕版印刷术发明时间和发明人_雕版印刷术发明时间-天天消息

盘州市气象台继续发布大风蓝色预警信号【Ⅳ/一般】【2023-03-18】

环球通讯！推荐一款轻量级全栈式开源测试平台！

仁烁光能钙钛矿叠层电池和组件获评2022年度中国科学十大进展

业绩快报：广弘控股2022年净利润9.17亿 同比增长177.02%_环球快资讯

南网储能：拟投资开发揭阳市揭西县大洋抽水蓄能电站项目 焦点热门

阻燃ul94 标准名称_ul94v0阻燃测试标准-全球快讯

百事通！2023年沧州汽车消费券活动

苏州姑苏区打造“吴优数购”服务品牌让消费者不受限制高效、便捷地退货

美国新冠肺炎确诊7335万死亡87.8万

毕业设计大数据疫情数据分析可视化系统天天播资讯

梅西赛前遭到巴黎球迷巨大嘘声爆冷输球后拒绝谢场_环球热议

特斯拉的厨卫产品怎么样环球热消息

可怕！下水管堵塞，女子用疏通剂发生爆炸被毁容，法院判了世界百事通

仿野生养殖延续江鲜舌尖美味长江三鲜预制菜轻松“游”入寻常百姓家

山中春尽全球热文

特朗普呼吁俄方立即实现和平为了竞选特朗普重返脸书我回来了(今日/头条)

业绩快报：广弘控股2022年净利润9.17亿同比增长177.02%_环球快资讯

南网储能：拟投资开发揭阳市揭西县大洋抽水蓄能电站项目焦点热门