查看原文
其他

数据共享:中国文化及相关产业统计年鉴2013-2019(免费)

皮皮侠 数据皮皮侠 2022-07-19

Python网络爬虫与文本分析课

最后四天截止报名

在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。惊奇的是使用Python最多的人群其实不是程序员,而是数据科学家,尤其是社会科学家,涵盖的学科有经济学、管理学、会计学、社会学、传播学、新闻学等等。


大数据时代到来,网络数据正成为潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于网页中。非计算机专业背景的人也可借助机器学习、人工智能等方法进行研究。使用网络世界数据进行研究,面临两大难点:

• 数据的大规模自动获取

• 文本数据(非结构化数据)的处理与分析


数据获取需要借助Python编程语言设计网络爬虫,而获得的数据中有相当比例数据是非结构化数据,这就需要文本数据分析技术。本次课程参照已发表的社科类的文章,希望帮助大家解决文本分析这最难的两大难点。课程设计的初衷是用最少的时间让大家学到最有用的知识点,降低学习难度。希望学习完本课程后能让各位结合研究需要对自己学科内的文本分析有一个全面深刻的了解,方便各位开展后续研究。




邓旭东(大邓):哈尔滨工业大学(HIT)管理学院信息管理系统方向博士。曾在多所大学分享数据采集和文本分析,运营【公众号:大邓和他的Python】主要分享Python、爬虫、文本分析、机器学习等相关内容。






课程概览


· 时间2021年2月27-28日(邓旭东Python)

· 地点钉钉APP(线上直播)

· 授课方式

  Python3.7.5

· 每天6小时(8:30—11:30;14;00—17:00)+30分钟答疑

· 价格:

  2000/人

· 优惠政策:

  皮皮侠数据会员可享受9折优惠!


报名信息


参与对象

高等院校经管专业青年老师和研究生。

报名时间

从即日起

报名咨询

扫码添加微信,拉你进咨询群

缴费方式

支持公务卡、可开发票。


《中国文化及相关产业统计年鉴》

《中国文化及相关产业统计年鉴》是国家统计局和中宣部共同编辑的反映我国文化改革发展情况的统计资料书,是我国正式开展文化产业统计以来出版的首部统计年鉴。本年鉴收录了全国和各省、自治区、直辖市与文化产业相关的统计数据,以及往年全国主要统计数据,是一部全面反映我国文化及相关产业发展情况的资料性年刊。此次分享的数据14、15年为excel格式



,其余年份为pdf格式

免费数据获取方式


1

转发相应数据推送,附文“强烈推荐这个科研数据下载公众号”

2

保留2小时,不设分组,不设私密(领取之前不可删除)

3

公众号回复数据编号091,按提示添加相应微信

4

将截图和数据编号发给皮皮侠004(微信Jarvis19980413)

注:每天限转发&领取1份,所有数据领取方式以最新推送为准

回复时间:10:00-12:00;15:00-16:00;20:00-22:00

本资源从网上下载,只限于科研使用,勿用于商业。如有不妥,请联系本号删除


付费数据(会员免费)

中国海关统计数据20.4-9

会员特供数据

 地方主要官员1949-今

 1990-2020年上市公司微观数据

 1.82G中国工业企业数据库1998-2013

 1990-2019全球治理数据WGI和城市创新创业指数

 中国火炬统计年鉴2008-2019

 中国农村贫困监测报告

 1990-2019全球治理数据WGI和城市创新创业指数

 中国及省级市场化总指数及方面指数:2008-2019

126000+中国最新写字楼信息

 中国农村统计年鉴 (1985-2020)

 各国制度、地理、文化距离

往期数据(会员无须转发,极速获取)

001 中国统计年鉴和县域统计年鉴(2000-2019)

002 中国城市统计年鉴(1995-2019)

003 CMF-宏观金融研究数据集

004 中国能源统计年鉴(1986-2018)

005 中国综合社会调查(CGSS)(2003-2018)

006 中国金融统计年鉴(1986-2019)

007 中国农村统计年鉴 (1985-2019)

008 全球营商环境报告及数据(2004)

009 中国港口年鉴(2000-2019)

011 全国各地区银行网点和从业人数(2007-2018)

012 不平等数据集

013 数字经济产业专题数据

014 县级主要官员1949-今

015 中国环境统计年鉴:1998-2018

016 中国区域经济统计年鉴2001-2014(全)

017 中国及省级市场化总指数及方面指数:2008-2019

018 1.82G中国工业企业数据库1998-2013

019 中国低碳年鉴2010-2016

020 1990-2020年上市公司微观数据

021 中国家庭追踪调查(CFPS)14-18

022 VIIRS/NPP 夜光数据(月数据)2012-2019

023 中国劳动统计年鉴1991-2019

024 中国住户调查主要数据2011-2020

025 中国教育统计年鉴1984-2020

026 31个省级统计年鉴2010-2020

027 全国政府预算报告1978-2020

028 科技进步贡献率2002-2018

029 中国民政统计年鉴:2010-2019

030 全国旅游统计年鉴1978-2019

031 中国人口和就业统计年鉴1999-2019

032 1990-2019全球治理数据WGI和城市创新创业指数

033 中国财政统计年鉴 1999-2019

034 中国工业统计年鉴:1999-2017

036 中国高技术产业统计年鉴1999-2019

037 中国税务统计年鉴2003-2019

038 国家风险国际指南1984-2017&342城固定资产投资额2004-2019

039 中国历史地震数据 -780至1970年

040 全球经济自由度指数1995-2020

041 北京大学数字普惠金融指数2011-2018

042 中国百城月均房价2010-2018&各省外商直接投资额1985-2018

043 地市级创新创业指数1990-2018&中国宏观杠杆率数据1993-2020

044 中国卫生健康统计年鉴2003-2019

046 中国企业所有跨国并购数据库2010-2019

047 中国各省GDP2000-2018&中国政治人物公开活动数据库

048 互联网普及率2010-2017&各省平均受教育年限1998-2018

049 城市统计年鉴地市级面板数据&城市建设统计年鉴&地市级区划

050 和讯网上市公司社会责任指数2010-2019&润灵环球社会责任评级

051 全球竞争力报告2001-2019&各国研发支出占比

052 中国海洋统计年鉴2000-2017

053 中国地震数据2000-2020

054 中国科技统计年鉴1991-2019

055 高等院校科技统计资料汇编 2002-2019

056 中国火炬统计年鉴2008-2019

057 中国农村贫困监测报告

058 中国保险年鉴1981-2019

059 新经济公司数据

060 中国渔业统计年鉴1979-2019 

061 各国制度、地理、文化距离

062 20000+市县官员腐败数据&历史官员信息

063 126000+中国最新写字楼信息

064 全国农产品成本收益资料汇编2009-2019

065 中国教育经费统计年鉴1997-2019

066 50000+特朗普所有“推特”数据

067 320000条中国K12学校数据

068 国土资源统计年鉴&中国林业统计年鉴1992-2019

069 百度&高德人口迁徙等人口数据集

070 全国企业工商信息071 数据大放送-环境、健康、经济、交通072 370000+条人民网地方领导留言板数据073 A股上市公司2020年营业数据074 全国工业品月度产量、季度销量数据1998-2020075 清科资本“投资界”投资数据集076 各类指数数据(商品价格、消费者信心和企业景气及信心)077 省级统计面板数据1994-2019(220+特征)078 城市面板2003-2018(110+指标)&地形起伏数据集079 整理30000多个指标的实证数据2000-2018(免费) 080 年末福利!县域面板数据2001-2018(免费)081 多地区自然资源(大气、土地、水等)面板082 近400万人口迁徙大数据2019-2020083 近300万土地/二手房交易数据084 年末数据大放送-国际、社会、商务、汽车统计年鉴Excel085 分省工业品产量数据2010-2020086 数据共享:高频食品价格数据—研究线上商品价格特征087 中国及各省全要素生产率计算2000-2017&超越对数生产函数随机前沿法(免费088 08-19上市公司数据:企业创新、财务指标、ZF补助、高管薪酬等(免089 面板数据!31省互联网相关指标1997-2018年(免费)090 杰拉·切蒂 大数据学习课程视频资源(免费)



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存