创新应用型数据分析技术与应用微专业介绍 | |||||||
|
|||||||
【微专业的培养定位】 微专业的开设是学校基于学科综合优势,主动适应新技术、新业态、新模式、新产业的需求,是为构建新型跨学科专业组织模式、促进学科专业交叉融合和产学研用协同发展而实施的多样化办学模式探索。 微专业可采用线上、线下、线上线下相结合等多种方式开展教学。每个微专业一般开设5-10门课程、15-30学分,一般安排在校通识任选课时段或周六日以及寒暑假时段排课。学生完成微专业课程学习、达到微专业培养计划要求者可获得学校颁发的微专业学习证书。 【开设背景】 我国“十三五”规划纲要已明确将大数据上升为国家战略,我们已经进入以大数据为基础的智能时代,大数据正在成为智慧农业、智能制造、智慧城市、智慧医疗等各行业数字转型的重要工具, 现在每年都有4400000个大数据的岗位需求,特别需要既懂行业又懂大数据的复合型人才。 【选择理由】 (1)几乎所有岗位都需要数据分析技能。无论你是处于单位中的哪个岗位,从科研数据的结果处理、到企业的专职数据分析、市场策划、销售运营、客户服务,都要求掌握数据分析。 (2)几乎所有行业都需要数据分析人才。只要单位有业务决策需求,都离不开数据分析这个“工具”,数据分析是业务绩效的关键组成部分。不懂数据,热门职位很大程度上会失之交臂,所以数据分析逐步成为各个行业通吃的技能,能够洞察数据规律,做出驱动业务高效增长决策的人才必是市场上的“抢手货”,且都能有不错的收入水平。 (3)学习完该辅修专业可以具备统计学基本理论知识和数据采集、清洗整理、挖掘分析和转化应用基本技能,能够独立完成对实际问题的统计分析,有利于跨专业考研和就业。 【培养目标】 数据分析技术与应用微专业,以实践引领理论知识的学习,培养学生具有大数据的思维方式,掌握大数据处理的常用平台与技术,熟悉大数据处理的基本流程以及每个阶段的常用技术和方法,能够在原有专业领域中根据业务需要提出用大数据解决问题的思路和基本方案,实现大数据分析与应用的关键技术在行业领域的应用,具有较强的大数据分析与应用技能和持续学习能力的“大数据+行业领域”的复合型人才,提升创新能力与就业竞争力。 【课程设置与结业学分】 5门课 15个学分 【师资力量】 数据分析技术与应用微专业教学团队以信电学院优秀师资为主体,聘请行业专家,联合组建了一支结构合理、务实高效、懂理论会实操的教学团队,现有校内教师5人,校外指导教师2人。 【学费】 微专业收费按照我校相关规定,根据学分收取。 【毕业证书】 微专业修读年限为2个学期(含寒暑假)。成绩单独管理,不计入主修专业成绩单。完成全部课程修满学分的同学可获得我校授予的数据分析技术与应用微专业荣誉证书。 【招生对象与要求】 数据分析技术与应用微专业面向学校全日制本科生大二、大三年级招生。 具体选拔条件如下: ①对数据分析领域的学习有兴趣或有志在该领域从事工作; ②主修专业成绩良好,学有余力; ③综合素质高,具有较强的沟通能力、学习能力及团队合作精神。 【班级管理】 项目单独编班组织教学,每学期安排7-8个学分的课程,在第3、4或者5、6学期周末和寒暑假授课。授课采用面授讲课、案例教学与实战操作为主,以网络课程或大学慕课为辅的混合式教学方式,定期举办线下相关交流或实践活动。 【报名办法及联系方式】 报名时间:具体请关注学校教务处或数理学院网站报名通知,预计第3周开始 报名申请:学生正式报名时应提交《中国农业大学微专业修读申请表》。 联系人:李辉 老师 13466758365(微信同号) 报名咨询QQ群:727558860 腾讯会议直播介绍专业相关情况:月 日 :00~:00 会议号: 注:招生培养结业政策如果与教务处最新规定不一致的地方,以学校文件为准。 数据分析技术与应用微专业期待您的加入!
专业知识科普: 【什么是数据分析(analytics)】 数据分析是运用数据之间的关系和计算机模型来提高商业价值,改进决策制定和理解社会关系的一种方法。 【数据分析的三个阶段】 描述性分析(descriptiveanalysis):将信息的主要特征总结出来; 预测性分析 (predictiveanalytics):利用建模,机器学习,数据挖掘等技术,通过分析历史数据对未来或特定假设进行预测; 指导性分析(prescriptiveanalytics):通过模拟(simulation)和最优化(optimizing)找到最理想决策。 精通这三种方法的数据挖掘专家与分析专家可以帮助公司管理层将浩瀚的数据转化为明智的决策,进而为企业提供竞争优势,并提高他们的利润基准线。 【大数据分析的应用案例】 1.描述性分析(descriptiveanalysis): Netflix是如何推荐你正好想看的电影的? Netflix是美国在线视频租赁商,可以理解为优酷的收费版,它有上千万用户,每个人都有自己不同的喜好。假设你上周末在 Netflix看了两部电影,都是动作片。在所有 Netflix用户中,肯定有很多人也看了这两部的动作片,然后,下个周末,那些人又看了另一部电影,很有可能也是一部动作片。根据你和其他人之前的相似性,Netflix预测你也会想看这部电影。于是这部电影就出现在你网页的相关推荐中了。 2.预测性分析(predictive analytics) 超市如何给你一个你很可能会使用的优惠券? 假设你是一个在减肥的少女,持有某超市的会员卡。你已经连续 3周买减肥茶了,那么分析人员觉得你很有可能下周继续买减肥食品。所以结账时柜台小哥会面带微笑的递给你一张纤维棒的优惠卷,而把同时德芙巧克力的优惠券藏起来。 3.指导性分析(prescriptive analytics) 为什么机票的价格每小时都会变? 经济学告诉我们需求决定价格,如果我们知道什么时候出行的需求量最低,那我们就可以买那个时候的机票,以最便宜的价格坐飞机。事实上航空公司却先我们一步,实时监测上百万条飞行路线,确保高峰期价格最高,同时模拟未来需求曲线,假如未来需求量大,即使当下需求量很低,也保持高价,以满足未来的高价需求。 以我们熟悉的超市购物为例: 1. 超市发现你过去三周内一直在买某类减肥食品,可以预测你下面还要继续购买这个产品,那在付账的时候,直接给你打印一张优惠券,买4赠1搞促销,你觉得占了便宜以后更愿意来这个店,超市也通过给点折扣把你牢牢捆住,免得你去了其他超市。这个叫做Predictive Analytics:分析数据来预测未来可能发生的事情。 2. 超市的analytics team通过分析,发现你购买的减肥食品都具备某个特征,比如是low sodium或low carbs,那具有这类特点的其他相关食品,超市也可以推荐给你。你觉得很高兴,因为超市直接把你需要的产品告诉你,省了你选购物品的麻烦,超市卖了更多的东西给你、赚到了钱,当然也很高兴。这个叫做Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。 【数据科学家的技能】 1.计算机能力:数据的获取和整理 数据整理。任何数据分析项目的第一步是数据整理,对应着数据获取、清洗、格式转换等工作,使之成为可用数据。现在有各种各样的数据格式:数字、表格、 Web网页、文本,甚至包括语音和视频。在处理凌乱的原始数据时,脚本语言(例如 Perl和 Python)是必不可少的。大规模数据。传统的关系型数据库在大规模数据条件下已经不在有效。为了有效地存储庞大的数据集,我们看到的数据库出现的新品种。这些通常被称为非关系数据库,例如谷歌的BigTable和 Amazon的 Dynamo,它们有非常灵活的架构设计,分布在多个节点,以提供“最终一致性”。存储数据只是数据平台建设的一部分。在目前的大规模数据集计算问题上,谷歌推MapReduce方法,基本上它是利用非常庞大的计算集群进行分布计算。最流行的MapReduce开源实现方法就是 Hadoop。Hadoop使“敏捷”数据分析成为可能。在软件开发中,“敏捷”意味着更快的产品周期,开发 商和消费者之间更密切的互动。传统的数据分析需要极长的周转时间。它可能要几个小时、甚至几天才能完成。但是在Hadoop帮助下可以很容易地建立集群,以执行大规模数据集的迅速计算。更快的计算速度使你更容易地测试不同的假设,不同的数据集和不同的算法。 2.数学和统计学能力:数据的挖掘 机器学习是数据科学家的另一项必不可少的工具。目前有许多机器学习库可以利用:在 Python中有 PyBrain,在 Java中有 WEKA,谷歌刚刚宣布了他们的 PredictionAPI,使其机器学习算法得以公开使用。Stanford的机器学习课程,是计算机科学中最流行的课程之一,推荐学习。 虽然在这里没有强调传统的统计模型在数据分析中的重要作用,但是统计是“数据科学的语法”。它是至关重要的。数据科学不只是获取数据然后来猜测其意义,它也包含了假设检验,确保你的数据结论是有效的。统计已成为一项基本技能。它并没有被机器学习或商业智能所取代。虽然有许多商业统计软件包,但开源R语言是一个不可或缺的工具。虽然 R是一个奇怪的语言,但它为大多数统计工作提供“一站式购物”。它还具有出色的绘图功能。 CRAN中包括了多种类型的数据解析器和分布式计算扩展。如果有一个单一的工具,能为统计工作提供了一个最终解决方案,那就是 R语言。 3.图形可视化:数据的提炼和展现 一张图片胜过千言万语,可视化是数据分析的初步探索工作,也是每个阶段的关键。FlowingData博客是一个寻找创意可视化非常棒的地方。这也是我的最爱之一,这个可视化例子就是随着时间的推移,沃尔玛增长的动画。这就是数据可视化的艺术。 |
【打印本页】 【关闭本页】 |