数据分析技术与应用微专业培养方案 | ||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||
一、开设背景 以大数据发展需求为导向,为满足国家“四新”学科对数据分析人才的需求,在我校数据科学与大数据技术专业的基础上,构建了科学合理的数据分析技术与应用微专业核心课程体系。 该微专业以“夯实基础、学科拓展、突出重点、强化实践”为指导思想,采用“跨学科资源共享、网络协作指导、产教融合教学”等教学方式,整合校内外优质资源,满足不同学科、不同专业背景下“人人皆学、处处能学、时时可学”。 二、培养目标 以国家战略需求为导向,以数据处理分析知识为基础,提高学生在各学科应用过程中运用“数据+学科”的思维,培养具有扎实专业理论知识、能灵活运用大数据思维开展创新研究的复合型人才。 三、招生对象及规模 1. 招生对象:在校非计算机类本科生 2. 年度招生规模:150人 3. 招生条件 ① 对数据分析领域的学习有兴趣或有志在该领域从事工作; ② 主修专业成绩良好,学有余力; ③ 综合素质高,具有较强的沟通能力、学习能力及团队合作精神。 4.交流QQ群:727558860 四、学习年限、结业要求及认证形式 1.学习年限:2年 2.结业要求: ①学生在规定的时间内完成培养方案规定的全部课程和学习任务,获得相应的学分。 ②完成实践作品并通过答辩。 3.认证形式:经学院审核、本科生院审定后,由学校统一发放微专业结业证书。 五、课程设置
附: 专业知识科普: 【什么是数据分析(analytics)】 数据分析是运用数据之间的关系和计算机模型来提高商业价值,改进决策制定和理解社会关系的一种方法。 【数据分析的三个阶段】 描述性分析(descriptiveanalysis):将信息的主要特征总结出来; 预测性分析 (predictiveanalytics):利用建模,机器学习,数据挖掘等技术,通过分析历史数据对未来或特定假设进行预测; 指导性分析(prescriptiveanalytics):通过模拟(simulation)和最优化(optimizing)找到最理想决策。 精通这三种方法的数据挖掘专家与分析专家可以帮助公司管理层将浩瀚的数据转化为明智的决策,进而为企业提供竞争优势,并提高他们的利润基准线。 【大数据分析的应用案例】 1.描述性分析(descriptiveanalysis): Netflix是如何推荐你正好想看的电影的? Netflix是美国在线视频租赁商,可以理解为优酷的收费版,它有上千万用户,每个人都有自己不同的喜好。假设你上周末在 Netflix看了两部电影,都是动作片。在所有 Netflix用户中,肯定有很多人也看了这两部的动作片,然后,下个周末,那些人又看了另一部电影,很有可能也是一部动作片。根据你和其他人之前的相似性,Netflix预测你也会想看这部电影。于是这部电影就出现在你网页的相关推荐中了。 2.预测性分析(predictive analytics) 超市如何给你一个你很可能会使用的优惠券? 假设你是一个在减肥的少女,持有某超市的会员卡。你已经连续 3周买减肥茶了,那么分析人员觉得你很有可能下周继续买减肥食品。所以结账时柜台小哥会面带微笑的递给你一张纤维棒的优惠卷,而把同时德芙巧克力的优惠券藏起来。 3.指导性分析(prescriptive analytics) 为什么机票的价格每小时都会变? 经济学告诉我们需求决定价格,如果我们知道什么时候出行的需求量最低,那我们就可以买那个时候的机票,以最便宜的价格坐飞机。事实上航空公司却先我们一步,实时监测上百万条飞行路线,确保高峰期价格最高,同时模拟未来需求曲线,假如未来需求量大,即使当下需求量很低,也保持高价,以满足未来的高价需求。 以我们熟悉的超市购物为例: 1. 超市发现你过去三周内一直在买某类减肥食品,可以预测你下面还要继续购买这个产品,那在付账的时候,直接给你打印一张优惠券,买4赠1搞促销,你觉得占了便宜以后更愿意来这个店,超市也通过给点折扣把你牢牢捆住,免得你去了其他超市。这个叫做Predictive Analytics:分析数据来预测未来可能发生的事情。 2. 超市的analytics team通过分析,发现你购买的减肥食品都具备某个特征,比如是low sodium或low carbs,那具有这类特点的其他相关食品,超市也可以推荐给你。你觉得很高兴,因为超市直接把你需要的产品告诉你,省了你选购物品的麻烦,超市卖了更多的东西给你、赚到了钱,当然也很高兴。这个叫做Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。 【数据科学家的技能】 1.计算机能力:数据的获取和整理 数据整理。任何数据分析项目的第一步是数据整理,对应着数据获取、清洗、格式转换等工作,使之成为可用数据。现在有各种各样的数据格式:数字、表格、 Web网页、文本,甚至包括语音和视频。在处理凌乱的原始数据时,脚本语言(例如 Perl和 Python)是必不可少的。大规模数据。传统的关系型数据库在大规模数据条件下已经不在有效。为了有效地存储庞大的数据集,我们看到的数据库出现的新品种。这些通常被称为非关系数据库,例如谷歌的BigTable和 Amazon的 Dynamo,它们有非常灵活的架构设计,分布在多个节点,以提供“最终一致性”。存储数据只是数据平台建设的一部分。在目前的大规模数据集计算问题上,谷歌推MapReduce方法,基本上它是利用非常庞大的计算集群进行分布计算。最流行的MapReduce开源实现方法就是 Hadoop。Hadoop使“敏捷”数据分析成为可能。在软件开发中,“敏捷”意味着更快的产品周期,开发 商和消费者之间更密切的互动。传统的数据分析需要极长的周转时间。它可能要几个小时、甚至几天才能完成。但是在Hadoop帮助下可以很容易地建立集群,以执行大规模数据集的迅速计算。更快的计算速度使你更容易地测试不同的假设,不同的数据集和不同的算法。 2.数学和统计学能力:数据的挖掘 机器学习是数据科学家的另一项必不可少的工具。目前有许多机器学习库可以利用:在 Python中有 PyBrain,在 Java中有 WEKA,谷歌刚刚宣布了他们的 PredictionAPI,使其机器学习算法得以公开使用。Stanford的机器学习课程,是计算机科学中最流行的课程之一,推荐学习。 虽然在这里没有强调传统的统计模型在数据分析中的重要作用,但是统计是“数据科学的语法”。它是至关重要的。数据科学不只是获取数据然后来猜测其意义,它也包含了假设检验,确保你的数据结论是有效的。统计已成为一项基本技能。它并没有被机器学习或商业智能所取代。虽然有许多商业统计软件包,但开源R语言是一个不可或缺的工具。虽然 R是一个奇怪的语言,但它为大多数统计工作提供“一站式购物”。它还具有出色的绘图功能。 CRAN中包括了多种类型的数据解析器和分布式计算扩展。如果有一个单一的工具,能为统计工作提供了一个最终解决方案,那就是 R语言。 3.图形可视化:数据的提炼和展现 一张图片胜过千言万语,可视化是数据分析的初步探索工作,也是每个阶段的关键。FlowingData博客是一个寻找创意可视化非常棒的地方。这也是我的最爱之一,这个可视化例子就是随着时间的推移,沃尔玛增长的动画。这就是数据可视化的艺术。 【大数据应用案例】 大数据能为农业带来什么? 答案:/art/2023/8/11/art_30715_974312.html
|
【打印本页】 【关闭本页】 |