大数据环境下数据仓库建设方案设计

大数据环境下数据仓库建设方案设计

大数据环境下数据仓库建设方案设计

  • 适用:本科,大专,自考
  • 更新时间2024年
  • 原价: ¥309
  • 活动价: ¥200 (活动截止日期:2024-04-28)
  • (到期后自动恢复原价)
大数据环境下数据仓库建设方案设计

大数据环境下数据仓库建设方案设计
摘要
    数据仓库是历史的、主题的、集成的大量数据,以多维的角度分层次分析数据之间的关系,提供数据挖掘功能,寻找数据间的知识,为决策支持提供服务。随着互联网的发展、以及物联网概念的深入,数据成几何级增长,大数据也为了研究热点。
    在上述前提下,在大数据时代建设数据仓库,着重要解决的就是打通企业内数据和企业外数据,实现“全数据”的挖掘和应用,这是大数据的精髓所在。实现全数据的分析,可以更加全面的定位问题,提出解决办法; 针对未来的预测可以更加精确,利用数据挖掘算法实现辅助决策,而分析算法的精确性,取决于影响预测结果的变量多样性和准确性。用户可以针对任何问题进行分析和查询,也就是说,分析系统要提供更加友好的操作体验,更加明细的数据粒度;同时在大数据量的情况下,也能保证分析过程的高效率;数据混搭和数据分享,强调企业内部数据和外部数据的综合分析,以及数据的货币化;而传统数据仓库,由于只专注于打通企业内部的业务系统孤岛,获取到的是企业内部数据,是影响问题的企业内部因素,而引起问题的原因往往是复杂的,除了企业自身因素外,外部的宏观因素、社会因素也是必不可少的分析内容。所以大数据环境下数据仓库的建设目标是实现跨系统数据共享,解决信息孤岛,提升数据质量,辅助决策分析,提供统一的数据服务。
    本次毕设是在上述背景下,研究大数据环境下的数据仓库的建设方案。
关键词:大数据环境下  仓库建设  方案设计
      The data warehouse is a data integration of history, the subject, the analysis of the relationship between data in multi-dimensional hierarchical, provides the function of data mining, data for the knowledge, to provide services for decision support. With the development of the Internet and the concept of Internet of things, the data become geometric growth, and large data is also the focus of research.
Based on the above condition, in the era of big data warehouse construction, an important problem is the open enterprise data and business data, to achieve full data mining and application ", this is the essence of big data. To achieve full data analysis, can be more comprehensive positioning problems, propose solutions for the future; it can be more accurate, the use of data mining algorithms and analysis of decision-making, the accuracy of the algorithm, depending on the results of variable accuracy and diversity. The user can analyze and query for any problem, that is to say, the system analysis to provide a more user-friendly experience, more detailed data granularity; at the same time in the large amount of data, but also to ensure the high efficiency of the analysis process; data mashups and data sharing, emphasizing the comprehensive analysis of internal and external data. And the data of currency; while the traditional data warehouse, because the island business systems only focus on open access to the enterprise, is the enterprise internal data, is the impact of the internal problem of enterprise, and the cause of the problem is often complex, in addition to their own factors, content analysis of macro factors and external society is an essential factor. Therefore, the goal of building a data warehouse in large data environment is to realize cross system data sharing, to solve information silos, to enhance data quality, to aid decision-making analysis, and to provide a unified data service.
The completion of this set is in the above context, research data warehouse under the data warehouse construction program.
Key words: large data environment; warehouse construction; project design


                   目  录

一、大数据环境下建立数据仓库数据库结构和设置数据源 3
1.任务描述 3
2.大数据环境下建立数据仓库数据库 3
3.设置数据源 3
二、销售数据Hbase数据库分析 3
1.任务描述 3
2.设计星型架构多维数据集(Sales) 3
3.设计存储和数据集处理 5
4.Hbase数据库分析 6
三、人力资源数据Hbase数据库分析 6
1.任务描述 6
2.设计父子维度的多维数据集(HR) 7
3.修改多维数据集(HR)的结构 7
4.设计存储和数据集处理 8
5.Hbase数据库分析 8
四、数据仓库及多维数据集其它操作 8
1.任务描述 8
2.设置数据仓库及多维数据集角色及权限 8
3.查看元数据 9
4.创建对策 10
5.钻取 11
6.建立远程 Internet 连接 12
五、数据仓库高级操作 12
1.任务描述 12
2.创建分区 13
3.创建虚拟多维数据集 13
4.DTS调度多维数据集处理 14
5.备份/还原数据仓库  15
六、数据挖掘 15
1.任务描述 15
2.创建揭示客户模式的决策树挖掘模型 15
3.决策树挖掘结果分析 16
4.创建聚类挖掘模型 17
5.聚类挖掘结果分析 18
6.创建基于关系数据表的决策树挖掘模型 18
7.浏览“相关性网络”视图 19


参考文献
[1]曹江辉,齐燕海.大数据时代的数据仓库建设[C].第二十三届媒体融合技术研讨会(ICTC2015)论文集,2015:109-112
[2]钱立国.工程数据库、数据仓库与大数据探讨[J].安徽建筑,2015,(6):198-201 
[3]于鹃.数据仓库与大数据融合的探讨[J].电信科学,2015,(3):20150661-20150836 
[4]费仕忆.Hadoop大数据平台与传统数据仓库的协作研究[D].东华大学,2014
[5]王梅,周娇玲,乐嘉锦.一种列存储数据仓库中的数据复用策略[J].计算机学报,2013,36(8):1626-1635
[6]Karthik Navuluri,Ravi Mukkamala,Aftab Ahmad.Privacy-Aware Big Data Warehouse Architecture[C].2016 IEEE International Congress on Big Data (BigData Congress),2016:341-344
[7]Taewhi Lee,Moonyoung Chung,Sung-Soo Kim,et al.Partial Materialization for Data Integration in SQL-on-Hadoop Engines[C].2016 6th International Conference on IT Convergence and Security,2016:1-2
[8]段云峰,杨凤年,宋俊德.数据仓库必不可少[N].计算机世界,2002-04-15(D41)
[9]谢伟峰.数据仓库成跨系统整合趋势[N].中国计算机报,2009-9-21(028)
[10]谢振宇.基于数据仓库的决策支持系统研究与应用[D].常州:河海大学,2003

 

 

 

 

 

http://www.bysj360.com/html/5839.html
http://www.bysj360.com/html/6302.html

  • 关键词 数据 环境 仓库 建设 方案设计
  • 上一篇:220th燃煤锅炉烟气脱硫工程设计
  • 下一篇:平板硫化机控制系统的研究
  • 暂无购买记录

    暂时没有评论

    真实

    多重认证,精挑细选的优质资源 优质老师。

    安全

    诚实交易,诚信为本。

    保密

    所有交易信息,都为您保密。

    专业

    10年专业经验,10年来帮助无数学子。