大数据需求分析报告 数据库需求分析报告范文第6篇

2024-04-27 11:05:00 来源 : haohaofanwen.com 投稿人 : admin

下面是好好范文网小编收集整理的大数据需求分析报告 数据库需求分析报告范文第6篇,仅供参考,欢迎大家阅读!

大数据需求分析报告

数据库需求分析报告范文第1篇

数据挖掘 (Data Mining) 就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中, 提取出隐含在其中的, 人们事先不知道的, 但是又具有潜在有用价值的信息和知识的一个过程, 又被称为从数据库中的知识发现 (Knowledge Discovery in Database, 简称为KDD) 。数据挖掘不同于传统的数据分析, 二者有着本质的区别, 数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。通过挖掘所得到的信息应该具有未知、有效和可实用等三个特征。整个KDD通常会有若干个挖掘的步骤组成, 通常, 数据挖掘是其中最重要的一个步骤。

1.1 数据挖掘的功能

数据挖掘的功能通常具有五类, 分别是:概念的描述、分析与预测、聚类分析、关联分析和异类分析。

1.1.1 概念的描述

单纯的一个概念通常是对一个包含着大量数据的类的总体情况的描述, 通过对包含着大量数据的类进行概括性的总结获得简明、准确的描述。概念描述通常可以分为特征性描述和区别性描述, 特征性描述是指某类对象的共同特征, 区别性描述则是不同类型对象之间的区别。

1.1.2 分类与预测

分类用于抽取能够描述重要数据的集合或用来预测未来数据趋势的模型。分类方法用来预测数据对象的离散类别, 与此同时, 预测则可以用来预测数据对象的连续取值。

1.1.3 聚类分析

聚类分析的基本原则是:“各聚类内部数据对象间的相似度最大化;而各聚类对象间相似度最小化”。

1.1.4 关联分析

关联可以分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关系图。有时候并不知道数据库中数据的关联函数, 即使有时候时知道, 也是不确定的, 因此关联分析所产生的规则也是带有一定可信度的。

1.1.5 异类分析

异类分析也叫孤立点分析。那些符合大多数数据对象所构成的规律的数据对象就被称为是异类。对异类数据的分析处理通常被称为是异类挖掘。数据挖掘能够帮助移动运营商减少成本、减少风险、提高资金的回报率。现在国内有很多公司在采用数据挖掘技术来判断究竟哪些客户是最具有价值的客户, 从而重新调整产品的推销策略, 目的在于用最少的投入来获取最大的利润。移动通信业率先使用数据挖掘技术来检测和区分垃圾短信, 信用欺诈等违法行为。

2. 手机客户的需求分析

通过对手机用户的行为进行分析, 从而为手机的运营商提供数据统计, 方便管理者从总体上了解运营情况, 为管理者提供决策支持, 从而满足手机客户的需求。

2.1 手机客户的分类预测

通过数据挖掘对手机客户的行为和习惯进行分析和预测, 为运营商的新业务提供参考, 同时也可以指定个性化具有针对性的业务推广, 从而减少盲目性的投入, 以节约资源。我们可以通过建立移动用户决策树数据挖掘模型, 可以在较短的时间内建立相应的决策树, 从而根据用户的年龄、性别和所属的城市对用户类型进行预测, 可以帮助我们发展具有潜力的客户。

2.2 手机客户行为的抽取和转换

用户历史数据的抽取和转换程序需要驻留在服务器上, 每天都要统计前一天手机客户的行为数据, 并存放在相应的信息数据库中。由于历史数据比较大, 为了加快速度, 需要给历史表创建视图, 以屏蔽掉无用的数据。分析人员需要信息数据库中提取每日的业务数据, 然后进行数据的转换并写到用户行为的历史表中去, 从而可以很方便的收集和建立数据的立方体。

2.3 建立用户行为的数据集市

数据集市就是面向部门规模比较小的数据仓库。通常我们会建立用户行为的OLAP数据库模型。OLAP通过建立数据方块 (Cube) , 提供快速的数据访问和计算能力。通常OLAP的数据库模式包含两种, 一种是星型, 另一种是雪花模式。用户行为历史数据OLAP数据采用的是星型模式。

3. 小结

收集已经成为人们生活中必不可少的一个工具, 它给人们生活带来了极大的方便。本文中首先对数据挖掘这一概念进行介绍, 对数据挖掘的功能进行了详细的描述。通过对手机客户的需求分析进而实现数据的抽取和转换以及数据集市的建立。通过数据挖掘技术来对手机客户的需求进行分析, 以发现和归纳出手机用户的行为特点, 从而改变自己的营销策略, 以较少的投入来扩大数据业务的用户量。

参考文献

[1]Jiawei Han.数据挖掘:概念与技术[M].机械工业出版社, 2001.

数据库需求分析报告范文第2篇

关键词:陆军后勤装备,作战运用,数据资源,需求分析

本文研究对象范围主要是陆军战役集团 (集团军及以上)、 陆军战术兵团(师、旅、团)以及合成营的现役和即将列装必要的后勤保障装备。数据资源建设总体框架如图1如示。

1后勤保障运用任务及手段

1.1陆军后勤保障装备作战运用研究任务

陆军后勤保障装备作战运用数据资源建设成果,可以指导和支撑陆军后勤部(分)队保障能力研究,以及后勤装备保障任务、 作战编配、作战环境、战术运用和保障效能等方面的研究,并为陆军后勤保障装备作战需求论证提供支持。

1.1.1部队后勤保障能力分析

陆军部队后勤保障能力分析主要包括单要素保障能力和综合保障能力分析。陆军后勤保障装备作战运用数据资源,可直接支撑陆军后勤保障装备机动力、防护力、信息力等要素作战保障能力及综合保障能力的评估分析。

1.1.2后勤保障任务分析

陆军部队后勤保障任务分析以装备的战术技术性能为基础, 同时考虑作战行动的战场环境、保障对象情况和不同的行动阶段。 陆军后勤保障装备作战运用数据资源,可以支持从任务阶段、任务概貌、成功准则、任务周期、环境概貌等方面进行作战任务分析。

1.1.3后勤保障编配分析

后勤保障编配分析的重点是确定后勤装备编配、人员编配和编配方案。陆军后勤保障装备作战运用数据资源,可以用于分析特定作战背景下新装备运用的作战保障编组,单装和系统编配方案的保障能力及优化,以及新装备的编配对同类装备编配的影响等。

1.1.4作战环境分析

作战环境制约陆军后勤保障装备作战运用方式和方法。作战环境数据主要包括自然、人文、电磁等环境数据和环境对陆军后勤保障装备作战运用影响数据,支撑分析武器装备作战运用所处的战场环境及其影响。

1.1.5后勤保障效能评估

后勤保障运用效能评估是用来衡量保障人员及后勤装备在作战保障中,能否完成保障任务的一个非常重要的指标,后勤保障效能评估的核心不是评估方法,而是评估的指标及数据,陆军后勤保障装备作战运用数据资源建设,可为后勤保障效能评估提供相关数据支持。

1.1.6后勤保障装备需求论证

采用定性与定量分析相结合,以定量分析为主,是后勤保障装备需求论证的趋势。后勤装备在生产、定型过后,还需要经过部队训练和实战的检验。通过后勤装备在部队训练、演习中的作战运用来检验装备的可靠性、可用性等。通过部队训练、演习过程中后勤保障装备作战运用数据资源的建设,分析未来作战对后勤装备的建设需求,为装备的研制生产、加改装与退役报废提供决策依据。

1.2陆军后勤保障装备作战运用研究流程

陆军后勤保障装备作战运用研究,因任务的不同而有区别, 也有共性。从共性角度,陆军后勤保障装备作战运用研究的流程,可分为提出问题、分析问题、形成方案及评价、开展论证、试训试用、形成结论及建议6个步骤,在多个环节数据资源建设为其提供支持,如图2所示。

1.3陆军后勤保障装备作战运用研究手段

在陆军后勤保障装备作战运用过程中,通过引进吸收和自主创新研发,依靠系统分析、模拟仿真、专家研讨、作战实验、部队演习等手段取得了不少成果,并发挥了重要作用。由于数据资源的缺乏,系统分析主要以定性分析为主,影响了准则的选择和确定,降低了可操作性和可检验性,限制了对部队作战训练的指导作用。以模拟仿真为代表的定量分析手段所需要的支撑数据,一直存在权威性不够高、标准不统一、数据分散且难以交换共享等问题,直接导致了作战运用研究的结果存在不够客观准确、可信度不高等问题。即便是后勤装备作战实验研究,由于数据资源建设基础薄弱,模型数据参数缺乏等,特别是部队作战训练数据缺失,使得建模工作遇到巨大的困难,影响了作战实验结果的可信度,制约了后勤装备作战运用研究成果的客观性、科学性和适用性,亟待通过数据资源建设,提高数据应用能力与水平,完善后勤装备作战运用研究环节,提高后勤装备作战运用研究水平。为从根本上解决这一突出问题,迫切需要开展陆军后勤保障装备作战运用数据资源建设工作。

2对数据资源的建设需求

2.1满足陆军后勤保障装备作战运用研究的需要

针对特定后勤保障任务,研究陆军后勤保障装备的编配编组、使用时机、保障效能等问题,形成有较强实用性和针对性的研究成果,提高后勤保障装备作战效能,指导后勤部(分)队科学运用装备,是陆军后勤保障装备作战运用研究的重要目的。

开展后勤保障装备作战运用研究,需要依托大量高可靠性的作战运用数据,这些数据涉及后勤保障样式、装备性能、装备编配、后勤保障任务、战场环境、作战规则、作战保障对象、作战部署、指挥组织、行动方法、后勤保障效能等多个方面。缺乏这些数据的支持,后勤保障装备作战运用研究就不可能得出可信的结论。所以开展后勤保障装备作战运用研究必须有翔实、可靠的数据资源支撑。当前陆军后勤保障装备研究过程中,由于缺乏装备作战运用数据强有力的支撑,致使陆军后勤保障装备作战运用理论研究和武器装备作战运用实(试)验定性分析多、定量分析少,对陆军后勤保障装备作战运用实践指导性不强。因此,开展陆军后勤保障装备作战运用数据资源建设,形成完整、准确、 可靠的作战运用数据资源库,对于促进陆军后勤保障装备作战运用研究和陆军后勤保障装备作战运用实(试)验,具有重要的指导意义。

2.2指导陆军部队科学运用后勤装备的需要

科学运用后勤装备是提高陆军后勤部队作战能力和训练水平的重要标志,也是陆军后勤部队战斗力生成的重要模式。陆军后勤装备在不同保障任务、保障样式、作战环境等条件下的作战编配、作战部署、作战效能等作战运用数据,对于科学制订后勤装备作战使用方法、克服后勤装备运用过程中的薄弱环节、充分发挥后勤装备的作战效能具有重要的支撑作用。同时,这些数据也是对陆军合成部队和兵种单位参战力量和作战行动实施统一的机动保障和实时控制的依据。虽然我军数据工程建设取得了很大成绩,陆军武器装备作战运用数据建设也在进行中,但在建设过程中,发现后勤保障装备作战运用数据资源建设尚无相关建设支持单位,并且存在着非常突出的问题,主要是后勤保障运用数据不精准、数据需求不全面、数据资源不丰富等。因此,开展陆军后勤保障装备作战运用数据资源建设,既是对陆军后勤保障装备作战运用数据资源建设的补充,也有利于指导陆军后勤部队在作战和训练中科学运用后勤装备,对提高后勤部(分)队作战训练水平具有重要的意义。

2.3支持陆军后勤保障装备论证评估的需要

数据库需求分析报告范文第3篇

如何在竞争中保证企业的持久竞争力,是每个企业必须面对的问题,而企业各业务环节的不断融合以及数据共享能够为企业发展提供持续的竞争力。数据共享与业务融合致力于提高组织、应用及信息之间的协调能力和协同效果,以达成一定的目标。而如何脱离单一部门或者单一业务的模式,从企业整体业务及信息技术层面分析并提出数据共享与业务融合需求,是企业打破业务之间的壁垒、消除信息孤岛过程中首先需要解决的问题。企业架构从企业全局视角描述业务、信息、技术和应用间的关联关系,是沟通企业业务与信息技术的共同语言,能够为数据共享与业务融合需求分析提供有效工具[1]。

本文以企业架构为基础,从业务流程入手,结合企业架构各层次之间的关联关系,对数据共享及业务融合的需求点进行全过程分析,从而进一步指导后续的系统集成。

1 数据共享与业务融合需求现状

数据共享与业务融合可实现业务与环境的紧密耦合,提升业务成熟度。很多企业通过流程标准化、建立公共数据模型、建立公共数据资源池等手段着手数据共享与业务融合,已经取得了一定成效。但与企业的整体发展要求相比,在数据共享与业务融合需求收集以及分析方面还存在一定的问题,主要体现在以下几个方面。

1)缺少在企业各业务相互作用关系结构下的整体分析,数据共享与业务融合需求收集依赖于单一业务部门。由于不同职能部门的管理重点不同,不同业务部门的业务需求一般不同,同时业务部门提出需求的质量在较大程度上取决于需求提出人员的能力与认知水平。因此,业务部门所提出的需求往往难以一致地描述出来。

2)缺少从业务需求到信息技术实现的关联分析,业务部门和信息部门难以形成协同推进的良性格局。由于信息系统由不同厂商承建,建设方案往往也不相同,导致难以对数据共享与业务融合需求进行分析。

3)缺少在企业业务或信息系统变动下的及时有效分析,数据共享与业务融合需求收集难以常态化进行。由于定期以专项工作的方式向业务部门收集需求,使得业务或信息变化后无法及时反映数据共享与业务融合需求的变更。

2 数据共享与业务融合的需求分析方法

数据共享与业务融合的主要目标是打破业务之间的壁垒。然而,由于不同业务归属不同部门管理,业务之间的壁垒往往不可避免。将整体业务过程进行适当分解,将任务落实到具体的部门和人,从而形成多个相对独立的应用系统,相对独立的应用系统或以单一业务为核心的模式破坏了整体性,给全局的业务流程管理与自动化、全局的业务视图等带来了困难。而企业架构可从全局视角描述业务、应用、数据以及技术之间的关系[2],因此通过企业架构的方法可以解决局部与整体的矛盾,可以实现业务和信息技术的集成,描述现在与未来的关系,而基于企业架构的数据共享与业务融合需求分析则更加完整、准确和及时。

2.1 企业架构概述

企业架构的思想首先由Zachman于1987 年提出,作为企业信息化建设的整体描述,企业架构着眼于企业战略,基于业务能力蓝图,定义企业需要的系统、数据以及采用怎样的技术路线[3]。企业架构理论在国内外都得到了大规模的应用。目前,主流的企业架构框架有Zachman、开放组体系结构框架(The Open Group Architecture Framework,TOGAF)、美国国防部架构框架(Department of Defense Architecture Framework,Do DAF)、美国联邦企业架构框架(Federal Enterprise Architecture Framework,FEAF)等,其中TOGAF 9应用最为广泛,是普遍达成共识的企业架构框架和方法,其主要从业务、数据、应用和技术4 个方面描述企业架构[4]。

2.2 相关企业架构元模型

企业架构由一套相关联的架构视图构成,包含业务架构、数据架构、应用架构和技术架构。通过企业架构可以很清楚地掌握企业业务以及业务与IT技术之间所带来的自然分块和各个分块之间的连接关系。

1)企业业务架构描述了企业中不同业务之间的关联关系。通过业务架构,可以掌握各种业务由于业务部门、业务流程和业务信息所产生的业务边界以及边界的耦合方式,从中可以直观看出业务之间的耦合点,从而获取业务共享与数据融合的需求。

2)企业数据架构对企业的数据资源进行了完整描述,可为应用架构提供数据支撑。企业应用架构描述了企业应用功能和业务流程之间的作用和关系,实现了业务流程的信息化描述。通过数据架构与应用架构,实现了业务层的数据共享与业务融合需求到信息技术实现的关联分析,可以有效确定目前已实现和缺失的系统流程集成和数据集成。

3)企业技术架构是实现企业应用架构的底层技术支撑,其主要包括软件平台、硬件、安全等组成部分,共同支撑企业应用的运转[5]。数据共享与业务融合需求分析着重关注业务、应用、数据架构,尤其关注技术架构[6,7,8]。

结合电力行业的特点,参考TOGAF等架构标准,定义了企业架构元模型。数据共享与业务融合需求分析相关的企业架构元模型如图1 所示。

2.3 数据共享与业务融合需求分析过程

基于企业架构分析数据共享与业务融合需求,主要是对照业务流程中的各业务活动,检查各业务活动环节接收及输出的业务信息,对比上下关联业务活动环节所对应的组织单元,提出以业务流程为主线的数据共享和业务融合需求分析方法,并从中发现需要集成的业务流程与数据。数据共享与业务融合分析工作流程如图2所示。

1)业务架构对企业各级业务职能进行了定义,并对业务职能所属的业务流程与子流程进行了描述,从其中能够直观展示不同业务部门的业务活动。

2)分析业务活动及前置业务活动的关系,若2 个业务活动所属的组织单元不同,则为业务融合需求点,前置业务活动对应的组织单元为需求部门,当前业务活动对应的组织单元为配合部门。在实际工作中,相关信息还需要与对应部门进行确认。

3)分析业务信息及操作该业务信息的业务活动关系,若业务信息所属的组织单元与业务活动所属的组织单元不同,则为数据共享需求点,业务活动对应的组织单元为需求部门,业务信息对应的组织单元为配合部门,该业务信息即是需要共享的数据。

4)通过业务活动与功能的关系,确定与业务活动相关联的功能,再对照业务融合需求点中业务活动对应的功能,确定应用交互需求,需求部门对应功能的应用为调用方,配合部门对应功能的应用为提供方。

5)通过业务信息(逻辑实体的关系),确定业务信息所关联的逻辑实体,再对照数据共享需求点与业务信息对应的逻辑实体关系,确定数据集成需求,需求部门对应的功能应用为调用方,配合部门对应的功能应用为提供方,逻辑实体为共享的逻辑数据。

6)通过功能确定所关联的组件,再对照应用交互需求点,确定是否已经实现系统流程集成,若没有对应的流程集成点,则记录该业务融合需求,组织需求部门及配合部门相关人员进行沟通确定。

7)通过逻辑实体与物理实体的关系,确定逻辑实体所关联的物理实体,再对照数据集成需求点,确定是否已经实现,若没有实现,记录该数据共享需求,组织需求部门及配合部门相关人员进行沟通确定。

3 数据共享与业务融合需求分析实践

3.1 梳理与完善企业架构数据

准确、完整、一致的企业架构数据是数据共享与业务融合分析的基础[9,10,11],所以需要根据企业架构元模型,在所确定的梳理细化广度和深度内,收集并完善企业架构数据。

在企业架构数据收集时,往往会出现错误数据以及各架构层次相互之间不一致等问题,主要是由于数据误操作以及版本变更等原因导致的。收集后的数据首先需要进行数据一致性工作,主要针对以下4 类数据进行校验:(1)孤立数据,某一架构元素未与其他任何数据建立关联关系;(2)重复数据,指有多条记录表示同一个功能或实体;(3)依赖冲突数据,指架构资产数据与资产设计梳理规则等冲突;(4)无效数据,指被无效数据包含或关联的有效数据。

3.2 制定工作机制,明确职责分工

数据共享与业务融合涉及公司各专业、各层次,工作规模大、范围广,需要健全完善需求提出、方案编制、沟通协调等工作机制,采用企业架构分析与业务部门需求相结合的方法,从全公司层面整体进行推进。

企业架构数据梳理需要业务部门与信息部门配合开展才能取得成效。业务部门、信息部门的领导要作为主要的牵头人员,并且需要取得公司领导的大力支持。业务架构由业务部门牵头梳理,信息部门配合开展相关工作。应用架构和数据架构由信息部门、业务部门分工负责。技术架构设计由信息部门牵头,最好也有业务部门参与。

按业务主线确定数据共享与业务融合需求。按业务主线推进,如划分财务与业务融合、物资供应链融合、人力资源信息共享与融合、营配集成、运营监测等业务主线,各业务主线涉及的数据共享与业务融合工作由牵头部门统一组织,其他相关业务部门协同推进,信息部门负责综合协调与技术支撑并制定技术方案,业务部门负责制定业务方案。

通过企业架构数据分析的数据共享与业务融合需求要与相关业务部门进行充分沟通确认,业务部门提出的业务需求通过企业架构数据进行分析验证,如果需求不一致,则需深入分析原因,很可能是业务架构中业务流程或业务信息维护有问题,及时组织相关人员对企业架构数据进行更新。

3.3 构建企业架构管理系统

由于企业架构中的数据量大、涉及的关系众多,以江苏电力为例,目前共梳理了约800 个业务流程、2 万多个业务活动以及8 万多个逻辑及物理实体,并且持续更新中。若依靠人工对企业架构数据进行维护与分析基本不可能完成,因此需要依托信息平台建立企业架构管理系统,维护企业架构数据并进行全面、精准、有效的数据分析,实现企业架构数据的自动分析和直观展示。

企业架构管理系统的首要功能是企业架构数据的维护与展示,通过多角度将企业四大架构的内容直观展现,对业务、应用、数据及技术架构各级数据关联录入,形成企业信息化建设的整体模型;其次要实现企业架构数据分析功能,如根据数据共享与业务融合分析规则,自动分析出各专业业务之间的数据共享与业务融合需求点,通过业务与IT的映射关系,分析出可能的信息系统集成点,并给出流程集成与数据集成建议清单。数据共享与业务融合分析只是企业架构数据分析功能之一,基于企业架构的数据分析还包括架构关联度分析、架构遵从度分析、架构差异对比分析、系统功能覆盖度分析、系统功能重复建设分析等功能。

4 结语

本文基于当前数据共享与业务融合的需求信息收集现状,提出了以企业架构为基础、以业务流程为主线的数据共享和业务融合需求分析方法,确保需求信息收集更加全面、准确和及时,并结合实践经验提出了企业架构数据收集、工作职责划分、企业架构系统构建等实施建议。实际应用成果表明,本文提出的分析方法是有效的,可为后续的系统集成分析与设计提供强有力的支撑。通过对所提出需求的规划与实施,可全面推进数据共享和业务融合,打破业务壁垒,消除信息孤岛,从而促进公司管理水平的提升。

摘要:数据共享与业务融合能够提升企业的经营管理能力,高效的需求分析方法是开展数据共享与业务融合的基础。文章提出了一种基于企业架构的数据共享和业务融合需求分析方法,从业务、应用、数据、技术4个方面逐级梳理,能够快速分析出数据共享与业务融合需求,并通过在江苏省电力公司的实践证明了该方法的有效性。

数据库需求分析报告范文第4篇

数据仓库作为一种非常有效的分析工具,自产生以来在学术和产业界引发了众多的研究与实践,成为辅助企业管理层、决策层进行运营监控、战略决策的重要手段。当前,以大数据为特征的企业经营管理与决策需求愈发迫切。企业业务的多样性、管理的多变性给数据仓库构建的需求获取带来更大困难,大数据背景下的数据仓库建模、数据分析与结果展现,给传统的数据仓库构建方法带来极大挑战。

根据Inmon的定义,数据仓库[1]是一个面向主题的、集成的、时变的、非易失性的数据集合,支持管理部门的决策过程。基于此,传统数据仓库建设过程中多以主题为核心进行需求分析,即围绕一些分析主题,数据仓库系统经过对操作型系统数据的清洗、转换等操作,形成面向主题的视图,提供决策人员使用。文献[2,3,4,5,6,7,8]针对数据仓库需求分析、数据获取模式、数据仓库设计阶段划分、数据仓库的实施方法开展了相关研究。上述研究工作,各自解决了数据仓库构建过程中存在的一些问题,但针对数据仓库构建过程中的需求获取方式依然没有脱离传统的需求调研和分析方法,即对项目建设单位业务人员的座谈会、个别访谈及问卷等方式,但由于受制于样本点数量、被抽样业务人员的业务及知识局限,很难全面表述数据仓库项目的需求。

为此,本文重点针对大数据背景下的数据仓库项目实施过程中由于业务多样性、变化性等带来的需求全面获取,数据仓库建模、数据分析与数据展现等问题,提出一种基于全需求分析法的数据仓库构建方法,根据MECE[9]原则,按照“全需求做减法”的思路给出了数据仓库构建的需求分析过程,研究提出了数据仓库的指标构建、统计分析与结果展现的具体过程,并在实际企业进行了应用,验证了方法的有效性。

2 全需求分析法

2.1 需求分析的多维模型

需求分析的多维模型(Multi-Dimension Model,MDM)是一种对信息系统需求表达的具体方式,按照系统化思维和结构化方式,从业务需求、集成需求、运维需求、安全需求、设施需求五个维度进行信息系统的全需求分析,进而全面梳理并结构化表达信息系统建设需求。如图1所示,需求分析的多维模型以信息系统需求分析为目标,从基础层、核心层和扩展层三个层面,对安全需求、基础设施需求、业务需求、运维需求和集成需求五个方面对信息系统需求,按照MECE原则进行全需求描述,上述五个维度的需求表述之间相互联系、相互影响,共同构成了信息系统的全集需求。

(1)业务需求:信息系统作为支撑企业经营活动的重要工具,其需求来自于企业的核心业务,因此信息系统的需求应以业务需求为驱动。

(2)集成需求:信息系统不能成为“孤岛”已成为信息化领域的共识,因此任何新建的信息系统都需要考虑与已有系统的集成,以及面向未来其他系统建设的集成接口要求。

(3)运维需求:信息系统的运行维护及管理是辅助其发挥作用的关键,因此需要把运维需求作为信息系统建设需求组成部分。

(4)安全需求:安全性是信息系统建设过程中不可忽视的需求,是保障系统安全运行的要求。

(5)设施需求:信息系统的运行依赖于可靠的基础设施条件,因此设施需求是信息系统建设的基础需求。

2.2 基于MDM的信息系统全需求分析

全需求分析法是指在信息系统的需求分析过程中,重点围绕需求分析多维模型的业务需求维,在参照一流标杆企业基础上,以MECE原则为指导,按照自底向上的思路全面梳理企业的业务需求,即按照业务线梳理,一通到底,而不是分层梳理,进而形成企业全需求,当企业业务发生变化时,以此全需求为基础,按照“全需求做减法”的思路,根据企业自身需要形成需求子集的过程。

根据多维模型及全需求分析法的定义,基于MDM实现对信息系统的全需求分析,即以业务需求为驱动,对企业业务全集的数据源进行细化分析,并结合组织属性分析明确数据的抽取范围及频率,识别数据统计分析所需维度和指标,并且确认相关维度层次及粒度;对不同数据源的数据获取方式进行分析,总结提炼信息系统的集成需求;对信息系统运行维护及管理、安全保障及基础设施进行需求分析。按照系统化思维和结构化方式,通过对业内已经实现的需求进行全面梳理,找到基于业务本身的“原子级”需求,将大量看似个性化的需求概括、提炼为共性需求,形成符合MECE原则的全需求。

3 基于全需求分析的数据仓库构建过程

过程1:数据仓库的业务需求分析。基于全需求分析的数据仓库构建,首先要对数据仓库的业务需求进行自底向上的业务全集梳理,形成全部的业务分类集合。即对企业目前从事的业务,以及未来可能开展的业务进行全面梳理,按照MECE原则,采用一定的分类方式对每项业务进行详细定义,明确业务边界,进而形成覆盖企业全部业务的分类体系,作为全集需求分析的基础。

过程2:业务分析指标构建。在业务分析的基础上,针对每项业务应该管理哪些指标的问题,在对标一流企业标杆及行业相关标准的基础上,根据MECE原则,对具体业务的经营指标进行细化梳理。首先,按照业务线一通到底,基于最底层业务进行梳理,而不是分层梳理,即“以下为主,上下结合”;然后,按照行业一流构建指标全集,再根据具体企业情况进行删减,而不是按照企业现状进行梳理,本文称之为“全指标、做减法”。

对同一指标,由于企业所处层级、业务性质不同,对指标要求的数据颗粒度会存在不同要求,需要在建模过程中加以考虑,并由此产生了源指标和计算指标。同时,对于每一指标,有不同的统计范围,如何建立便捷的统计逻辑树?为解决该问题,按照MECE原则和全需求分析法,本文构建了指标多维度模型,具体将指标统计维度分为组织维度、时间维度、度量维度和业务维度四大类,并根据每一类进行了维度细分,最后给出了每一细分类别下的维度值,如表1所示。

过程3:数据分析模型。在数据仓库建设过程中,经常出现依据指标的要求确定统计分析需求,造成每增加一项指标,就要构造对应的数据分析模型,由此不仅造成数据仓库实施过程中统计分析建模的工作量巨大,而且分析的模型有所重叠。为解决该问题,本文基于过程2的指标多维度模型分析,按照全集需求模式,对现有的统计分析方式进行详细的梳理、分类和定义,建立了数据分析模型,如表2所示。

该分析模型将对指标的数据分析划分为两大类:对比分析和相关分析,又进一步从纵向分析和横向分析进行细分,最后形成了包含趋势分析、同比分析等12项分析方法;按照指标及其多维度(业务维度/组织维度/度量维度/时间维度)确定了具体的分析内容。

过程4:结果展现模型。确定了具体指标的分析需求并选定具体的数据之后,应该采取什么样的结果展示模型,以最为合适的方式展示指标的数据分析结果,也是数据仓库构建过程中需要解决的问题之一。本文基于指标多维度模型,按照全集需求模式,对现有的展示方式进行详细的梳理、分类和定义,建立了结果展示模型,如柱状图、饼状图、折线图、雷达图、堆积图、仪表盘、地图等方式,并给出了数据分析与结果展示模型之间的匹配关系,建立了相关性模型,如表3所示。

4 数据仓库应用实例

本文以全需求分析法及对数据仓库构建过程的分析,结合中国节能环保集团数据仓库项目建设,开展了方法的应用验证。以业务需求为驱动进行数据仓库建模,形成系统的数据模型层次结构设计;以集成需求为依据确定外部系统接口规则,形成接口规范文档;基于需求与功能一致性映射的系统设计,进行数据仓库维度建模,形成多维分析模型,并最终完成数据仓库系统的数据处理过程设计。

首先,在数据仓库业务需求分析阶段,本文以社会经济发展中节能环保领域的业务分类为例[10],基于MECE原则,对环保业务分类,形成《节能环保业务分类》,即按照国民经济活动,对节能环保行业进行业务分类;针对每一项业务,规范业务名称、业务定义。《节能环保业务统计分类》,即按照生产、运营、服务分为3个业务类别,划分为16个业务大类、60个业务中类和152个业务小类。在《节能环保业务分类》和《节能环保业务统计分类》两个分类基础上,以MECE原则为指导,形成《中国节能业务统计分类》,即按照节能、环保、清洁能源、资源循环利用和节能环保综合服务5个业务类别,划分为18个业务大类、57个业务中类和104个业务小类。

第二,结合对节能环保业务分类,构建了中国节能数据仓库的业务指标体系,形成节能环保业务的多维指标分析模型。以营业收入指标为例,可以按照计划、预算、预计完成、实际完成等维度进行统计分析;对电网装机容量指标,可以按照规划、路条、在建、并网等维度进行统计分析;而对发电量指标,可以按照风力发电量、太阳能发电量、垃圾发电量等维度进行分析。以水务生产为例,构建的经营指标如图2所示。

最后,应用全需求分析法的数据分析模型与数据展现模型,结合中国节能数据仓库的业务需求分析及指标体系,开发了中国节能数据仓库系统。系统经过近一年的研究开发,目前已经完成系统测试、部分集成、试点企业试运行等工作,取得了较好的建设效果,如图3所示,为系统应用的界面示意图。

5 结语

数据仓库作为一种辅助企业经营管理与决策的重要工具,在大数据时代将发挥越来越重要的作用。本文针对传统数据仓库构建过程中需求获取存在的主要问题,提出了一种全需求分析法的数据仓库构建方法,以需求分析的多维模型为核心,给出了数据仓库构建过程。全需求模式体现了需求获取按照“从下往上”全集基础上对需求做减法的思路,能够适应企业业务变化导致的需求改变,并能够满足不同业务不同层级管理颗粒度的需求。提出了数据仓库的业务分类、组织属性、指标构建、统计分析与结果展现的具体模型,以适应管理变革背景下的不同分析需求,并以中国节能环保集团的数据仓库建设为背景进行了实例分析,验证了方法的有效性。

本文的主要贡献点体现在以下三个方面:1基于最底层业务形成指标全集,即改变了以往数据参考建模过程中按照组织机构、按照分析主题梳理指标的方法,而是基于最底层的业务,遵循MECE原则,梳理出指标全集,满足据仓库项目实施过程中业务多样性、变化性而动态调整指标的管理需求;2构建了符合MECE原则的指标多维度模型,将不同的业务、不同场景下的指标,归集在统一的指标多维度模型之中,实现具体业务与指标模型相互分离,大幅减少了将业务场景转化为业务模型的数量;3按照MECE原则,梳理了统计分析模型、图形展示模型,并且建立了指标多维度模型、统计分析模型、图形展示模型的自动联动,极大降低面对不同用户分析需求的系统开发量。

摘要:针对大数据背景下数据仓库项目实施过程中,由于业务多样性、变化性等带来的需求获取、数据分析与数据展现等问题,提出一种基于全需求分析法的数据仓库构建方法,按照MECE原则,以“全需求做减法”的思路,研究提出包含业务需求分析、指标构建、数据分析与结果展现的数据仓库系统构建过程;结合中国节能环保集团数据仓库项目建设,对所提方法进行了应用验证。

关键词:全需求分析,多维模型,数据仓库

参考文献

[1][美]W H Inmon.数据仓库[M].第3版.王志海,译.北京:机械工业出版社,2004:10-40.

[2]尉宁.电信行业数据仓库建设与实践[D].重庆:重庆大学,2007.

[3]鲍玉斌,史捷,王大玲,等.企业级数据仓库设计方法及其实施的关键因素研究[J].控制与决策,2004,19(12):1378-1382.

[4]李纲,陈颖.成功实施数据仓库的方法[J].武汉理工大学学报,2001,23(9):99-101.

[5]王磊.数据仓库构建方法及其应用实例研究[D].上海:东华大学,2005.

[6]戴小廷.热电企业经营管理数据仓库建设[J].中国管理信息化,2009,12(3):61-63.

[7]A Maté,J Trujillo.Tracing Conceptual Models’Evolution in Data Warehouses by Using the Model Driven Architecture[J].Computer Standards&Interfaces,2014,36(5):831-843.

[8]F Di Tria,E Lefons,F Tangorra.Hybrid Methodology for Data Warehouse Conceptual Design by UML Schemas[J].Information&Software Technology,2012,54(4):360-379.

[9]梁磊.管理视图分析法[J].企业管理,2014(10):101-105.

数据库需求分析报告范文第5篇

1 数据挖掘理论概述

数据挖掘理论, 主要是指从大量随机、模糊、不完全的数据中提取一些隐含其中的, 人们不知道, 但又具有一定代表性和规律性, 具有潜在利用价值的知识、信息的过程。数据挖掘不仅可以遍历和查询过去数据, 还可以预测未来行为和发展趋势, 自动探索从前没有出现的模式, 进而为人们的行为和决策提供支持。被挖掘出的信息可以使用在信息管理、处理查询、支持决策和控制过程等方面。按照功能, 可将其主要划分为以下几类: (1) 关联分析。如果2个或者多个数据项取值多次出现且概率比较高, 就可能具有某种关联, 能够建立数据之间关联的规则。 (2) 数据分类。这在数据挖掘中使用的次数最多, 分类主要是对某一类别概念的描述, 代表某类数据整体的信息状况, 也就是对这类信息内涵的描述。 (3) 聚类分析。数据库内的数据能够分类为一系列子集, 相同类别内, 个体之间距离比较小, 不同类别个体之间距离则比较大。 (4) 时序模式。借助时间序列, 搜索重复出现概率比较高的模式。

2 国内中长期电力市场的特点

国内中长期电力市场主要有以下3个特性: (1) 宏观性。电力商品被广泛使用, 使得中长期电力市场和其他市场不同, 不是只涉及一个或者少数行业, 而是与整个社会宏观经济的发展, 人们生产、生活水平的提高息息相关。在判断中长期电力市场的前景时, 需要考虑到它对社会各行业的影响。 (2) 复杂性。电力这个商品的特殊性决定其无法大规模存储, 而电力发电、供应和使用的同时性也对电力市场需求的分析提出了更高的要求, 使其更加复杂。 (3) 不确定性。不同地区的经济状况和产业结构不同, 用电的需求和特性也有很大的差异。相同地区不同时间用电特性和需求也会有很大的变化, 所以, 电力市场的需求分析需要随不同的经济发展状况和时间、地点的变化而不断变化。

3 电力市场需求预测模型分析与研究

3.1 省市级电力需求预测模型

省市级电力市场的需求因为地域、时间的跨度比较大, 受到电力市场外因素的影响比较严重, 且这一影响经常是非线性的, 所以, 建立模型时, 需要考虑以下因素: (1) 模型的输入。模型应该有多个输入, 输入变量是外部的影响因素和电力需求自身滞后值。但是, 输入也不能太多, 因为中长期电力市场需求的预测特点为小样本, 如果参数太多, 也会为模型辨识带来困难。 (2) 需要反映各个影响因素与电力市场需求之间的关系。 (3) 模型需要稳定。

常用模型主要有两种, 具体情况如下。

3.1.1 多元线性回归预测模型

这一模型的输入有多个, 所以, 在预测模型时, 要充分考虑外界的影响因素。这种模型的建模方式比较简单, 所以, 应用比较广泛, 当前, 一些地区在执行电力需求预测工作时, 还在使用这一模型。这一模型主要是将与电力市场需求相关的因素添加到预测模型内, 这更能反映电力市场外部因素的影响。

3.1.2 最小二乘支持向量机

支持向量机在20世纪90年代得到发展, 近些年, 因为其非线性拟合能力比较好, 经常被用于非线性回归问题中。当前, 支持向量机已经成为预测电力需求的常见模型, 也是研究热点。支持向量机所需的训练样本比较少, 而且克服神经网络训练的时间比较长, 学习和训练的结果有随机性等不足, 所以, 在中长期电力需求预测中, 如果存在强非线性和小样本的问题, 就十分适合使用支持向量机求解。

3.2 行业电力需求预测模型研究

与省市级电力市场相比, 各个行业的电力市场需求受外部因素的影响比较小, 受其自身趋势的影响比较大。常用的模型主要有以下2种。

3.2.1 自回归滑动平均模型

这一模式是统计在建模中的具体应用, 也是传统时间序列分析中经常使用的模型之一。与省市级电力市场相比, 行业电力市场受外界因素的影响比较小, 更多的是受自身变化的影响, 所以, 适合使用这一模型。

3.2.2 神经网络预测模型

近些年, 因为神经网络具有十分优秀的非线性能力, 使其倍广泛应用于电力市场需求的预测中。目前, 在电力市场中, 使用最多的是误差反向传播学习算法。一般来说, 根据神经网络结构, 可以分成输入层、中间层和隐含层。

4 结束语

综上所述, 数据挖掘理论在中长期电力市场需求分析和预测研究中发挥着非常重要的作用, 需要引起相关人员的高度重视。研究时, 如果考虑到需求外部的影响, 为了提升省市级市场需求预测的效果, 需要分析更多的变量, 尽量包含更多领域, 以确保能够全面反映市场的变化需求。使用最小二乘支持向量机拟合指标和外部因素间的非线性关系时, 需要借助一定经验, 选择最优的参数组合。另外, 对于相同类别行业所建立的模型, 虽然具有普遍性, 但还是存在可能出现较大误差的情况。因此, 在实际应用时, 需要单独建模, 提升预测水平, 以便提供准确的数据, 为电力行业的发展提供借鉴。

摘要:简要分析了中长期电力市场的需求, 合理预测电网内部发电机组出现的状况。这对电网的运行模式和机组的检修有很好的指导, 从而确保整个社会的生产和生活。以数据挖掘理论为基础, 简要分析和预测中长期电力市场的需求, 以有效推动电力行业的发展。

关键词:数据挖掘理论,电力市场,中长期需求,发电机组

参考文献

[1]王艳龙.基于数据挖掘的中长期电力市场需求分析及预测[D].杭州:浙江大学, 2016.

[2]张连育.基于数据挖掘的电力故障分析及预警系统研究与实现[D].北京:中国科学院研究生院, 2010.

数据库需求分析报告范文第6篇

在此前举办的Teradata大中华区数据仓库和企业分析峰会上, 数据社会化、大数据分析成为各行业讨论焦点。在电信运营业数据也将走入PB级之时, 运营业却深处“被管道化”而于数据价值利用上无力的境地。对此, 本刊记者与Teradata中国区电信与邮政行业总经理李鸿进就目前运营商最为关心的智能管道、社交媒体等话题, 由数据角度如何发挥价值进行探讨。

“不智能因管道并非端到端”

《通信世界周刊》:从数据处理角度来说, 运营商应如何避免“被管道化”, 如何才能更好地理解用户?

李鸿进:几大运营商都在提智能管道, 管道要变得智能, 我觉得有两方面的考虑。

首先, 现在不智能是因为管道的数据管理不是端到端的。目前的管道并不是由用户接入开始一直到通话、上网等行为结束, 对其中产生的数据全部进行采集, 它其实只采集中间一段——增值业务或其他业务的平台。现在运营商首先要做的, 是对管道的各个点的数据进行端到端的采集, 才能知道管道有多长, 究竟使用率有多大。

在此基础上, 再通过对端到端的数据的分析, 得出哪些业务不赚钱但流量非常大, 可以分时段地进行带宽的智能调节, 保证用户语音和短信或者基本业务的正常使用, 让客户的感受更好。

《通信世界周刊》:对于运营商而言, 进入3G, 流量计费等问题突然成为焦点问题, 负面事件频发。运营商应如何利用技术手段更好地进行流量的管理和分析?

李鸿进:下载业务、语音业务和短信业务都面临这一问题。用户数越来越多, 系统支撑的性能有限, 难免会产生错计费或者漏计费的情况, 同时还有一些错单无法很好整合的技术屏障。但是对于运营商来说, 有一点是可以改进的, 可以通过数据的实时采集, 进行实时分析之后, 在账单、流量向客户进行开放之前自己先做一个自查, 保证提交给客户的时候是正确的。

所谓的收入保障包括两个层面, 一方面要保障用户不被乱收费, 另一方面运营商该收的钱也要能收回来。因此计费系统的后台一定要有一个分析系统, 保证数据发出之前, 先做一次稽核分析, 确保数据是对的。例如, 计费系统对某个用户进行了批价, 产生了一套费用, 需要一个分析系统对它进行再一次批价, 两次批价结果一致, 这条数据才能够向客户开放。一旦不一致, 内部就要研究之后再发出去, 客户在实时查询的时候, 系统可以告知他这个费用并不是最终的费用, 后期可以再调整, 这样客户的感受会好一些。等到出月账单, 要向客户提交时是绝对不能错的。

数据社会化真正描绘用户轮廓

《通信世界周刊》:目前国内运营商也提出对非结构化数据处理的需求, 就运营商而言, 非结构化数据主要存在于哪些领域?为什么会有这种需求?

李鸿进:运营商对于电子渠道越来越重视, 现在很多的业务直接在网站就可以办理, 用户可以定制一些电信业务, 或者进行查询。所有用户在网站上的这些行为, 其实也是一定程度上的运行测试行为。运营商以前做的分析, 主要都是关于客户交费是否及时、信用度是否比较好, 但并没有把网站上的用户关注度或行为特点记录下来。如果将这部分数据跟原有的数据库进行整合分析, 就能将用户个人的购买行为轮廓真正地描绘出来。

社交网络也是很重要的一块。事实上, 利用社交网络可以了解个人的数据以及影响他的人是谁, 从而更有效地提供现有的产品。运营商现在做的飞信和139社区等领域, 其数据都是文本、图片或视频等非结构化数据, 过去没法进行分析。现在通过一些技术手段逐渐可以实现和逐渐完善, 比如山西移动目前就可以针对某个飞信用户的好友进行针对性营销。

《通信世界周刊》:对于非结构化数据的挖掘和处理, 具体会有哪些价值?

李鸿进:近期, Teradata刚刚争取到了一家非常大型的电子商务客户, 我们会在整合营销管理和经营分析等方面为其提供协助, 提供对如人人网、微博等网络社区媒体的社会化数据的分析, 帮助其了解用户各方面的需要, 及对产品的反馈等。

我们可以以这个客户为例来看非结构化数据的价值。该电子商务客户最主要的生意来源是网站, 他们需要对消费者的网络消费行为进行分析, 例如点击方式等。他们最关心用户为什么点击浏览产品却没有购买, 他们需要分析用户为什么放弃了支付, 还浏览了什么类型的产品等等。这些都是很重要的营销机会, 也许通过一些方面的营销模式改变, 能够将这些消费群争取回来, 增加购买的机会。

对于运营商也是如此。比如一个用户是一个年轻时尚的学生, 喜欢选用比较亮丽新潮的手机, 喜欢发短信, 很少打电话, 经常上网。除了这些行为以外, 这个用户还很愿意在社交网络上讨论哪个歌星的唱片卖得好。运营商如果能将两部分的非结构化数据结合在一起来看, 活生生的一个追星族就出来了, 对他采取什么样的营销措施, 就将更加有针对性。

《通信世界周刊》:非结构化数据有许多数据格式和类型, 处理非结构化数据除了需要海量数据的处理能力之外, 还需要哪些能力?

李鸿进:首先需要保证非结构化数据读取的快捷性, 以及基于其上开发应用的便利性, 需要有很好的平台和软件来支撑。其次, 从非结构化数据中究竟能不能挖出有用的信息, 考验的是相关者的行业知识和专业服务能力。


相关文章

专题分类