数据库设计?
一、数据库设计?
本文档明确数据库设计原则和规范,规范数据库对象命名方式,见名知意,强化分工,保证数据库高效稳定运行
1 数据库设计原则
1) 充分考虑业务逻辑和数据分离,数据库只作为一个保证ACID特性的关系数据的持久化存储系统,尽量减少使用自定义函数、存储过程和视图,不用触发器。
2) 充分考虑数据库整体安全设计,数据库管理和使用人员权限分离。
3) 充分考虑具体数据对象的访问频度及性能需求,结合主机、存储等需求,做好数据库性能设计。
4) 充分考虑数据增长模型,决策是否采用“分布式(水平拆分或者垂直拆分)”模式。
5) 充分考虑业务数据安全等级,设计合适的备份和恢复策略。
2 设计规范
2.1 约定
1) 一般情况下设计遵守数据的设计规范3NF,尽量减少非标准范式或者反模式使用。
3NF规定:
Ø 表内的每一个值都只能被表达一次。
Ø 表内的每一行都应该被唯一的标识(有唯一键)。
Ø 表内不应该存储依赖于其他键的非键信息。
常见关键字(不得直接作为相关命名):range、match、delayed、select、and、from、where、not、in、out、add、as、user、name、key、index、type、group、order、max、min、count、concat、by、desc、asc、null等等,更多请参考 MySQL 官方保留字。
2) 数据库和表的字符集统一:字符集(utf8mb4),排序规则(utf8mb4_general_ci)
2.2 表设计规范
1) 应该根据系统架构中的组件划分,针对每个组件所处理的业务进行组件单元的数据库设计;不同组件间所对应的数据库表之间的关联应尽可能减少,确保组件对应的表之间的独立性,为系统或表结构的重构提供可能性。
2) 采用领域模型驱动的方式和自顶向下的思路进行数据库设计,首先分析系统业务,根据职责定义对象。对象要符合封装的特性,确保与职责相关的数据项被定义在一个对象之内,不会出现职责描述缺失或多余。
3) 应针对所有表的主键和外键建立索引,有针对性地建立组合属性的索引。
4) 尽量少采用存储过程。
5) 设计出的表要具有较好的使用性。
6) 设计出的表要尽可能减少数据冗余,确保数据的准确性。
2.3 字段规范
1) 一行记录必须表内唯一,表必须有主键。
2) 如果数据库类型为MYSQL ,应尽量以自增INT类型为主键。如果数据库类型为ORACLE,建议使用UUID为主键。
3) 日期字段,如需要按照时间进行KEY分区或者子分区,则使用VARCHAR2类型存储,存储格式为:YYYYMMDD 。如若不需要以KEY形式作为分区列,则使用DATE或者DATETIME类型存储。不建议使用时间戳存储时间。
4) 字段名称和字段数据类型对应,如DATE命名字段,则存储时间精确到日,如TIME命名字段,则存储时间精确到时分秒,甚至毫秒。
2.4 命名规范类
2.4.1 约定
1) 数据库对象命名清晰,尽量做到见名知意,在进行数据库建模时备注对象,便于他人理解。
2) 数据库类型为MYSQL,采用全小写英文单词
3) 数据库类型为ORACLE,则使用驼峰式命名规范
4) 数据库对象命名长度不能超过30个字符
3 管理范围
管理数据库中所有对象,包括库,表,视图,索引,过程,自定义函数,包,序列,触发器等
3.1 建库
1) 数据库名:采用小写英文单词简拼或汉字小写拼音,多个单词或拼音采用下划线"_"连接
2) 数据库编码规则及排序规则:字符集(utf8mb4),排序规则(utf8mb4_general_ci)
3) 建库其他要求:库名与应用名称尽量一致
3.2 建表
表名应使用名词性质小写英文单词。如果需要单词词组来进行概括,单词与单词之间使用英文半角输入状态下_连接。如果超长,则从前面单词开始截取,保留单词前三位,保留完整的最后一个单词,如果依然超长,则保留前面单词首字母,直接和最后一个单词连接;临时表命名以TMP开头,命名格式为TMP_模块/用途名称_名字拼音首字母;表名不能直接采用关键字命名
1) 表命名:采用“业务名称_表的作用”格式命名(例如:alipay_task / force_project / trade_config)
2) 建表其他要求:表名长度不能超过30个字符;一定要指定一个主键字段;必须要根据业务对表注释;如果修改字段含义或对字段表示的状态追加时,需要及时更新字段注释;
3) 表必备字段:
`is_delete` tinyint(1) unsigned NOT NULL DEFAULT '0' COMMENT '状态(1删除、0未删除)',
`is_enabled` tinyint(1) unsigned NOT NULL DEFAULT '1' COMMENT '状态(1启用、0作废)',
`op_first` varchar(50) DEFAULT NULL COMMENT '创建人',
`op_first_time` datetime DEFAULT NULL COMMENT '创建时间',
`op_last` varchar(50) DEFAULT NULL COMMENT '更新人',
`op_last_time` datetime DEFAULT NULL COMMENT '更新时间',
3.3 建字段
1) 字段命名:
表中标识唯一性字段必须以标识性简称+id命名。其余字段根据存储信息,使用名词性质英文单词表示,如需要单词词组来进行概括,单词与单词之间使用英文半角输入状态下_连接。外键引用字段使用外键表_id的形式命名;字段名必须使用小写字母或数字,禁止出现数字开头,禁止两个下划线中间只出现数字;表达是与否概念的字段,必须使用 is_xxx 的方式命名,数据类型是 unsigned tinyint;表达逻辑删除的字段名 is_deleted,1 表示删除,0 表示未删除
2) 字段类型、长度
如果存储的字符串长度几乎相等,使用 char 定长字符串类型;小数类型为 decimal;id 必为主键,类型为 bigint unsigned;应尽量以自增INT类型为主键;优先选择符合存储需要的最小的数据类型;将字符串转化为数字类型存储;对于非负数据采用无符号整形进行存储signed int -2147483648-2147483648,unsigned int 0-2147483648,有符号比无符号多出一倍的存储空间;varchar(n) n代表字符数,不是字节数,varchar(255)=765个字节,过大的长度会消耗更多的内存;避免使用text\BLOB数据类型,建议text\BLOB列分离到单独的扩展表中,text\BLOB类型只能使用前缀索引;避免使用enum数据类型,修改enum需要使用alter语句,enum类型的order by操作效率低,需要额外操作,禁止使用数值作为enum的枚举值;尽可能把所有列定义为not null,索引null列需要额外的空间来保存,所以要占用更多的空间,进行比较和计算时要对null值做特别的处理;禁止字符串存储日期型的数据,缺点1:无法用日期函数进行计算和比较,缺点2:用字符串存储日期要占用更多的空间;使用timestamp或datetime类型存储时间,timestamp存储空间更小;财务的相关金额使用decimal类型,decimal类型为精准浮点数,在计算时不会丢失精度,float、double非精准浮点数
3) 字段其他要求
字段名称长度不能超过30个字符、尽量减少或者不使用联合主键、字段尽可能不允许为null(为null时设定默认值)、文本类型字段,属性 字符集(utf8mb4),排序规则(utf8mb4_general_ci)、字段必须根据业务进行注释。
3.4 建索引
主键索引名为 pk_字段名;唯一索引名为 uk_字段名;普通索引名则为 idx_字段名。
说明:pk_ 即 primary key;uk_ 即 unique key;idx_ 即 index 的简称。
3.5 创建数据库表视图
1) 视图命名:以"v_项目名/模块名_用途"格式命名
2) 视图其他要求:视图名称长度不能超过30个字符
3.6 建存储过程及自定义数据库函数
1) 存储过程命名:以"sp_用途"格式命名
2) 自定义数据库函数:以“fn_用途”格式命名
3) 存储过程或自定义数据库函数:参数命名以“p_”开头命名;内部变量命名以“v_”开头命名;游标命名以“cur_loop_”开头命名;循环变量命名以“i_found_”开头命名。
3.7 建数据库用户
用户命名:采用授权用户姓名全拼小写命名
3.8 其他要求
1) 查询大数据表,参数字段需建索引;
2) 数据库表、字段删除或变更操作(a-不需要的表或字段,一般备注“作废”即可;b-需要修改的表或字段,先备注作废原表或原字段,再创建新表或新字段,且备注好作废原因。);
二、数据库设计方法?
数据库设计是指根据用户的需求,设计数据库的结构和建立数据库的过程。
在数据库设计过程中,产生了一系列的数据库模型,包括概念模型、逻辑模型和物理模型。
数据库的设计方法包括:需求分析、概念设计、逻辑设计、物理设计和验证设计。
1、一对一设计原则
在软件开发过程中,需要遵循一对一关系设计原则进而开展数据维护工作,通过利用此原则能够尽量减少维护问题的出现,保证数据维护工作顺利开展同时降低维护工作难度。
在此过程中,尽量避免数据大且数据杂现象出现,否则既会影响到软件开发进度,又会增加工作难度,给其产品质量带来影响。
所以,设计工作人员必须重视起此问题。
同时充分了解实体间存在的必然联系,进而实现信息数据分散的目标,并在此基础上提高整体工作人员的工作效率,提高软件应用程序可靠性、科学性、安全性以及自身性能。
2、独特命名原则
独特命名原则的应用是为了减少在数据库设计过程中出现重复命名和规范命名现象出现。
通过应用此原则能够减少数据冗杂,维护数据一致性,保持各关键词之间存在必然相对应联系。
独特命名原则能够锻炼工作人员对大小写字母熟练操作能力,有利于规范化后台代码工作的开展。
3、双向使用原则
双向使用原则包括:事务使用原则和索引功能原则。
首先,双向使用原则是在逻辑工作单元模式基础上实现其表现形式的,不仅给非事务性单元操作工作提供基础保障,也保证其能够及时更新、获取数据资源。
索引功能原则的有效运用,使其获取更多属性列数据信息,并且对其做到灵活排序。
目前,软件市场常见的索引模式有:多行检索聚簇索引和单行检索非聚簇索引。
三、数据库设计三大原则?
1、数据库每列具有原子性(所有字段都是不可分解的原子),行不可重复,列不可再分。
2、确保非主键列必须完全依赖主键列,不能部分依赖(通常对联合组件来说)
3、确保每列值都和主键列直接相关而不是部分相关(非主键列不能相互依赖)
四、数据库设计 案例?
以下是一个简单的MySQL数据库设计案例,以存储学生和课程信息为例:
假设我们有两个实体:学生(Student)和课程(Course),每个学生可以选择多个课程,每个课程可以被多个学生选择。
首先,我们创建两个表来表示学生和课程:
Student表
列名 | 类型 |
---|---|
student_id | INT (主键) |
name | VARCHAR |
age | INT |
gender | VARCHAR |
Course表
列名 | 类型 |
---|---|
course_id | INT (主键) |
name | VARCHAR |
credit | INT |
instructor | VARCHAR |
接下来,我们需要创建一个关联表来存储学生和课程之间的关系,表示学生选择了哪些课程:
Student_Course表
列名 | 类型 |
---|---|
student_id | INT (外键) |
course_id | INT (外键) |
在Student_Course表中,student_id和course_id列分别作为外键,关联到Student表和Course表的主键。
这种设计模式称为"多对多"关系,通过使用关联表来实现学生和课程之间的多对多关系。
通过以上的数据库设计,你可以存储和查询学生、课程以及学生选择的课程的信息。当然,具体的数据库设计取决于你的实际需求和业务规则,上述仅提供了一个简单的示例。
五、大数据平台数据库设计
在当今数字化时代,数据被认为是企业最宝贵的资产之一。随着数据规模的不断增长,构建一个高效稳定的大数据平台数据库设计变得至关重要。大数据平台数据库设计涵盖了数据库的架构、存储、处理和管理等方面,为企业提供了强大的数据支持和分析能力。
大数据平台数据库设计的重要性
大数据平台数据库设计是建立在大数据技术基础之上的核心要素之一。一个良好设计的大数据平台数据库可以有效地支持企业的数据存储、处理和分析需求,从而帮助企业更好地利用数据优化业务决策。
数据存储:在大数据平台数据库设计中,数据存储是其中一个关键环节。合理的数据存储设计可以提高数据的访问速度和系统的稳定性,确保数据的完整性和安全性。
数据处理:大数据平台数据库设计不仅要考虑数据的存储,还要考虑数据的处理能力。通过合理的数据处理设计,可以实现数据的快速处理和分析,为企业提供实时的数据支持。
数据管理:数据管理是大数据平台数据库设计的另一个重要方面。良好的数据管理设计可以帮助企业更好地组织和管理数据,确保数据的准确性和一致性,提高数据的可靠性和可用性。
大数据平台数据库设计的关键考虑因素
数据模型:在大数据平台数据库设计中,数据模型是至关重要的一环。数据模型要能够满足企业的数据需求,并且具备良好的扩展性和灵活性,以适应数据规模的不断增长和变化。
数据安全:数据安全始终是大数据平台数据库设计的重中之重。在设计阶段就应该考虑到数据的安全性,采取相应的安全措施保护数据免受未经授权的访问和恶意攻击。
性能优化:为了提高大数据平台数据库的性能,需要针对数据存储、处理和管理等方面进行优化。通过合理的索引设计、数据分区和缓存策略等手段,可以有效提升数据库的性能。
系统可靠性:大数据平台数据库设计还应考虑系统的可靠性和稳定性。通过数据备份、容错机制和故障恢复等措施,可以确保系统在面对各种异常情况下能够正常运行。
大数据平台数据库设计的发展趋势
随着大数据技术的不断发展和进步,大数据平台数据库设计也在不断演进。未来,大数据平台数据库设计将朝着更加智能化、自动化和可持续发展的方向发展。
智能化:未来的大数据平台数据库设计将更加注重智能化技术的应用。通过引入人工智能、机器学习和自然语言处理等技术,提高数据库的智能化水平,实现更加智能化的数据处理和分析。
自动化:为了提高数据库的运维效率,未来的大数据平台数据库设计将更加注重自动化技术的应用。自动化技术可以减少人工干预,提高数据库管理的效率和可靠性。
可持续发展:在大数据平台数据库设计中,可持续发展是一个重要的方向。未来的数据库设计将更加注重绿色环保和资源利用效率,实现数据库设计的可持续发展。
总结
大数据平台数据库设计在当今数字化时代扮演着至关重要的角色。通过合理设计数据存储、处理和管理等方面,可以为企业提供强大的数据支持和分析能力,助力企业实现业务优化和创新发展。
随着大数据技术的不断发展和进步,未来的大数据平台数据库设计将更加智能化、自动化和可持续发展,为企业带来更多的机遇和挑战。
六、数据库设计的内涵?
数据库设计概念 在设计数据库时,需要计划要存储有关哪些事物的信息,以及要保存有关各个事物的哪些信息。
七、简述数据库设计过程?
数据库设计的过程(六个阶段)
1.需求分析阶段 准确了解与分析用户需求(包括数据与处理) 是整个设计过程的基础,是最困难、最耗费时间的一步
2.概念结构设计阶段 是整个数据库设计的关键 通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型
3.逻辑结构设计阶段 将概念结构转换为某个DBMS所支持的数据模型 对其进行优化
4.数据库物理设计阶段 为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)
5.数据库实施阶段 运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果 建立数据库,编制与调试应用程序,组织数据入库,并进行试运行
6.数据库运行和维护阶段 数据库应用系统经过试运行后即可投入正式运行。 在数据库系统运行过程中必须不断地对其进行评价、调整与修改 设计特点: 在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两方面的设计
八、paas平台用什么数据库?
Cloud Foundry(原先由VMware开发)从广大Ruby开发人员和用户处获得源代码。这个开源PaaS允许人们将信息系统部署到OpenStack、亚马逊网络服务(AWS)、vSphere、vCloud Air和vCloud Director。Cloud Foundry提供的主机托管服务包括:MySQL(可用于开发SaaS应用程序)、 MongoDB(一种NoSQL数据库)和RabbitMQ(以异步方式连接应用程序的消息代理)。
九、论文数据库设计怎么写?
建议你做到以下几点理解数据库基础知识:可以去看《数据库系统概念》重点掌握一种数据库:这样才能更好的设计物理模型,如《高性能MySQL》掌握数据库设计的流程与方法:看实际场景中是如何设计概念模型-》逻辑模型-》物理模型的,重点推荐《数据模型资源手册》共3册。
十、简述数据库设计的要求?
数据库设计包括六个主要步骤:
1、需求分析:了解用户的数据需求、处理需求、安全性及完整性要求;
2、概念设计:通过数据抽象,设计系统概念模型,一般为E-R模型;
3、逻辑结构设计:设计系统的模式和外模式,对于关系模型主要是基本表和视图;
4、物理结构设计:设计数据的存储结构和存取方法,如索引的设计;
5、系统实施:组织数据入库、编制应用程序、试运行;
6、运行维护:系统投入运行,长期的维护工作。