如何拆分微服务架构？--粉丝服务平台-粉丝头条-fensifuwu.com

如何拆分微服务架构？

科技 06-12 来源： hello架构

产品初期，应该以单体架构优先。面对一个新的领域，对业务的理解很难在开始阶段就比较清晰，往往是经过一段时间之后，才能逐步稳定。很多时候，从一个已有的单体架构中逐步划分服务，要比一开始就构建微服务简单得多。另外，在资源受限的情况下，采用微服务架构风险较大，很多优势无法体现，性能上的劣势反而会比较明显。

单体、组件化、微服务架构成本趋势，如图所示。当业务复杂度达到一定程度后，微服务架构消耗的成本才会体现优势，并不是所有的场景都适合采用微服务架构，服务的划分应逐步进行，持续演进。产品初期，业务复杂度不高的时候，应该尽量采用单体架构。

1. 几乎所有成功的微服务架构都是从一个巨大的单体架构开始的，并且由于太大而被拆分为微服务架构。

2. 几乎所有我听说过从一开始就构建为微服务架构的故事，最终都遇到了巨大的麻烦。在服务划分之前，应该保证基础设施及公共基础服务已经准备完毕，可以通过监控快速定位故障，通过工具自动化部署、管理服务，通过服务化框架降低服务开发的复杂度，通过灰度发布提升可用性，通过资源调度服务快速申请、释放资源，通过弹性伸缩快速扩展应用。

如何决定微服务架构的拆分粒度

微服务架构中的微字，并不代表足够小，应该解释为合适。但是合适过于含糊，每个人理解的合适都不尽相同。实际上，有时候对于一个对业务理解不够深入，对团队情况又不是很了解的人，根本无权协助确定服务的粒度。况且，就算本团队的架构师，也很难确定粒度。随着业务发展，开发人员水平的提升，粒度可能会发生变化。这是一个磨合的过程，一个不断演进的过程，没有绝对的对与错。

如果实在找不到合适的依据，可以参考下表，决策占比是从通用的角度考虑，并不适用所有的情况，某些公司认为团队规模是决定性的，也有些公司认为架构演进是决定性的，还有些公司认为交付速度是决定性的，找到那个你认为的决定性因素，去做合理的拆分即可。

微服务拆分粒度决策参考表

微服务设计原则

在微服务架构的设计过程中，我们应该遵循哪些原则？以下原则在微服务架构中经常被提起，遵循这些原则能够让我们少走弯路。

垂直划分优先原则

应该根据业务领域对服务进行垂直划分，因为水平划分服务可能会导致如下问题。

调用次数更多导致性能大幅下降。
实现一个功能要跨越更多服务，沟通成本升高。

垂直划分服务可以以最简单的方式缓解上述问题，并且可以让团队从上至下关注业务实现，端到端负责，持续改进。下图简单描述了一个按业务领域垂直划分的微服务架构示例，在业务垂直方向切分服务，通过API Gateway聚合内容。

持续演进原则

服务数量快速增长带来架构复杂度急剧升高，开发、测试、运维等环节很难快速适应，会导致故障率大幅增加，可用性降低，非必要情况，应逐步划分，持续演进，避免服务数量的爆炸性增长，这等同于灰度发布的效果，先拿出几个不太重要的功能拆分出一个服务做试验，如果出现故障，则可以减少故障的影响范围。另外，除了业务服务数量的增加，还需要准备持续交付的工具、微服务框架等，加强监控。

服务自治、接口隔离原则

尽量消除对其他服务的强依赖，这样可以降低沟通成本，提升服务稳定性。服务通过标准的接口隔离，隐藏内部实现细节。这使得服务可以独立开发、测试、部署、运行，以服务为单位持续交付。

直接访问对方的数据库会造成一定的耦合性，应该尽量避免。

自动化驱动原则

部署与运维的成本会随着服务的增多呈指数级增长，每个服务都需要部署、监控、日志分析等运维工作，成本会显著提升。在服务划分之前，应该首先构建自动化的工具及环境。开发人员应该以自动化为驱动力，简化服务在创建、开发、测试、部署、运维上的重复性工作，通过工具实现更可靠的操作。避免微服务数量增多带来的开发、管理复杂度问题。自动化可以从多个方面节省时间、提升效率，它可以快速跟踪整个交付过程并实时向所有参与者报告这个过程，赋予参与者责任感和成就感，如研发过程中，推行持续集成的文化就特别重要，而持续集成所依赖的工具就是一种自动化的体现。

很多互联网公司都遵循“一切皆自动化”的原则，特别是存在跨地域的研发模式时，使用自动化工具将是至关重要的，如开源的协作模式。

微服务架构实施的先决条件

不提倡从一开始就建立微服务架构的原因之一是没有做好准备，下面我们来看一下建立微服务架构前，需要从哪些方面做准备。

研发环境和流程上的转变

在实施微服务架构之前，我们要准备相关的环境和流程，可以简单地通过以下几方面建立基本的条件。

自动化工具链

微服务架构的一大优势是快速交付，快速交付不只是体现在服务的粒度更小，可以独立交付，还体现在整个流程更快速，微服务架构基于自动化的工具链，以流水线交付的方式串联整个DevOps流程，小团队可以基于服务独立开发、测试、部署、运维。传统的交付周期以月为单位，而微服务架构的交付周期能做到以天为单位，如果按照传统的开发模式是无法满足要求的。

微服务框架

微服务框架可以封装、抽象分布式场景下的一些常用能力，例如负载均衡、服务注册发现、容错、远程通信等能力，可以让开发人员快速开发出高质量的服务，在采用微服务架构之前，应该先进行微服务框架的选型，试用。

快速申请资源

如果以天为单位进行交付，就必须能够快速申请资源。基础设施即代码可通过编程的方式管理虚拟机或容器，免去了手动配置、更新各个硬件的需要，这就使得基础设施极具弹性，能够快速、高效、准确的进行重复性操作，开发人员使用同一套配置或代码，就可部署并管理成千上万台物理机。基础设施即代码能够得到更快的速度、更低的成本和更可靠的环境。用代码定义服务器配置意味着在众多服务器之间有绝对的一致性，容易形成标准化。手动调整配置往往会有一些微妙的差异，难以追溯和调试，并且会导致许多诡异的问题。

故障发现反馈机制

当服务数量增多，频繁交付的时候，故障次数可能会大幅上升，我们需要通过全面的监控发现故障，及时处理并发出报警。当生产环境出现问题的时候，需要将故障进行分级，评估影响面，并分配给相应的架构师或者开发人员，开发人员需要不断更新故障的状态，便于管理者、客服、销售人员等问题相关人了解进度，以提供更好的用户体验。

研发流程上的转变

需要重新组建团队，以服务为核心，按照业务领域划分全功能团队，改变原有的研发流程、决策机制。例如，倡导敏捷文化，快速迭代，做更多的自动化测试，加强Code Review，给团队更多的自主决策权等。

拆分前先做好解耦

解耦这个词汇来源于数学，是指使含有多个变量的数学方程变成能够用单个变量表示的方程组，即变量不再同时共同直接影响一个方程的结果，从而简化分析计算。

在软件世界里，解耦强调的是每个单元可以独立变化，尽量减少外界的影响。说白了也就是，如果把Memcache换成Redis，那么需要多少工作量，涉及的修改面有多大。但是，解耦也会带来工作量的增加，架构或者代码变得复杂等问题。例如很多人会假设把Oracle换成MySQL，Memcache换成Redis，但是在实际的情况中，并不是所有的业务发展速度都有这么快，如果能预料到短期将发生变化，为什么不直接使用MySQL呢？通常这是一个伪命题。如果在未来几年后才发生变化，那么现在去做相应的适配，这不符合敏捷开发的哲学思想，也不是一个高效率的思路。

在转向微服务架构之前，业务服务存在状态、数据库中存在触发器和存储过程、服务之间绕过接口调用等问题是我们首先要解决的。

状态外置

无状态（Statelessness）指的是服务内部变量值的存储。有状态的服务伸缩起来非常复杂，可以通过将服务的状态外置到数据库、分布式缓存中，使服务变成无状态。通常业界用牲畜来比喻无状态，用宠物来比喻有状态，宠物是需要呵护的，是有名字的，不能被轻易替换的，而牲畜是没有名字的，只生产肉和奶，死掉一个，用新的来替换即可。所以，我们期望服务可以做到无状态，可以被轻易地替换掉。

但是，无状态不代表状态消失了，只是把状态转移到分布式缓存和数据库中了，业务服务伸缩的时候，还是要考虑分布式缓存和数据库所能承受的压力限制。那为什么还要外置呢？因为一方面即使不外置到数据库，数据库也存在状态，另一方面，这样可以把复杂度抽象到统一的位置，便于集中处理。例如，服务端的Session信息可以放到分布式缓存中，这一设计方法既可以让业务服务在一定范围内（分布式缓存的上限）伸缩时不受状态的限制，又可以把复杂度抽象到特定的位置，让专业领域开发人员统一做有状态的伸缩。虽然绝大多数服务都可以状态外置，但是并不是所有的业务服务都能设计成无状态，例如客户端与服务端的长连接，这种状态很难外置。

以下三种常见的状态需要和业务服务拆分开来，否则扩展性将受到很大限制。

（1）定时任务。

因为大多数任务不能重复触发，轻则重复做无用功（幂等的情况下），重则会导致不一致。例如从A表中把数据迁移到B表中，如果在两个服务中同时处理，没有一个协调器的话，会导致重复拉取。所以，需要把定时任务从业务服务中提取出来，通过分布式任务调度统一协调。

（2）本地存储。

在本地存储文件也是比较常见的，当有多个实例的时候，要么全部同步一遍，要么需要根据用户路由到同一个实例，并且在伸缩的过程中，需要迁移。

（3）本地缓存。

某些业务会将数据存放在本地做缓存，例如Session数据，如果要去掉本地缓存，则可以通过分布式缓存和Cookie解决业务服务带状态的问题。

当然，本地缓存也有适用的业务场景，不能一概而论。

去触发器、存储过程

触发器、存储过程在系统规模比较小的时候，的确非常简单实用。但是，随着业务的发展，业务服务比较容易扩展，数据库通常变成了伸缩的瓶颈，许多方案都是为了平衡数据库的压力，触发器、存储过程可能会带来如下问题。

整体的伸缩受到数据库的限制，因为触发器、存储过程难以扩展。
当存在水平分表的时候，可能无法满足需求。
如果触发器、存储过程过多，则会导致运维复杂度升高。

解决方案通常是通过外部的业务服务或者定时任务替换触发器及存储过程。

通过接口隔离

直接访问其他服务的数据库，如下图所示。CRM直接调用OA的数据库，没有通过接口调用，当我们对CRM进行微服务架构拆分之前，需要先理清系统的外部依赖关系，如果存在多个系统共享一个数据库，就会导致耦合问题，影响可用性和扩展性，可能出现如下问题。

1.当CRM中的数据结构发生变化的时候，OA也要跟着变化，导致开发的过程互相依赖。

2.有可能在CRM进行的限流是没用的，因为OA没有通过CRM提供的接口进行调用。

3.假设随着业务的发展，需要在CRM的数据库上做缓存，可能存在多个地方要考虑缓存的问题。

总之，接口应该作为唯一对外提供的访问方式，这代表的是控制力。解决方法就是通过接口调用，逐步去除数据库的直接访问。

微服务划分模式

虽然服务是逐步被拆分出来的，随着业务的演进，在某一时刻，可能需要我们重新审视服务划分的是否合理。本节向大家推荐两种服务划分的方法。首先介绍如何选择服务划分的方法。

基于业务复杂度选择服务划分方法

根据业务复杂度划分服务，如图所示。当业务复杂度足够高的时候，应该基于领域驱动划分服务，而领域驱动本身足够复杂，很多概念比较抽象，应用范围并不是特别广泛，所以当业务复杂度较低时，可以选择基于数据驱动模式划分服务，数据驱动模式更容易理解和上手，也就是说，除非业务复杂度非常高，否则应该优先以数据驱动模式划分服务。这里的业务复杂度专指业务逻辑，而非数据量、并发量等相关复杂度。