写于 2021-06-07。

平台产品逻辑与执行

本文要讨论与说明的是：

整理：平台产品的基本逻辑与注意点。即平台产品逻辑、常识。如目标、产品关键。
避免：忽视平台产品基本逻辑而带来平台产品推动的困境。即平台产品的执行推动方式。如对业务的支撑与协同的要求。

平台产品指如公共设施、移动基础服务。

从产品视角，产品/功能会包含下面几个关注方面：

产品模型：设计合理性

即回答用户为什么要用产品/功能？

是不是 需求？业务需求的合理性。（这部分本文档暂不讨论）

能不能满足需求，可行性下的功能实现程度是不是够的？

合作模式：收益合理性

涉及几方角色；各方的收益、投入/风险是什么，各方能不能配合运作起来（各方的ROI足够）？

PS：这条本来叫『商业模式：盈利合理性』；这里讨论平台产品，改写成了『合作模式：收益合理性』

环境：拓展合理性（这部分本文档不讨论）

市场状况拓展性：市场竞争、技术变化、政策影响

产品逻辑拓展性：能支撑衍生什么功能？

团队：实施合理性（这部分本文档不讨论）

如执行能力匹配？

PS: 上面的产品关注方面摘自《从点子到产品》 CH1 点子到方案

一、关于业务产品 vs. 平台产品
- 1.1 业务方引入平台产品的变化
  - 平台产品要担责的约定/范围/条件
- 1.2 平台应该做什么？
  - 为什么用全接管/透明的平台功能来作为平台目标？
二、平台产品对业务的支撑与协同的要求
三、FaaS透明化运行时升级为例的一些具体讨论
- 运行时升级是不是全接管平台功能（透明的）？
  - 关于无人值守的运行时升级
- 关于升级问题的一些业界典型思路与做法
三、产品主题相关资料
PS：一些补充讨论

一、关于业务产品 vs. 平台产品

平台产品
- 作为业务的支撑角色，完成业务产品中的一部分通用功能（即平台化的功能）。
- 与业务产品/同学一起才能完成业务价值的交付。
业务产品
- 对于这部分被平台化的功能，在没有平台产品介入之前，完全由业务自己来支撑，即只有一个负责方。
- 对于（平台化的）功能所解决的问题，要解决到什么程度及问题后果的承担，可以根据业务当前的实际情况阶段，由业务产品/同学自己来动作决策与职责承担。
  - 决策的动作：如是否升级XXX。
  - 承担的职责：如升级出了的故障由谁如何承担。
- 由于动作与担责是主体是同一个，产品出了问题时不会出现模糊不清的跟进与如何担责的扯皮。
担责的扯皮会极度影响平台产品的用户口碑、发展与落地。
- 背后的关键是
  - 业务对平台产品/功能的要求、产品的SLA 是什么？
  - 为什么要达到这样的要求？
- 值得整理说明清楚，让做平台产品的成员都理解并达成共识，以保证平台产品有效的执行、落地与推动。

1.1 业务方引入平台产品的变化

当一个功能由业务产品自己来承担迁移到由平台产品时，会发生一系列的变化。

业务引入一个平台产品后：

分离原来业务自己管理的一部分功能到平台产品中。
引入一个新角色平台方，是一个新的担责主体。
- 当出问题时，业务方就会想：是不是由平台方来担责？

PS：平台产品的职责还可以进一步分离成产品实现方和产品运维方，本文不再展开。

平台产品要担责的约定/范围/条件

平台产品要担责的约定/范围/条件是什么呢？

当符合下面的条件，出的问题由平台产品方来担责：

涉及平台提供/接管的功能
平台主动的平台功能变更/操作引起
即不通知业务、不是业务方触发的，会说成对于业务的透明的变更/操作。

上面的只是确定由平台担责的那一部分。当条件不这么强时，往往需要Case-By-Case与业务方聊。

TODO 上面条件的描述需要逐步细化、优化。

上面只是初步的陈述，大家可以来优化这个上面的整理说明。

1.2 平台应该做什么？

长期需要Case-By-Case与业务聊担责的功能，即不能业务透明接管的功能，不合适由平台产品来实现。

这里的长期是指：

不是受限于平台的短期节奏/投入，当下还没有去做好的功能；

而是平台产品解好不可行的功能，比如因为技术不可行等等有核心复杂性，往往业界没有案例无进展。

原因是

规模化是平台产品的价值体现的必然路径。
而不业务透明的平台功能会锁死平台产品的发展：
- 人力支撑的一定比例投入，当规模大了，Case-By-Case的支撑线性消耗了团队的投入，不具备扩展性。
- 有一定比例风险，当规模大了，风险量会超出一个平台产品能承担的上限。

接管业务的平台功能做到透明是指：

无需业务团队成员的成本投入
无需业务方承担操作风险

即 全接管业务的功能：

是平台的目标；直接体现了平台的核心竞争力。
全接管业务的平台功能的多少/比例可以用来度量平台的成熟程度。

为什么用全接管/透明的平台功能来作为平台目标？

上面直接关注 全接管平台功能（透明的） 的说法听起来过硬了啊！部分接管的平台功能（不透明），不也能提效业务、也能让平台能有竞争力（相对业务方自己承担）吗？

嗯，上面的思考方式听起来是很自然的；多数人在开始做产品时肯定也是这么想的，并会这样去指导做平台产品的展开。

之所以用更严格的『全接管的平台功能』来作为平台目标，原因是：

用更严格的『全接管/透明的平台功能』，对于产品，表达力可以是一样的。表达转换的方式如下：
- 对于一个『部分接管的平台功能』可以进一步拆解小功能。
- 其中会包含全接管的小功能，就是大功能能提效业务的原因。
结合上面『不能业务透明的功能，不合适由平台产品来实现』，实际上
- 对于『部分接管的平台功能』，平台做的是整合工作而不是接管，并没有规模化的平台产品价值；
- 平台产品会做这样的整合工作，是为了透出『全接管的平台功能』的平台价值，吸引用户来用。
且这样更严格的方式能
- 能简单有效地判断产品的成熟程度/竞争力。
- 也能更好引导每个做产品的同学积极发现平台产品发展的关键点。

上面关于『平台功能的全接管』回答了上面的『担责扯皮』背后的关键：

业务对平台产品/功能的要求、产品的SLA 是什么？

为什么要达到这样的要求？

总结上面所说的成一句话：在平台产品功能中，要区分哪些是接管的功能，哪些是整合的功能。

二、平台产品对业务的支撑与协同的要求

在平台产品功能中，要区分哪些是接管的功能，哪些是整合的功能。
- 对于一个平台功能的实现程度是可以分级；一个平台功能可以再分拆来看。
- 比如 FaaS平台的运行时升级：
  - 如果FaaS运行时升级不是接管透明（不能可靠保证升级后业务没有问题）。
  - 但其中升级的执行过程/步骤这个子功能平台可以做到接管透明，可以提效业务。
对于平台关键的『全接管透明功能』：
- 无需业务团队成员的成本投入、无需业务方承担操作风险；引发的问题由平台担责。
- 对于全接管的功能，要承担风险，也获得对应的KPI。平台方不能有给予者心态。
- 比如 FaaS平台的运行时升级不能要求业务先保证提供完备的业务测试Case。
  - 平台产品并不是救人危难的给予者，只不过是业务使用一个组件，也收获了平台自己的KPI。
  - 像平台触发的变更，但要求业务有完整Case，背后隐含了给予心态，对业务提非分要求（业务监控要完整）。假想一下：
    - 你是业务，业务监控/回归Case多点少点，我自己兜风险、看投入与节奏、看团队成员水平，不能保证完备。
    - FaaS自己的监控敢说完整不? k8s 变更对FaaS提监控/回归Case要完备的要求？
对于平台上部分接管的整合功能：
- 明确说明业务要关注的事项，哪些问题平台不能担责，避免担责扯皮。

三、FaaS透明化运行时升级为例的一些具体讨论

TODO

下面具体『透明化运行时升级』Case的讨论，与上面泛化的平台产品的思考
还要互相对照的梳理整理……

运行时升级是不是全接管平台功能（透明的）？

上面一节提到的是功能能否全接管/透明是平台产品发展与竞争力的关键，是关于平台产品功能的前提关键问题。

不能做到透明化运行时升级。 这个判断，原因如下：

如果依赖了涉及业务同学的功能回归，才能保证升级稳定性，则不是透明的（不是一个平台化功能）：
- 涉及业务功能的回归，而回归业务是个业界难题，判断长期不可能透明解决。
- 业务的回归Case 与监控指标，一定不能保证回归就是安全的。
  - 因为故障原因五花八门，回归Case、业务指标再多，也不能保证发现问题。
  - 像软件无bug、监控无死角，都只是理想。
- 业务自己回归的执行方式：
  - 功能回归会有人肉业务测试；（自动化）业务回归case往往不多、更不能说完整。
  - 业务同学 Case-By-Case结合业务当下的实际情况，来确定回归的执行程度。
- 即回归业务需要业务方参与，不能透明。
FaaS平台的运行时升级不能要求业务先保证提供完备的业务测试Case。
- 接了活就要承担风险，平台并不是救人危难的给予者，只不过是业务使用一个组件，也收获了平台自己的KPI。
  - 像平台触发的变更，但要求业务有完整Case，背后隐含了给予心态，对业务提非分要求（业务监控要完整）。
  - 假想一下：
    - 你是业务，业务监控/回归Case多点少点，我自己兜风险、看投入与节奏、看团队成员水平，不能保证完备。
    - FaaS自己的监控敢说完整不? k8s 变更对FaaS提监控/回归Case要完备的要求？
- 不管是为了平台、还是为了业务，动了都是变更。
- 只要是平台的变更引起的，故障是平台的。
  - Noah变更/升级有问题，业务故障算Noah的。
  - FaaS运行时透明升级有问题，业务故障算FaaS的。
- FaaS不能对业务的监控完备提要求。平台的变更是平台的锅，别问业务指标够不够。
  - 这是业务方的自然心态；也是对平台方的要求。
  - 否则出了故障，就会出现下面的局面：
    - 平台方觉得，业务同学不体量
    - 业务方觉得，平台同学想的太简单、不厚道

关于无人值守的运行时升级

是否『无人值守』是在说明提效方式，没有说明『为什么升级的回归是可靠的？』。
说明提效/无人前，先要说明是否可靠/稳，不是过渡不过渡方案的问题。

关于升级问题的一些业界典型思路与做法

应用的依赖升级是业务应用变更，不是平台变更。
- 大家有了共识，边界清楚
- 可执行：业务自己来执行回归；避开了『业务方来做业务回归/保证稳』这个不可能完成的任务
运行时有多个版本又会怎样? 真是问题吗？
- 不要简单过快回答。
- 上面的讨论说明，另一面的路(由业务保证回归 & 统一升级的方式)，在产品逻辑上不可行。
问题：业务没有升级，出了平台老bug。如何解决定责？
- 对长时间组件老版本/有问题的组件版本
  - 发出升级公告、邮件群发
  - 说明组件问题、平台免责。强调风险和后果要自负。
  - 这就是像FastJson这样基础组件平时的做法。
- 上面是关于平台组件升级，业界的典型做法与出路；一般称为『夕阳条款』。
- 平台不可能无限期支持老组件与组件老版本，所以有『夕阳条款』是合理的。

三、产品主题相关资料

微信之父张小龙内部100多页PPT，全面剖析微信背后的产品观
- 文字版 https://www.cnblogs.com/end/p/5521138.html 、文字版2；PPT图片版
- 作为可能的注意项看看/想想，挺有用有意思的

PS：一些补充讨论

业务回归测试也是一种手段，更原始的需求或许是：发布期间的异常检测。

从『透明化运行时升级』功能/需求的涉及的『业务回归测试』到『发布异常检测』功能/需求，
是对于用户/业务需求、产品功能的一次思考、演进与变化：更加确定实现功能及其程度是业务需要的。

下面展开一些的具体讨论：

展开讨论是想再次表达本文档目标，即

关键前提的产品逻辑值得先想清楚、反复思辨深入（虽然是分析的事都只是像在纸上谈兵、沙盘推演）。

避免投入后回头才发现因产品逻辑不对不能期望地透出产品价值，成本相比就高得去了。

像『发布异常检测』这样的功能

可以逐步提升的检测宽度与有效性
对用户/业务是好的加分项
如果接入成本低，业务会积极用上
比较没故障的担责风险（具体还要看这个功能的做的程度与SLA）

初步看起来，做这个功能必要&可能。也相信这个功能做精，本身就可以很有竞争力。

像『发布异常检测』这样的技术建设会有很多，可能比较分散，可能可以有机的结合起来。整合也不是个简单的事：

相信心底里大家不喜欢用『整合』这个词，总是个二等公民。😬
对一个『整合』的理解/探索到位了，『整合』
- 会变成一个新能力
- 或孵化出/发现一个被忽视的关键的新能力
这个新能力会成为产品的Core。

我们能不能清楚表达描述这个现在还不存在的新能力，或许可以用来判断我们的产品逻辑/理解是不是清楚了。

但如果要执行投入，还可以要问下面的问题：

这个功能做了业务用户喜欢/主动要来用，功能实现程度的拐点是什么？
即产品功能的爆点觉得会在哪儿？
这么明显的诉求，相信大家（无论是业务团队/还是平台团队）不难想到。那么
- 这个能力业界做的如何？
- 旁边可以用的对应产品是哪些？做如何？用户用的如何？
- 为什么对于这个明显诉求的能力，平时好像没有听到过？
  - 是因为已有的做得不好？这个功能做到有用程度不可行？
  - 还是做的太好了？（应该并不是这个原因 :"）我们做是不是没什么空间了？
……

大家在论证产品逻辑时，会出现这样的逻辑：

退化为：运行时升级（通知）工具。我们或许短期需要这样的“工具”，但长期一定不是的。

这样的工具，其实解决问题提很有限，因为真正耗费「开发者」精力的部分是观察和测试。

而且规模化之后统一升级的负面影响更大：

规模化之后平台产品团队很快会成为资源瓶颈，到时候如果没有真正的科技进步，就必须开倒车：把控制权再次交还给「业务开发人员」。

上面的『长期一定不是的』这样的结论/观点，像是在表达是在表达『愿望』，而不逻辑。😄
说明了『运行时升级（通知）工具』的做法会有发展限制问题，但并没有说明与对工具对应的平台做法可行。

『A不行』并不能推出『在A对面的B就可行是方向』。
即排除法对于不确定的规划的事是不适用的，因为事情是不是有解/整体组合功能是不是能发展出来还是未知的。

产品逻辑推演要包含给出如何『做成』一个产品（可行性），而不仅是给出为什么要『要做』一个产品（有需求）。

像下面这样的逻辑说明：

运行时升级工具（集中式）是需要耗费FaaS产品的人力进行对齐的（平台方式是必要的）……

如果没有真正的科技进步，就必须开倒车。……

说明的是工具做法的问题，逻辑是在说明平台必要性，即论证的是为什么我们要平台做法。对于产品逻辑的目标平台做法能『做成』并没有说明。

值得被充分展开说明，做产品的同学们能有传达思考与理解。

的确是这样的，bug出其不意、错误五花八门，指标再多也会漏，但人同样不能保证。

同时人能保证的那部分一定可以转化为规则或标准，通过自动化执行规则大概率比人执行的好。

会越来越规则化/标准化、比人肉好更有效、提效，我也是赞成的。

当然，平台+规范可以让测试更全面。一定程度上也是倒逼更好的编码风格。

『倒逼更好的编码风格』这样的事想想了意思一下就好～ 🤤 对于做一个产品就别当真了。
（即不能是做成的产品的前提，也不要让产品多个无助成功但分散投入的目标。）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

平台产品逻辑与执行

一、关于业务产品 vs. 平台产品

1.1 业务方引入平台产品的变化

平台产品要担责的约定/范围/条件

1.2 平台应该做什么？

为什么用全接管/透明的平台功能来作为平台目标？

二、平台产品对业务的支撑与协同的要求

三、FaaS透明化运行时升级为例的一些具体讨论

运行时升级是不是全接管平台功能（透明的）？

关于无人值守的运行时升级

关于升级问题的一些业界典型思路与做法

三、产品主题相关资料

PS：一些补充讨论

Files

README.md

Latest commit

History

README.md

File metadata and controls

平台产品逻辑与执行

一、关于 业务产品 vs. 平台产品

1.1 业务方引入平台产品的变化

平台产品要担责的约定/范围/条件

1.2 平台应该做什么？

为什么用 全接管/透明的平台功能来作为平台目标？

二、平台产品对业务的支撑与协同的要求

三、FaaS透明化运行时升级为例的一些具体讨论

运行时升级 是不是 全接管平台功能（透明的）？

关于 无人值守的运行时升级

关于升级问题的一些业界典型思路与做法

三、产品主题相关资料

PS：一些补充讨论

一、关于业务产品 vs. 平台产品

为什么用全接管/透明的平台功能来作为平台目标？

运行时升级是不是全接管平台功能（透明的）？

关于无人值守的运行时升级