一文读懂矩阵乘法举例从“看不懂公式”到“算得又快又准”的关键一步

编辑：杭新娜 2026-04-02 05:23 浏览：41 次举报

标签：

微信公众号矩阵

我是数据分析顾问宁川，日常工作就是帮企业把一堆看不完的表格、报表和日志，变成老板能听得懂的“一句话结论”。有一个知识点出场频率极高，却又让很多人心里一紧——矩阵乘法。{image}很多人学高数时被它“伤害”过：符号堆满黑板、例题抽象到怀疑人生，等到真的在工作里遇到时，只剩一个念头：我到底要不要会这个东西？

如果你点进来，是因为搜索“矩阵乘法举例”，说明你大概率正处在这种尴尬状态：

知道它很重要，却对公式没有任何亲切感
只记得“行乘列”，但遇到稍微复杂一点点的例子就乱套
模糊听说它和推荐系统、神经网络、Excel运算有关，却连不上实际场景

这一篇，我不准备给你扔一堆抽象定义，而是用真实业务场景 + 具体数字例子 + 最少的公式，把矩阵乘法说清楚。看完你应该可以做到三件事：

看到一道矩阵乘法题，不再慌，可以自己拆开理解
明白为什么各行各业都在用矩阵乘法，而不是“老师说重要”这种理由
知道下一步要怎么学，而不是停留在“看过但记不住”

从一张“销量表”开始，矩阵乘法到底在算什么

先不谈矩阵，先看一张普通得不能再普通的小表。一家连锁咖啡店，卖三种饮品：拿铁、美式、抹茶拿铁。4 月份三家门店的销量如下（单位：杯）：

门店 A：拿铁 100，美式 80，抹茶 60
门店 B：拿铁 90，美式 70，抹茶 50
门店 C：拿铁 120，美式 60，抹茶 40

用矩阵写，就是一个 3×3 的矩阵 A（3 家门店 × 3 种产品）：

A =[[100, 80, 60],[90, 70, 50],[120, 60, 40]]

再看价格表：

拿铁 25 元 / 杯
美式 20 元 / 杯
抹茶拿铁 28 元 / 杯

价格向量可以写成一个 3×1 的矩阵 p：

p =[[25],[20],[28]]

现在问题来了：想算每家门店当天营业额，用矩阵乘法能怎么做？

A 是 3×3，p 是 3×1，可以做乘法，结果会是 3×1。算法就是那句被反复念叨的“行乘列”：

门店 A 的营业额 = 100×25 + 80×20 + 60×28
门店 B 的营业额 = 90×25 + 70×20 + 50×28
门店 C 的营业额 = 120×25 + 60×20 + 40×28

你在纸上算的是三条“加权求和”的式子，在矩阵的语言里，就是：

Revenue = A × p

注意一个细节：

A 的每一行，代表“一个门店对三种产品的销量组合”
p 的这一列，代表“产品价格的组合”
相乘得到的一行（这里其实是一行一个数），代表“一个门店在这个价格组合下的收入”

矩阵乘法的本质，并不是为了让你背一个算式，而是把一堆“加权求和”的重复动作集中到一个统一的写法里。

你可能已经隐约感觉到了：

如果门店变成 300 家、产品变成 50 种，手算完全不现实
用矩阵表达后，只要 A 和 p 一丢进程序，几百家门店的营业额一次性就算完

这就是矩阵乘法在企业数据分析里的真实用法，而不是教科书上的“抽象运算”。

“行乘列”的另一层含义：把多个指标压缩成一个“有用结果”

在公司给新人做内部培训时，我经常会问一个小问题：

“如果有两个候选人，你怎么看谁更适合做数据岗？”

新人们通常会列出一堆指标：

数学基础
编程能力
沟通表达
行业理解

假设我们给出了量化评分：

候选人评分矩阵 C（2 人 × 4 指标）：

C =[[8, 9, 6, 7], // 候选人 1[7, 7, 8, 9] // 候选人 2]

团队负责人说：

数学和编程更重要，各占权重 0.3
沟通与行业理解各占 0.2

权重向量 w（4×1）：

w =[[0.3],[0.3],[0.2],[0.2]]

执行 C × w 得到的 2×1 矩阵，就是两个候选人的“综合得分”：

候选人 1 综合分 = 8×0.3 + 9×0.3 + 6×0.2 + 7×0.2
候选人 2 综合分 = 7×0.3 + 7×0.3 + 8×0.2 + 9×0.2

这其实就是很多企业在做绩效考核、评分排序时背后的计算逻辑，而矩阵只是把这样的逻辑打包成统一工具。

如果换个说法：

每一行是“一个对象”的多个特征（一个候选人、一个用户、一家门店）
每一列是一种“特征维度”（技能、年龄、收入、偏好）
右侧乘一个权重列向量，相当于把多维信息压缩成一个数字，用来比较或决策

这就是机器学习、评分卡、推荐系统里反复用到的套路：多维特征 × 权重 = 一个更有用的新指标。当你在业务报表里看到“综合评分”“信用评分”“消费指数”，背后几乎都能找到这样的矩阵乘法影子。

真正改变行业运行方式的，是“大矩阵乘以大矩阵”

说到这里，例子还停在“行乘列 × 向量”层面，更多像是在用矩阵做加权平均。但在我参与的几个项目里，改变业务效果的，往往是“大矩阵 × 大矩阵”的那一步。

一个典型场景：电商推荐。让你对“你为什么会看到这个商品”的过程有点更清晰的理解。

用极简化的方式抽象：

用户矩阵 U（用户数 × 特征维度），每一行是一个用户的偏好向量
商品矩阵 V（特征维度 × 商品数），每一列是一个商品在这些特征上的表现

比如一个非常粗糙的例子：

特征维度只有 3 个：爱运动程度、爱美妆程度、爱数码程度
用户 A 的偏好是 [0.9, 0.1, 0.8]
商品 1（跑鞋）是 [1.0, 0.1, 0.2]
商品 2（口红）是 [0.1, 1.0, 0.1]
商品 3（耳机）是 [0.3, 0.1, 0.9]

用户偏好列向量 u，商品矩阵 V：

u =[[0.9],[0.1],[0.8]]

V =[[1.0, 0.1, 0.3],[0.1, 1.0, 0.1],[0.2, 0.1, 0.9]]

把商品矩阵转置一下（3×3），计算：

score = uᵀ × V

你会得到一个 1×3 的行向量，每个位置对应一个商品对用户 A 的匹配度：

跑鞋的匹配度 = u 和跑鞋向量做点积
口红的匹配度 = u 和口红向量做点积
耳机的匹配度 = u 和耳机向量做点积

在真实的 2026 年主流推荐引擎里，特征维度不会只有 3，而是动辄几十到几百，矩阵维度常常达到几十万行甚至更多。但本质没有变：用矩阵乘法，把一堆用户和一堆商品的“相似/匹配程度”同时算出来，排序后就变成了你的首页推荐。

更有意思的是，大规模推荐系统性能优化的报告里，技术团队通常会直接写：

某某平台将核心矩阵乘法库从旧版本升级，用 GPU 加速，推荐计算延迟从 60ms 降到 18ms
某广告投放系统在 2026 年 Q1 将大规模矩阵乘法迁移到自研算子上，单机吞吐提升约 2.1 倍

这些看起来枯燥的数字，在业务侧的翻译是：

用户浏览页面不卡顿，更愿意滑下去
可以在有限时间内尝试更多 AB 实验，找到转化更高的推荐策略

而推动这一切的，很大一部分就是快速、稳定地把超大矩阵乘起来。

在纸上算清一个例题，让概念从“耳熟”变“手熟”

回到你一开始的需求：搜索“矩阵乘法举例”，多半也是为了搞定具体的计算和理解。我们就拿一个稍微“教科书化”，但又比较贴近实际的例子算一遍。

设有一个 2×3 的矩阵 M：

M =[[1, 2, 3],[4, 5, 6]]

和一个 3×2 的矩阵 N：

N =[[7, 8],[9, 10],[11, 12]]

问题：求 M × N。

为了不变成枯燥堆算式，我们换个更贴近场景的理解：

M 的每一行可以视作“两个不同用户的行为特征”（比如三种行为次数：浏览、收藏、下单）
N 的每一列可以视作“两种不同权重策略”（比如算法 A、算法 B 对这三种行为的强调程度）
M × N 的结果，就是在两种策略下，这两个用户各自的“最终评分”

但是算式还是要落地：

结果矩阵 P = M × N，维度是 2×2。每个位置 P[i, j] 的计算规则是：M 的第 i 行 · N 的第 j 列（点积）。

具体展开：

P[1,1] = 1×7 + 2×9 + 3×11 = 7 + 18 + 33 = 58
P[1,2] = 1×8 + 2×10 + 3×12 = 8 + 20 + 36 = 64
P[2,1] = 4×7 + 5×9 + 6×11 = 28 + 45 + 66 = 139
P[2,2] = 4×8 + 5×10 + 6×12 = 32 + 50 + 72 = 154

所以：

P =[[58, 64],[139, 154]]

不是为了让你背这四个数字，而是要你抓住那个“固定动作”：

对某个位置来说，左边取一行，右边取一列
对位相乘，再把结果加在一起
这就是矩阵乘法的唯一核心动作

当你把这种“行 × 列 → 点积”的模式内化之后，你会发现：

每看一个实际业务例子，你都能判断这是不是在做矩阵乘法
每遇到一个矩阵乘法题，都能把它拆解回“多次加权求和”的组合

这比死记硬背公式要可靠得多。

如何继续学下去，而不是只停在“懂一个矩阵乘法举例”

在公司里帮新人做学习规划时，我会坚持一个小原则：任何抽象概念，都要绑定三个层次：算得对 → 解释得出 → 用得上。矩阵乘法也一样。

你现在已经接触到：

算得对：通过门店销量、评分和那个 2×3 × 3×2 的例子
解释得出：知道它实质上是“多维信息加权整合”的工具
用得上：在推荐系统、评分模型、营业额计算中的作用

如果你想再走远一点，可以从这三条路径往前推：

在 Excel 或任意表格工具里，亲手做一次“矩阵乘法”
- 把门店销量表和价格表输入表格
- 使用 SUMPRODUCT 函数模拟一次矩阵乘法
- 把公式和“行乘列”的概念对应起来，你会更有感觉
选一门你常见的编程语言，跑一次矩阵乘法
- Python 里用 numpy.dot，把刚才的 M 和 N 直接丢进去
- 体会一下“同样的逻辑，用代码能算多大规模”
留意你身边的“加权求和”场景
- 绩效考核、评分模型、打分排名
- 多维业务指标整合成一个核心指标很多地方都在偷偷用矩阵乘法，只是平时不写成矩阵形式而已。

从一个“矩阵乘法举例”出发，如果你能把这三个层次连起来，后面接触到线性代数、神经网络、推荐算法时，都会轻松很多。

收个尾：矩阵乘法没那么“高冷”，它只是你熟悉但没命名的套路

以一个数据从业者的视角，我更愿意这样描述矩阵乘法：

它不是某门课的一章，而是一种“把复杂关系统一写成公式”的习惯
它不是数学家才会用的工具，而是你在评估、加权、价算、推荐时每天都绕不开的算式
它在 2026 年的应用场景，比你能想到的要广：智能推荐、图像识别、NLP、大规模广告投放优化，全都离不开高速矩阵乘法

你今天搜索“矩阵乘法举例”，可能只是为了搞懂一道题、写完一份作业，或者看懂一段代码。但如果能顺带帮你把这个概念从“抽象恐惧”变成“可以解释给别人听”，那这篇文章的使命就完成了。

碰到更多看起来“抽象”的数学概念时，你也可以用同样的方法：

找一个足够具体的表格或真实场景
把公式拆到“我每天其实就在这么算”这一层
再慢慢把它重新写回数学语言

矩阵乘法其实已经在你的工作和生活里，只是过去没人认真拉你看过一遍它的“真面目”。如果这一次你觉得它没那么可怕了，那就够了。

免责声明：以上整理自互联网，与本站无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。（我们重在分享，尊重原创，如有侵权请联系在线客服在24小时内删除）

菜单导航

一文读懂矩阵乘法举例从“看不懂公式”到“算得又快又准”的关键一步

相关评价

推荐阅读

推荐资讯

最新资讯

热门资讯