我是数据分析顾问宁川,日常工作就是帮企业把一堆看不完的表格、报表和日志,变成老板能听得懂的“一句话结论”。有一个知识点出场频率极高,却又让很多人心里一紧——矩阵乘法。{image}很多人学高数时被它“伤害”过:符号堆满黑板、例题抽象到怀疑人生,等到真的在工作里遇到时,只剩一个念头:我到底要不要会这个东西?
如果你点进来,是因为搜索“矩阵乘法举例”,说明你大概率正处在这种尴尬状态:
- 知道它很重要,却对公式没有任何亲切感
- 只记得“行乘列”,但遇到稍微复杂一点点的例子就乱套
- 模糊听说它和推荐系统、神经网络、Excel运算有关,却连不上实际场景
这一篇,我不准备给你扔一堆抽象定义,而是用真实业务场景 + 具体数字例子 + 最少的公式,把矩阵乘法说清楚。看完你应该可以做到三件事:
- 看到一道矩阵乘法题,不再慌,可以自己拆开理解
- 明白为什么各行各业都在用矩阵乘法,而不是“老师说重要”这种理由
- 知道下一步要怎么学,而不是停留在“看过但记不住”
先不谈矩阵,先看一张普通得不能再普通的小表。一家连锁咖啡店,卖三种饮品:拿铁、美式、抹茶拿铁。4 月份三家门店的销量如下(单位:杯):
- 门店 A:拿铁 100, 美式 80, 抹茶 60
- 门店 B:拿铁 90, 美式 70, 抹茶 50
- 门店 C:拿铁 120, 美式 60, 抹茶 40
用矩阵写,就是一个 3×3 的矩阵 A(3 家门店 × 3 种产品):
A =[[100, 80, 60],[90, 70, 50],[120, 60, 40]]
再看价格表:
- 拿铁 25 元 / 杯
- 美式 20 元 / 杯
- 抹茶拿铁 28 元 / 杯
价格向量可以写成一个 3×1 的矩阵 p:
p =[[25],[20],[28]]
现在问题来了:想算每家门店当天营业额,用矩阵乘法能怎么做?
A 是 3×3,p 是 3×1,可以做乘法,结果会是 3×1。算法就是那句被反复念叨的“行乘列”:
- 门店 A 的营业额 = 100×25 + 80×20 + 60×28
- 门店 B 的营业额 = 90×25 + 70×20 + 50×28
- 门店 C 的营业额 = 120×25 + 60×20 + 40×28
你在纸上算的是三条“加权求和”的式子,在矩阵的语言里,就是:
Revenue = A × p
注意一个细节:
- A 的每一行,代表“一个门店对三种产品的销量组合”
- p 的这一列,代表“产品价格的组合”
- 相乘得到的一行(这里其实是一行一个数),代表“一个门店在这个价格组合下的收入”
矩阵乘法的本质,并不是为了让你背一个算式,而是把一堆“加权求和”的重复动作集中到一个统一的写法里。
你可能已经隐约感觉到了:
- 如果门店变成 300 家、产品变成 50 种,手算完全不现实
- 用矩阵表达后,只要 A 和 p 一丢进程序,几百家门店的营业额一次性就算完
这就是矩阵乘法在企业数据分析里的真实用法,而不是教科书上的“抽象运算”。
在公司给新人做内部培训时,我经常会问一个小问题:
“如果有两个候选人,你怎么看谁更适合做数据岗?”
新人们通常会列出一堆指标:
- 数学基础
- 编程能力
- 沟通表达
- 行业理解
假设我们给出了量化评分:
候选人评分矩阵 C(2 人 × 4 指标):
C =[[8, 9, 6, 7], // 候选人 1[7, 7, 8, 9] // 候选人 2]
团队负责人说:
- 数学和编程更重要,各占权重 0.3
- 沟通与行业理解各占 0.2
权重向量 w(4×1):
w =[[0.3],[0.3],[0.2],[0.2]]
执行 C × w 得到的 2×1 矩阵,就是两个候选人的“综合得分”:
- 候选人 1 综合分 = 8×0.3 + 9×0.3 + 6×0.2 + 7×0.2
- 候选人 2 综合分 = 7×0.3 + 7×0.3 + 8×0.2 + 9×0.2
这其实就是很多企业在做绩效考核、评分排序时背后的计算逻辑,而矩阵只是把这样的逻辑打包成统一工具。
如果换个说法:
- 每一行是“一个对象”的多个特征(一个候选人、一个用户、一家门店)
- 每一列是一种“特征维度”(技能、年龄、收入、偏好)
- 右侧乘一个权重列向量,相当于把多维信息压缩成一个数字,用来比较或决策
这就是机器学习、评分卡、推荐系统里反复用到的套路:多维特征 × 权重 = 一个更有用的新指标。当你在业务报表里看到“综合评分”“信用评分”“消费指数”,背后几乎都能找到这样的矩阵乘法影子。
说到这里,例子还停在“行乘列 × 向量”层面,更多像是在用矩阵做加权平均。但在我参与的几个项目里,改变业务效果的,往往是“大矩阵 × 大矩阵”的那一步。
一个典型场景:电商推荐。让你对“你为什么会看到这个商品”的过程有点更清晰的理解。
用极简化的方式抽象:
- 用户矩阵 U(用户数 × 特征维度),每一行是一个用户的偏好向量
- 商品矩阵 V(特征维度 × 商品数),每一列是一个商品在这些特征上的表现
比如一个非常粗糙的例子:
- 特征维度只有 3 个:爱运动程度、爱美妆程度、爱数码程度
- 用户 A 的偏好是 [0.9, 0.1, 0.8]
- 商品 1(跑鞋)是 [1.0, 0.1, 0.2]
- 商品 2(口红)是 [0.1, 1.0, 0.1]
- 商品 3(耳机)是 [0.3, 0.1, 0.9]
用户偏好列向量 u,商品矩阵 V:
u =[[0.9],[0.1],[0.8]]
V =[[1.0, 0.1, 0.3],[0.1, 1.0, 0.1],[0.2, 0.1, 0.9]]
把商品矩阵转置一下(3×3),计算:
score = uᵀ × V
你会得到一个 1×3 的行向量,每个位置对应一个商品对用户 A 的匹配度:
- 跑鞋的匹配度 = u 和 跑鞋向量做点积
- 口红的匹配度 = u 和 口红向量做点积
- 耳机的匹配度 = u 和 耳机向量做点积
在真实的 2026 年主流推荐引擎里,特征维度不会只有 3,而是动辄几十到几百,矩阵维度常常达到几十万行甚至更多。但本质没有变:用矩阵乘法,把一堆用户和一堆商品的“相似/匹配程度”同时算出来,排序后就变成了你的首页推荐。
更有意思的是,大规模推荐系统性能优化的报告里,技术团队通常会直接写:
- 某某平台将核心矩阵乘法库从旧版本升级,用 GPU 加速,推荐计算延迟从 60ms 降到 18ms
- 某广告投放系统在 2026 年 Q1 将大规模矩阵乘法迁移到自研算子上,单机吞吐提升约 2.1 倍
这些看起来枯燥的数字,在业务侧的翻译是:
- 用户浏览页面不卡顿,更愿意滑下去
- 可以在有限时间内尝试更多 AB 实验,找到转化更高的推荐策略
而推动这一切的,很大一部分就是快速、稳定地把超大矩阵乘起来。
回到你一开始的需求:搜索“矩阵乘法举例”,多半也是为了搞定具体的计算和理解。我们就拿一个稍微“教科书化”,但又比较贴近实际的例子算一遍。
设有一个 2×3 的矩阵 M:
M =[[1, 2, 3],[4, 5, 6]]
和一个 3×2 的矩阵 N:
N =[[7, 8],[9, 10],[11, 12]]
问题:求 M × N。
为了不变成枯燥堆算式,我们换个更贴近场景的理解:
- M 的每一行可以视作“两个不同用户的行为特征”(比如三种行为次数:浏览、收藏、下单)
- N 的每一列可以视作“两种不同权重策略”(比如算法 A、算法 B 对这三种行为的强调程度)
- M × N 的结果,就是在两种策略下,这两个用户各自的“最终评分”
但是算式还是要落地:
结果矩阵 P = M × N,维度是 2×2。每个位置 P[i, j] 的计算规则是:M 的第 i 行 · N 的第 j 列(点积)。
具体展开:
- P[1,1] = 1×7 + 2×9 + 3×11 = 7 + 18 + 33 = 58
- P[1,2] = 1×8 + 2×10 + 3×12 = 8 + 20 + 36 = 64
- P[2,1] = 4×7 + 5×9 + 6×11 = 28 + 45 + 66 = 139
- P[2,2] = 4×8 + 5×10 + 6×12 = 32 + 50 + 72 = 154
所以:
P =[[58, 64],[139, 154]]
不是为了让你背这四个数字,而是要你抓住那个“固定动作”:
- 对某个位置来说,左边取一行,右边取一列
- 对位相乘,再把结果加在一起
- 这就是矩阵乘法的唯一核心动作
当你把这种“行 × 列 → 点积”的模式内化之后,你会发现:
- 每看一个实际业务例子,你都能判断这是不是在做矩阵乘法
- 每遇到一个矩阵乘法题,都能把它拆解回“多次加权求和”的组合
这比死记硬背公式要可靠得多。
在公司里帮新人做学习规划时,我会坚持一个小原则:任何抽象概念,都要绑定三个层次:算得对 → 解释得出 → 用得上。矩阵乘法也一样。
你现在已经接触到:
- 算得对:通过门店销量、评分和那个 2×3 × 3×2 的例子
- 解释得出:知道它实质上是“多维信息加权整合”的工具
- 用得上:在推荐系统、评分模型、营业额计算中的作用
如果你想再走远一点,可以从这三条路径往前推:
在 Excel 或任意表格工具里,亲手做一次“矩阵乘法”
- 把门店销量表和价格表输入表格
- 使用
SUMPRODUCT函数模拟一次矩阵乘法 - 把公式和“行乘列”的概念对应起来,你会更有感觉
选一门你常见的编程语言,跑一次矩阵乘法
- Python 里用
numpy.dot,把刚才的 M 和 N 直接丢进去 - 体会一下“同样的逻辑,用代码能算多大规模”
- Python 里用
留意你身边的“加权求和”场景
- 绩效考核、评分模型、打分排名
- 多维业务指标整合成一个核心指标很多地方都在偷偷用矩阵乘法,只是平时不写成矩阵形式而已。
从一个“矩阵乘法举例”出发,如果你能把这三个层次连起来,后面接触到线性代数、神经网络、推荐算法时,都会轻松很多。
以一个数据从业者的视角,我更愿意这样描述矩阵乘法:
- 它不是某门课的一章,而是一种“把复杂关系统一写成公式”的习惯
- 它不是数学家才会用的工具,而是你在评估、加权、价算、推荐时每天都绕不开的算式
- 它在 2026 年的应用场景,比你能想到的要广:智能推荐、图像识别、NLP、大规模广告投放优化,全都离不开高速矩阵乘法
你今天搜索“矩阵乘法举例”,可能只是为了搞懂一道题、写完一份作业,或者看懂一段代码。但如果能顺带帮你把这个概念从“抽象恐惧”变成“可以解释给别人听”,那这篇文章的使命就完成了。
碰到更多看起来“抽象”的数学概念时,你也可以用同样的方法:
- 找一个足够具体的表格或真实场景
- 把公式拆到“我每天其实就在这么算”这一层
- 再慢慢把它重新写回数学语言
矩阵乘法其实已经在你的工作和生活里,只是过去没人认真拉你看过一遍它的“真面目”。如果这一次你觉得它没那么可怕了,那就够了。