我是数据分析顾问宁川,日常工作就是帮企业把一堆看不完的表格、报表和日志,变成老板能听得懂的“一句话结论”。有一个知识点出场频率极高,却又让很多人心里一紧——矩阵乘法。{image}很多人学高数时被它“伤害”过:符号堆满黑板、例题抽象到怀疑人生,等到真的在工作里遇到时,只剩一个念头:我到底要不要会这个东西?

如果你点进来,是因为搜索“矩阵乘法举例”,说明你大概率正处在这种尴尬状态:

  • 知道它很重要,却对公式没有任何亲切感
  • 只记得“行乘列”,但遇到稍微复杂一点点的例子就乱套
  • 模糊听说它和推荐系统、神经网络、Excel运算有关,却连不上实际场景

这一篇,我不准备给你扔一堆抽象定义,而是用真实业务场景 + 具体数字例子 + 最少的公式,把矩阵乘法说清楚。看完你应该可以做到三件事:

  1. 看到一道矩阵乘法题,不再慌,可以自己拆开理解
  2. 明白为什么各行各业都在用矩阵乘法,而不是“老师说重要”这种理由
  3. 知道下一步要怎么学,而不是停留在“看过但记不住”

从一张“销量表”开始,矩阵乘法到底在算什么

先不谈矩阵,先看一张普通得不能再普通的小表。一家连锁咖啡店,卖三种饮品:拿铁、美式、抹茶拿铁。4 月份三家门店的销量如下(单位:杯):

  • 门店 A:拿铁 100, 美式 80, 抹茶 60
  • 门店 B:拿铁 90, 美式 70, 抹茶 50
  • 门店 C:拿铁 120, 美式 60, 抹茶 40

用矩阵写,就是一个 3×3 的矩阵 A(3 家门店 × 3 种产品):

A =[[100, 80, 60],[90, 70, 50],[120, 60, 40]]

再看价格表:

  • 拿铁 25 元 / 杯
  • 美式 20 元 / 杯
  • 抹茶拿铁 28 元 / 杯

价格向量可以写成一个 3×1 的矩阵 p:

p =[[25],[20],[28]]

现在问题来了:想算每家门店当天营业额,用矩阵乘法能怎么做?

A 是 3×3,p 是 3×1,可以做乘法,结果会是 3×1。算法就是那句被反复念叨的“行乘列”:

  • 门店 A 的营业额 = 100×25 + 80×20 + 60×28
  • 门店 B 的营业额 = 90×25 + 70×20 + 50×28
  • 门店 C 的营业额 = 120×25 + 60×20 + 40×28

你在纸上算的是三条“加权求和”的式子,在矩阵的语言里,就是:

Revenue = A × p

注意一个细节:

  • A 的每一行,代表“一个门店对三种产品的销量组合”
  • p 的这一列,代表“产品价格的组合”
  • 相乘得到的一行(这里其实是一行一个数),代表“一个门店在这个价格组合下的收入”

矩阵乘法的本质,并不是为了让你背一个算式,而是把一堆“加权求和”的重复动作集中到一个统一的写法里。

你可能已经隐约感觉到了:

  • 如果门店变成 300 家、产品变成 50 种,手算完全不现实
  • 用矩阵表达后,只要 A 和 p 一丢进程序,几百家门店的营业额一次性就算完

这就是矩阵乘法在企业数据分析里的真实用法,而不是教科书上的“抽象运算”。


“行乘列”的另一层含义:把多个指标压缩成一个“有用结果”

在公司给新人做内部培训时,我经常会问一个小问题:

“如果有两个候选人,你怎么看谁更适合做数据岗?”

新人们通常会列出一堆指标:

  • 数学基础
  • 编程能力
  • 沟通表达
  • 行业理解

假设我们给出了量化评分:

候选人评分矩阵 C(2 人 × 4 指标):

C =[[8, 9, 6, 7], // 候选人 1[7, 7, 8, 9] // 候选人 2]

团队负责人说:

  • 数学和编程更重要,各占权重 0.3
  • 沟通与行业理解各占 0.2

权重向量 w(4×1):

w =[[0.3],[0.3],[0.2],[0.2]]

执行 C × w 得到的 2×1 矩阵,就是两个候选人的“综合得分”:

  • 候选人 1 综合分 = 8×0.3 + 9×0.3 + 6×0.2 + 7×0.2
  • 候选人 2 综合分 = 7×0.3 + 7×0.3 + 8×0.2 + 9×0.2

这其实就是很多企业在做绩效考核、评分排序时背后的计算逻辑,而矩阵只是把这样的逻辑打包成统一工具。

如果换个说法:

  • 每一行是“一个对象”的多个特征(一个候选人、一个用户、一家门店)
  • 每一列是一种“特征维度”(技能、年龄、收入、偏好)
  • 右侧乘一个权重列向量,相当于把多维信息压缩成一个数字,用来比较或决策

这就是机器学习、评分卡、推荐系统里反复用到的套路:多维特征 × 权重 = 一个更有用的新指标。当你在业务报表里看到“综合评分”“信用评分”“消费指数”,背后几乎都能找到这样的矩阵乘法影子。


真正改变行业运行方式的,是“大矩阵乘以大矩阵”

说到这里,例子还停在“行乘列 × 向量”层面,更多像是在用矩阵做加权平均。但在我参与的几个项目里,改变业务效果的,往往是“大矩阵 × 大矩阵”的那一步。

一个典型场景:电商推荐。让你对“你为什么会看到这个商品”的过程有点更清晰的理解。

用极简化的方式抽象:

  • 用户矩阵 U(用户数 × 特征维度),每一行是一个用户的偏好向量
  • 商品矩阵 V(特征维度 × 商品数),每一列是一个商品在这些特征上的表现

比如一个非常粗糙的例子:

  • 特征维度只有 3 个:爱运动程度、爱美妆程度、爱数码程度
  • 用户 A 的偏好是 [0.9, 0.1, 0.8]
  • 商品 1(跑鞋)是 [1.0, 0.1, 0.2]
  • 商品 2(口红)是 [0.1, 1.0, 0.1]
  • 商品 3(耳机)是 [0.3, 0.1, 0.9]

用户偏好列向量 u,商品矩阵 V:

u =[[0.9],[0.1],[0.8]]

V =[[1.0, 0.1, 0.3],[0.1, 1.0, 0.1],[0.2, 0.1, 0.9]]

把商品矩阵转置一下(3×3),计算:

score = uᵀ × V

你会得到一个 1×3 的行向量,每个位置对应一个商品对用户 A 的匹配度:

  • 跑鞋的匹配度 = u 和 跑鞋向量做点积
  • 口红的匹配度 = u 和 口红向量做点积
  • 耳机的匹配度 = u 和 耳机向量做点积

在真实的 2026 年主流推荐引擎里,特征维度不会只有 3,而是动辄几十到几百,矩阵维度常常达到几十万行甚至更多。但本质没有变:用矩阵乘法,把一堆用户和一堆商品的“相似/匹配程度”同时算出来,排序后就变成了你的首页推荐。

更有意思的是,大规模推荐系统性能优化的报告里,技术团队通常会直接写:

  • 某某平台将核心矩阵乘法库从旧版本升级,用 GPU 加速,推荐计算延迟从 60ms 降到 18ms
  • 某广告投放系统在 2026 年 Q1 将大规模矩阵乘法迁移到自研算子上,单机吞吐提升约 2.1 倍

这些看起来枯燥的数字,在业务侧的翻译是:

  • 用户浏览页面不卡顿,更愿意滑下去
  • 可以在有限时间内尝试更多 AB 实验,找到转化更高的推荐策略

而推动这一切的,很大一部分就是快速、稳定地把超大矩阵乘起来。


在纸上算清一个例题,让概念从“耳熟”变“手熟”

回到你一开始的需求:搜索“矩阵乘法举例”,多半也是为了搞定具体的计算和理解。我们就拿一个稍微“教科书化”,但又比较贴近实际的例子算一遍。

设有一个 2×3 的矩阵 M:

M =[[1, 2, 3],[4, 5, 6]]

和一个 3×2 的矩阵 N:

N =[[7, 8],[9, 10],[11, 12]]

问题:求 M × N。

为了不变成枯燥堆算式,我们换个更贴近场景的理解:

  • M 的每一行可以视作“两个不同用户的行为特征”(比如三种行为次数:浏览、收藏、下单)
  • N 的每一列可以视作“两种不同权重策略”(比如算法 A、算法 B 对这三种行为的强调程度)
  • M × N 的结果,就是在两种策略下,这两个用户各自的“最终评分”

但是算式还是要落地:

结果矩阵 P = M × N,维度是 2×2。每个位置 P[i, j] 的计算规则是:M 的第 i 行 · N 的第 j 列(点积)。

具体展开:

  • P[1,1] = 1×7 + 2×9 + 3×11 = 7 + 18 + 33 = 58
  • P[1,2] = 1×8 + 2×10 + 3×12 = 8 + 20 + 36 = 64
  • P[2,1] = 4×7 + 5×9 + 6×11 = 28 + 45 + 66 = 139
  • P[2,2] = 4×8 + 5×10 + 6×12 = 32 + 50 + 72 = 154

所以:

P =[[58, 64],[139, 154]]

不是为了让你背这四个数字,而是要你抓住那个“固定动作”:

  1. 对某个位置来说,左边取一行,右边取一列
  2. 对位相乘,再把结果加在一起
  3. 这就是矩阵乘法的唯一核心动作

当你把这种“行 × 列 → 点积”的模式内化之后,你会发现:

  • 每看一个实际业务例子,你都能判断这是不是在做矩阵乘法
  • 每遇到一个矩阵乘法题,都能把它拆解回“多次加权求和”的组合

这比死记硬背公式要可靠得多。


如何继续学下去,而不是只停在“懂一个矩阵乘法举例”

在公司里帮新人做学习规划时,我会坚持一个小原则:任何抽象概念,都要绑定三个层次:算得对 → 解释得出 → 用得上。矩阵乘法也一样。

你现在已经接触到:

  • 算得对:通过门店销量、评分和那个 2×3 × 3×2 的例子
  • 解释得出:知道它实质上是“多维信息加权整合”的工具
  • 用得上:在推荐系统、评分模型、营业额计算中的作用

如果你想再走远一点,可以从这三条路径往前推:

  1. 在 Excel 或任意表格工具里,亲手做一次“矩阵乘法”

    • 把门店销量表和价格表输入表格
    • 使用 SUMPRODUCT 函数模拟一次矩阵乘法
    • 把公式和“行乘列”的概念对应起来,你会更有感觉
  2. 选一门你常见的编程语言,跑一次矩阵乘法

    • Python 里用 numpy.dot,把刚才的 M 和 N 直接丢进去
    • 体会一下“同样的逻辑,用代码能算多大规模”
  3. 留意你身边的“加权求和”场景

    • 绩效考核、评分模型、打分排名
    • 多维业务指标整合成一个核心指标很多地方都在偷偷用矩阵乘法,只是平时不写成矩阵形式而已。

从一个“矩阵乘法举例”出发,如果你能把这三个层次连起来,后面接触到线性代数、神经网络、推荐算法时,都会轻松很多。


收个尾:矩阵乘法没那么“高冷”,它只是你熟悉但没命名的套路

以一个数据从业者的视角,我更愿意这样描述矩阵乘法:

  • 它不是某门课的一章,而是一种“把复杂关系统一写成公式”的习惯
  • 它不是数学家才会用的工具,而是你在评估、加权、价算、推荐时每天都绕不开的算式
  • 它在 2026 年的应用场景,比你能想到的要广:智能推荐、图像识别、NLP、大规模广告投放优化,全都离不开高速矩阵乘法

你今天搜索“矩阵乘法举例”,可能只是为了搞懂一道题、写完一份作业,或者看懂一段代码。但如果能顺带帮你把这个概念从“抽象恐惧”变成“可以解释给别人听”,那这篇文章的使命就完成了。

碰到更多看起来“抽象”的数学概念时,你也可以用同样的方法:

  • 找一个足够具体的表格或真实场景
  • 把公式拆到“我每天其实就在这么算”这一层
  • 再慢慢把它重新写回数学语言

矩阵乘法其实已经在你的工作和生活里,只是过去没人认真拉你看过一遍它的“真面目”。如果这一次你觉得它没那么可怕了,那就够了。