网站地图官方微信:
网站首页 包装检测设备 包装成型机械 折射仪 眼镜片 验钞机 学习机

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 北京日报点名批评“苏超”过度娱乐化,它是否管的太宽了?为什么无良媒体不会被查封取缔? |

    不得不感慨,传统体制内还是有高人啊。 我个人悲观的看法,苏...

    查看详情>>
  • | 有没有一个特别好用的Linux系统? |

  • | 怎么知道女人动了真情? |

  • | PHP现在真的已经过时了吗? |

  • | 如何看待日本小学校园餐只有一小块鸡肉? |

  • | 你卡过最厉害的bug是什么? |

  • | 为什么水泥封不住尸臭? |

  • | 如何评价《凡人修仙传》的主角韩立? |

  • | 为什么面对 Adobe 的版权要求下,vposy 大神还能从容不迫? |

  • | 为什么 macOS 并不差,可市场总敌不过 Windows? |

  • | 为什么Dreamwe***er,FrontPage会被淘汰? |

  • 大家都知道360借条吧?一直挂的是360的品牌,在360集团...

    2025-06-19
  • 终于集齐三大女神。 张靓颖的眼镜,戴与不戴真的是判若两人。...

    2025-06-19
  • 体验过头戴显示的追剧党表示,之前买的VR设备、AR眼镜都不香...

    2025-06-19
  • 好用。 只说缺点: 1,电视模式,switch本机发烫严重...

    2025-06-19

关注我们

添加微信好友,关注最新动态