网站地图官方微信:
网站首页 武安市 芦溪镇 龙王镇 八所镇 支那乡 巴州镇

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 以色列为什么突然敢打伊朗了?不怕被报复? |

    核不扩散条约不是说着玩的。 巴铁,是中美允许的,平衡印度。...

    查看详情>>
  • | MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响? |

  • | 美国曾不顾劝阻,为了完善近地轨道 卫星通讯,曾向太空发射4.3亿根铜针,如今现状如何? |

  • | 目前最具性价比的全栈路线是啥? |

  • | 是什么原因导致HDR无法推行? |

  • | 都2024年了,Golang还是不温不火吗?Go究竟能干什么? |

  • | 胸大的女孩子有什么烦恼? |

  • | 伊朗这次会崩溃灭亡吗? |

  • | 有一个超级漂亮的女朋友是一种什么体验? |

  • | 如何评价B站up主***千代退网? |

  • | 鸿蒙电脑会在国内逐渐取代windows电脑吗? |

  • 理论方面我不太了解,我认为是肌肉力量的关系。 比如你做引体...

    2025-06-23
  • SongGeneration 是腾讯 AI Lab开源的音乐...

    2025-06-23
  • 将今年hdc分论坛录像过了过之后的总结。 手机侧 1. 全...

    2025-06-23
  • 你怕是对内存有什么误解? 哪怕是30年前,哪怕速度不及固态零...

    2025-06-23

关注我们

添加微信好友,关注最新动态