贝叶斯定理:从定义到工程化应用
本文旨在系统介绍贝叶斯定理,从基础定义到数学推导,再到经典应用与多证据连续更新示例,帮助读者理解如何在日常生活与工作中用证据理性更新判断、做出更稳健的决策。
MySQL LEFT JOIN 与 WHERE 条件优化分析(附执行计划解读)
在日常 SQL 优化中,我遇到了一个典型场景:同样的查询语义,不同的 WHERE 条件对性能差异巨大。本文总结分析 MySQL 执行计划背后的原因,并给出经验指导。
出冷汗:生理解释、目的与注意事项
出冷汗并非“发冷”或“感冒剩余症状”的唯一表现,它是机体在不稳定状态下的一种应急反应。本文用最少的文字把机制、目的和日常应对讲清。
Git 提交规范:一套清晰、可落地的团队标准
一致、清晰的提交信息,是提升研发效率最直接的方式。无论团队大小,良好的 Git 提交规范都能带来可追溯、可阅读、可自动化的提交历史。
本文提供一套结构紧凑、可直接推广到团队的 Git 提交规范。
为什么 VS Code 能成为新时代的 IDE 之王?
向量表示语义:从语言到几何的演化史
You shall know a word by the company it keeps.
一个词的意义取决于它经常出现的上下文(语境)
语言的逻辑是代数的,语义的结构是几何的。
—— 现代人工智能思想的核心洞见
向量、导数与偏导:大模型数学直觉入门
向量、导数与偏导构成了大语言模型的数学基础,损失函数与梯度计算则是其核心机制。
向量用于表达语义,损失函数用于衡量模型预测与真实目标的偏差。
对损失函数各参数求偏导,得到梯度,从而揭示最优方向。模型沿梯度不断更新参数,反复迭代,使损失逐步减小、性能持续提升——这正是大模型“学习”的本质过程。
向量、语义与大模型的本质
大模型的核心不是“懂语言”,而是“在向量空间里找到了语言的几何结构”。