2025-04-01kentxxq 收录于 类别 Journal 2025-04-01 2025-04-02 约 176 字 预计阅读 1 分钟 目录 #折腾ocr 和 llm工作原理ocr 是确定范围, 根据一个个格子根据特征识别.llm 是根据上下文拿到下一个字, 在训练的会更倾向于已有的数据原型和语义ocr 是忠于原型. 图案是什么, 那么就是什么, 不添油加醋llm 的语言翻译, 如果漏掉了一个字, 会自己补上. 声纹也是忠于原型, 声音的波纹是什么样, 不能够添油加醋. 例如 " 我的明白了 “, 不能变成 " 我真的明白了 “. 但是翻译是基于语义的, 所以可以修改