目录

2025-04-01

kentxxq 收录于类别 Journal

2025-04-01 2025-04-02 约 176 字预计阅读 1 分钟

目录

#折腾

ocr 和 llm
- 工作原理
  - ocr 是确定范围, 根据一个个格子根据特征识别.
  - llm 是根据上下文拿到下一个字, 在训练的会更倾向于已有的数据
- 原型和语义
  - ocr 是忠于原型. 图案是什么, 那么就是什么, 不添油加醋
  - llm 的语言翻译, 如果漏掉了一个字, 会自己补上. 声纹也是忠于原型, 声音的波纹是什么样, 不能够添油加醋. 例如 " 我的明白了 “, 不能变成 " 我真的明白了 “. 但是翻译是基于语义的, 所以可以修改