目录

2025-04-01

目录

#折腾

  • ocr 和 llm
    • 工作原理
      • ocr 是确定范围, 根据一个个格子根据特征识别.
      • llm 是根据上下文拿到下一个字, 在训练的会更倾向于已有的数据
    • 原型和语义
      • ocr 是忠于原型. 图案是什么, 那么就是什么, 不添油加醋
      • llm 的语言翻译, 如果漏掉了一个字, 会自己补上. 声纹也是忠于原型, 声音的波纹是什么样, 不能够添油加醋. 例如 " 我的明白了 “, 不能变成 " 我真的明白了 “. 但是翻译是基于语义的, 所以可以修改