CER – klaidingų simbolių norma (angl. Character Error Rate).
Tai matas, vertinantis teksto atpažinimo (pvz., kalbos ar rankraščio) tikslumą, palyginant su etalonu.
Skaičiavimas:
`CER = (Pakeitimai + Įterpimai + Išbraukimai) / bendras simbolių skaičius etalone`
- Pakeitimai: neteisingi simboliai.
- Įterpimai: pertekliniai simboliai.
- Išbraukimai: praleisti simboliai.
Pavyzdys:
- Etalonas: `"labas rytas"`
- Atpažintas tekstas: `"labs rytas"`
- Klaidos: 1 pakeitimas (`b` → `s`).
- CER = 1 / 11 ≈ 0,091 (9,1%).
Naudojimas:
OCR, kalbos atpažinimas, vertinant automatizuoto teksto generavimą.
Jūsų pataisymai bus išsiųsti moderatorių peržiūrai, jei informacija tikslesnė/taisyklingesnė
ji bus patalpinta vietoj esamos.