文本檢測(cè)和識(shí)別技術(shù)處于一個(gè)學(xué)科交叉點(diǎn),其技術(shù)演進(jìn)不斷受益于計(jì)算機(jī)視覺(jué)處理和自然語(yǔ)言處理兩個(gè)領(lǐng)域的技術(shù)進(jìn)步。 它既需要使用視覺(jué)處理技術(shù)來(lái)提取圖像中文字區(qū)域的圖像特征向量,又需要借助自然語(yǔ)言處理技術(shù)來(lái)解碼圖像特征向量為文字結(jié)果。 從公開(kāi)論文中可以看到,起源于圖像分類、檢測(cè)、語(yǔ)義分割等視覺(jué)處理任務(wù)的各個(gè)基礎(chǔ)網(wǎng)絡(luò)(backbone network),紛紛被征用來(lái)提取圖像中文字區(qū)域的特征向量。