百度發布 PP-OCRv6,支援 50 種語言,10M 等級參數對齊百億規模的 VLM

百度的 PaddlePaddle 團隊近期釋出了 PP-OCRv6,一套新的 OCR 系統,提供三個版本:Tiny(1.5M 參數)、Small(7.7M)與 Medium(34.5M)。相較於 PP-OCRv5,Medium 模型在偵測準確率提升 4.6%,在辨識準確率提升 5.1%,同時將中文、英文、日文以及 46 種拉丁字母語言整合到一個統一模型中。

該系統採用結構重參數化技術,以降低運算開銷並提升準確率。在 OpenVINO 最佳化下,Medium 版本的 CPU 推論速度最高可快 5.2 倍。根據官方基準測試,PP-OCRv6 以僅使用數百萬參數的規模,仍能與某些十億參數的視覺-語言模型相匹敵或超越其效能。程式碼已整合進開源的 PaddleOCR 專案。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆